RSS
在算法推荐主导信息获取、信息茧房愈演愈烈的当下,我们看似拥有海量资讯,却逐渐失去了主动选择信息的权利。而诞生于互联网早期的 RSS(Really Simple Syndication,简易信息聚合),凭借其去中心化、无算法干预、高效聚合的特性,成为越来越多人跳出茧房、高效获取精准信息的选择。这款曾被认为 “过时” 的技术,在信息过载的时代重新焕发生机,不仅是专业人士的知识管理工具,更成为普通用户对抗信息冗余的有效方式。
使用
查找订阅源
网站自带RSS
RSSHub Radar拓展,可以获得网站可用的RSS源

使用订阅源
FreshRSS阅读器
自制订阅源
有时我们会发现
爬虫
网络爬虫,是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。但是当网络爬虫被滥用后,互联网上就出现太多同质的东西,原创得不到保护。于是,很多网站开始反网络爬虫,想方设法保护自己的内容。
Selenium
服务器
服务器后台处理
RSS阅读器 Fluent Reader:https://github.com/yang991178/fluent-reader
RSS阅读器手机版 :https://github.com/yang991178/fluent-reader-lite
RSShub国内镜像:https://rsshub.netlify.app/
CPU
rssweball
加载网页
这一步很关键,能后加载网页内容的才能生成RSS
否则可能是网页需登录或反爬虫限制
定义规则
找到重复项,把网页元素写到一行上
似乎不能分行,会失败
定义输出格式
Selenium
模拟真人操作电脑浏览器进行网页访问,这种情况可以在你首次登录后,下次开启浏览器访问网站时,可以直接进入网页内容(而不用验证登录身份)
1 | //使用备份的用户数据目录 |