任意网站制作Rss的方法
方法一:利用feed43.com生产Rss
feed43.com是一个非常简便的生成rss的网站,按步骤解析出来源代码后,找到重复部分,只需要提取关键的包括标题,链接,内容等的段落,放到解析模板里,用 {%}
代替链接,名称等,开始解析,解析出来一些首页的内容。
下一步到输出模板里填写带数字的解析出来的 {%} ,预览一下,即可。
然后用rss工具的全文工具,就可获取rss。
方法二:Huginn
由于Huginn可以自己搭建,以防服务提供商跑路,对自带搭建用户更加友好。比起方法一来稍微复杂一点。
创建获取rss的agent
创建agent,类型选择
信息填写
主要是名称,更新频率等,没有特殊要求的其他的也可以保持默认。关键内容是在options里。
填写选项内容。在选项中就是我们填写抓取规则的地方了。
1. url填入需要解析的页面,例如:www.dlkoo.cc
2. type表示格式,可以有html, xml, json, text多种格式
3. mode表示信息的输出处理方式,“on_change”表示仅输出下面的内容,”merge”表示新内容和输入的agent内容合并。
4. extract是我们要提取的信息。
提取信息有多种方式,推荐xpath方案,简单快捷。右键点击一个更新的内容,选择检查,找到弹出面板中对应的内容,右键复制xpath。然后借助xpath helper插件,尝试替换或者删除所复制内容的链接中的变量,如果能够获列表的话,这就是我们需要的xpath值。由于我们只需要抓取标题了链接,只需要填写如下:
value填写参照上一步中,检查内容里面进行填写。dry run,如果正常获取即可保存。
创建输出Rss的agent
创建一个新的agent,类型选择Data Output Agent,Sources中填入第二步的Agent名称。在选项中填入你的RSS的标题、描述、链接等信息,同时在Item中填写标题、描述、链接等,即输出RSS全文的标题、内容与链接地址等等。
保存之后就能看到rss的订阅地址。放到rss订阅器里即可使用。