任意网站制作Rss的方法

方法一:利用feed43.com生产Rss

feed43.com是一个非常简便的生成rss的网站,按步骤解析出来源代码后,找到重复部分,只需要提取关键的包括标题,链接,内容等的段落,放到解析模板里,用 {%}  代替链接,名称等,开始解析,解析出来一些首页的内容。

下一步到输出模板里填写带数字的解析出来的 {%}  ,预览一下,即可。

然后用rss工具的全文工具,就可获取rss。

方法二:Huginn

由于Huginn可以自己搭建,以防服务提供商跑路,对自带搭建用户更加友好。比起方法一来稍微复杂一点。

创建获取rss的agent

创建agent,类型选择

信息填写

主要是名称,更新频率等,没有特殊要求的其他的也可以保持默认。关键内容是在options里。

填写选项内容。在选项中就是我们填写抓取规则的地方了。

1.  url填入需要解析的页面,例如:www.dlkoo.cc
2.  type表示格式,可以有html, xml, json, text多种格式
3.  mode表示信息的输出处理方式,“on_change”表示仅输出下面的内容,”merge”表示新内容和输入的agent内容合并。
4.  extract是我们要提取的信息。
提取信息有多种方式,推荐xpath方案,简单快捷。右键点击一个更新的内容,选择检查,找到弹出面板中对应的内容,右键复制xpath。然后借助xpath helper插件,尝试替换或者删除所复制内容的链接中的变量,如果能够获列表的话,这就是我们需要的xpath值。由于我们只需要抓取标题了链接,只需要填写如下:

value填写参照上一步中,检查内容里面进行填写。dry run,如果正常获取即可保存。

创建输出Rss的agent

创建一个新的agent,类型选择Data Output Agent,Sources中填入第二步的Agent名称。在选项中填入你的RSS的标题、描述、链接等信息,同时在Item中填写标题、描述、链接等,即输出RSS全文的标题、内容与链接地址等等。

保存之后就能看到rss的订阅地址。放到rss订阅器里即可使用。