周末,我正在浏览 30 分钟内完成的项目创意,以便快速复习,并偶然发现了 codementor.io
那么,RSS Feed 到底是什么?
RSS 代表“真正简单的聚合”——它是一种通过 XML 文件访问网站元数据的方法。
例如,Medium 上有大量的文章和出版物,将所有带有摘要的链接都放在一个页面上不是很方便吗?
答案是——RSS 源!这些在几年前非常流行,但现在已经不再使用,但是网站仍然支持您创建自己的 RSS 提要。
最近我开始阅读 Intermezzo,并想在 Medium 上阅读有关它的评论和最新更新,然后我想也许我可以为此创建一个 RSS feed?
嗯,快速搜索帮助我发现 Medium 确实支持通过其端点使用该特定元数据上的 Medium XML 元数据创建 RSS 提要。
您可以在这里找到它 - https://help.medium.com/hc/en-us/articles/214874118-Using-RSS-feeds-of-profiles-publications-and-topics
我使用库 feedparser 编写了一个快速的 Python 代码 - 它在内部解析 XML 文件以获取所需的元数据。如果您也想自己解析元数据,我也对 BeautifulSoup 做了同样的事情。
您可以在此处查看 feedparser 的文档 — https://feedparser.readthedocs.io/en/latest/
我使用以下代码解析并检索媒体元数据 -
parsed_feed = feedparser.parse(url) for article in parsed_feed["entries"]: response_article.append({ "Title": article["title"], "Description": html2text.html2text(article["summary"]), "Author": article["author"], "Date Published": article["published"], "Last Updated": article["updated"] })
为了使其更加用户友好,我创建了一个快速的 Python 类,并让用户输入应从中接收元数据的 URL,您可以在 Carbon 或 Github 上找到完整代码的链接:
Github:https://github.com/harmankaler2000/RSS_Feeder
碳:https://carbon.now.sh/mHN9yVFtZZmkopLHFEe3
我很乐意与您联系并讨论更多有关 python 的内容,请随时发表评论,我们可以聊天!
以上是为任何中型线程创建 RSS 源!的详细内容。更多信息请关注PHP中文网其他相关文章!