编写爬虫程序时最痛苦的就是需要一个个网站的写解析程序,感觉完全是体力活,有没有办法根据关注字自动生成xpath,比如抓取物流方面的信息根据车长,车型,出发地,目的地自动生成相应的元素的xpath,有没类似的论文或者github项目
大家讲道理2017-04-17 16:49:07
論文について言及したので、お勧めします (読んでも役に立ちませんが): Web データ抽出、アプリケーション、および技術: 調査
過去数年間の構造化データと半構造化データの概要と紹介研究の分類と基本的な考え方を抽出しました。この論文は、関連する研究を読むための索引として使用できます。