ホームページ  >  に質問  >  本文

java - 编写爬虫程序时有没有办法智能的将非结构化数据结构化,根据关键字自动生成xpath解析页面?

编写爬虫程序时最痛苦的就是需要一个个网站的写解析程序,感觉完全是体力活,有没有办法根据关注字自动生成xpath,比如抓取物流方面的信息根据车长,车型,出发地,目的地自动生成相应的元素的xpath,有没类似的论文或者github项目

阿神阿神2717日前349

全員に返信(1)返信します

  • 大家讲道理

    大家讲道理2017-04-17 16:49:07

    論文について言及したので、お勧めします (読んでも役に立ちませんが): Web データ抽出、アプリケーション、および技術: 調査
    過去数年間の構造化データと半構造化データの概要と紹介研究の分類と基本的な考え方を抽出しました。この論文は、関連する研究を読むための索引として使用できます。

    返事
    0
  • キャンセル返事