html5 - python 处理html页面爬虫数据

Question

请求的url 数据http://www.hkex.com.hk/chi/st...对了我只抓取一张表，希望能够提取关键表的数据. 希望抓取的数据是该成交报表，但是HTML 的标签都是&lt;pre&gt;造成了数据提取的困难。 {代码...} 代號 股票名稱 ...

ringa_lee · Answer

解決策 1:

まず、空売りボリュームの位置を見つけます a =Soup.find('a', attrs={'name':'short_ Selling'})、次に pre->font の隣接関係に基づいて、一番下まで進みます。コラムまで 6行以内で終わります

リーリー

リーリー

黄舟 · Answer

計画を立てさせてください。

リーリー

阿神 · Answer

なぜわざわざ beautysoup を使うのですか?牛のナイフで鶏を殺すことはできませんbeautifulsoup，杀鸡焉用牛刀

你的网页只有一行行数据啊，格式简单的不能再简单

你直接把页面上的数据复制下来，保存成txt，然后用readline、split

ウェブページにはデータが 1 行しかなく、フォーマットはこれ以上に単純ではありません🎜 🎜 ページ上のデータを直接コピーし、txt として保存し、readline、split、または正規表現を使用してデータを抽出できます。データはわかりました🎜