html5 - python 处理html页面爬虫数据

Question

请求的url 数据http://www.hkex.com.hk/chi/st...对了我只抓取一张表，希望能够提取关键表的数据. 希望抓取的数据是该成交报表，但是HTML 的标签都是&lt;pre&gt;造成了数据提取的困难。 {代码...} 代號 股票名稱 ...

ringa_lee · Answer

해결책 1:

먼저 공매도 거래량 위치 a = Soup.find('a', attrs={'name':'short_판매'})를 찾은 다음 pre-> 글꼴 6줄 미만이면 끝납니다

으아아아

으아아아

黄舟 · Answer

계획을 하나 알려드리겠습니다.

으아아아

阿神 · Answer

사용이 왜 이렇게 귀찮나요beautifulsoup 왜 소칼로 닭을 죽이나요

귀하의 웹페이지에는 한 행의 데이터만 있고 형식이 이보다 더 간단할 수 없습니다.

페이지에 있는 데이터를 복사해서 txt로 저장한 뒤 readline, split, 정규식을 이용해 데이터를 추출하면 됩니다