首頁  >  文章  >  後端開發  >  Python3+BeautifulSoup4的安裝實例教程

Python3+BeautifulSoup4的安裝實例教程

零下一度
零下一度原創
2017-06-27 09:53:354953瀏覽

用正規表示式來提取網頁中的內容是相當麻煩的,這裡介紹一個可以從HTML或XML文件中提取資料的Python庫:Beautiful Soup.它能夠透過你喜歡的轉換器實現慣用的文檔導航,查找,修改文件的方式.Beautiful Soup會幫你節省數小時甚至數天的工作時間.Beautiful Soup 4.2.0 文檔

具體運用在官方文檔中已經講述的很清楚了,這裡就不再贅述。說一下我安裝時遇到的問題。

 

1.安裝python3
官網下載並安裝python3,加入Path變量,把安裝好的python.exe重命名為python3.exe

#2.安裝pip3
輸入:>pip3
問題提示:Fatal error in launcher: Unable to create process using '"'
輸入:>python3 -m pip install --upgrade pip
問題提示:Requirement already up-to-date: pip in c:\users\****\appdata\local\programs\python\python36-32\lib\site-packages
輸入:>python3 -m pip install --upgrade pip --force-reinstall  

輸出:

#輸入:>pip3 -V

輸出:pip 9.0. 1 from c:\users\****\appdata\local\programs\python\python36-32\lib\site-packages (python 3.6)

pip3安裝完成

#3.安裝BeautifulSoup4

>pip3 install beautifulsoup4

如果要用源碼安裝,下載BS4的源碼,然後透過setup.py來安裝,

將下載的壓縮包解壓縮到本地,用指令轉換成Python3程式碼:

進入Python的安裝目錄下的\Tools\scripts,裡面有2to3.py,用指令轉換

\Python36-32\Tools\ scripts>python 2to3.py -w C:\Users\****\AppData\Local\Programs\Python\Python36-32\beautifulsoup4-4.6.0

用指令提示字元進入到BS4的解壓縮的目錄,開始安裝:

>python setup.py install

4.安裝解析器:

>pip3 install lxml

> pip3 install html5lib

安裝完成囉!可以開始測試了。

現在網路上有大量的BeautifulSoup3和Python2的程式碼,對照給的demo測試時會出現各種問題。建議學習新內容的時候直接參考官方文件。

 

以上是Python3+BeautifulSoup4的安裝實例教程的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn