Rumah >pembangunan bahagian belakang >Tutorial Python >Python3+BeautifulSoup4的安装实例教程

Python3+BeautifulSoup4的安装实例教程

零下一度asal: 2017-06-27 09:53:355080semak imbas

用正则表达式来提取网页中的内容是相当麻烦的，这里介绍一个可以从HTML或XML文件中提取数据的Python库：Beautiful Soup.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.Beautiful Soup 4.2.0 文档

具体运用在官方文档中已经讲述的很清楚了，这里就不再赘述。说一下我安装时遇到的问题吧。

1.安装python3
官网下载并安装python3，加入Path变量，把安装好的python.exe重命名为python3.exe

2.安装pip3
输入：>pip3
问题提示：Fatal error in launcher: Unable to create process using '"'
输入：>python3 -m pip install --upgrade pip
问题提示：Requirement already up-to-date: pip in c:\users\****\appdata\local\programs\python\python36-32\lib\site-packages
输入：>python3 -m pip install --upgrade pip --force-reinstall

输出：

输入：>pip3 -V

输出：pip 9.0.1 from c:\users\****\appdata\local\programs\python\python36-32\lib\site-packages (python 3.6)

pip3安装完成

3.安装BeautifulSoup4

>pip3 install beautifulsoup4

如果要用源码安装，下载BS4的源码 ,然后通过setup.py来安装，

将下载的压缩包解压到本地，用命令转换成Python3代码：

进入Python的安装目录下的\Tools\scripts，里面有2to3.py，用命令转换

\Python36-32\Tools\scripts>python 2to3.py -w C:\Users\****\AppData\Local\Programs\Python\Python36-32\beautifulsoup4-4.6.0

用命令提示符进入到BS4的解压的目录，开始安装：

>python setup.py install

4.安装解析器：

>pip3 install lxml

>pip3 install html5lib

安装完成啦！可以开始测试了。

现在网上有大量的BeautifulSoup3和Python2的代码，对照给出的demo测试时会出现各种问题。建议学习新内容的时候直接参考官方文档。

Atas ialah kandungan terperinci Python3+BeautifulSoup4的安装实例教程. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：Django介绍之分页实例Artikel seterusnya：flask 分页的详细介绍

Artikel berkaitan

Lihat lagi