用python處理MS Word的實例-php教程-PHP中文網

首頁

後端開發

php教程

用python處理MS Word的實例

不言

May 08, 2018 pm 02:10 PM

pythonword實例

這篇文章主要介紹了關於用python處理MS Word的實例，有著一定的參考價值，現在分享給大家，有需要的朋友可以參考一下

使用python工具讀寫MS Word文件（docx與doc檔案），主要利用了python-docx套件。本文給一些常用的操作，並完成一個範例，幫助大家快速著手。

安裝

pyhton處理docx檔案需要使用python-docx 包，可以利用pip工具很方便的安裝，pip工具在python安裝路徑下的Scripts資料夾中

pip install python-docx

當然你也可以選擇使用easy_install或手動方式進行安裝

寫入檔案內容

這裡我們直接給出一個範例，根據自己的需求摘取有用的內容

#coding=utf-8
from docx import Document
from docx.shared import Pt
from docx.shared import Inches
from docx.oxml.ns import qn
#打开文档
document = Document()
#加入不同等级的标题
document.add_heading(u&#39;MS WORD写入测试&#39;,0)
document.add_heading(u&#39;一级标题&#39;,1)
document.add_heading(u&#39;二级标题&#39;,2)
#添加文本
paragraph = document.add_paragraph(u&#39;我们在做文本测试！&#39;)
#设置字号
run = paragraph.add_run(u&#39;设置字号、&#39;)
run.font.size = Pt(24)
#设置字体
run = paragraph.add_run(&#39;Set Font,&#39;)
run.font.name = &#39;Consolas&#39;
#设置中文字体
run = paragraph.add_run(u&#39;设置中文字体、&#39;)
run.font.name=u&#39;宋体&#39;
r = run._element
r.rPr.rFonts.set(qn(&#39;w:eastAsia&#39;), u&#39;宋体&#39;)
#设置斜体
run = paragraph.add_run(u&#39;斜体、&#39;)
run.italic = True
#设置粗体
run = paragraph.add_run(u&#39;粗体&#39;).bold = True
#增加引用
document.add_paragraph(&#39;Intense quote&#39;, style=&#39;Intense Quote&#39;)
#增加无序列表
document.add_paragraph(
 u&#39;无序列表元素1&#39;, style=&#39;List Bullet&#39;
)
document.add_paragraph(
 u&#39;无序列表元素2&#39;, style=&#39;List Bullet&#39;
)
#增加有序列表
document.add_paragraph(
 u&#39;有序列表元素1&#39;, style=&#39;List Number&#39;
)
document.add_paragraph(
 u&#39;有序列表元素2&#39;, style=&#39;List Number&#39;
)
#增加图像（此处用到图像image.bmp，请自行添加脚本所在目录中）
document.add_picture(&#39;image.bmp&#39;, width=Inches(1.25))
#增加表格
table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = &#39;Name&#39;
hdr_cells[1].text = &#39;Id&#39;
hdr_cells[2].text = &#39;Desc&#39;
#再增加3行表格元素
for i in xrange(3):
 row_cells = table.add_row().cells
 row_cells[0].text = &#39;test&#39;+str(i)
 row_cells[1].text = str(i)
 row_cells[2].text = &#39;desc&#39;+str(i)
#增加分页
document.add_page_break()
#保存文件
document.save(u&#39;测试.docx&#39;)

該段程式碼產生的文件樣式如下

# 註：有一個問題沒找到如何解決，也就是如何設定邊框線。如果您知道，也請能夠指教。

讀取檔案內容

#coding=utf-8
from docx import Document
#打开文档
document = Document(u&#39;测试.docx&#39;)
#读取每段资料
l = [ paragraph.text.encode(&#39;gb2312&#39;) for paragraph in document.paragraphs];
#输出并观察结果，也可以通过其他手段处理文本即可
for i in l:
 print i
#读取表格材料，并输出结果
tables = [table for table in document.tables];
for table in tables:
 for row in table.rows:
  for cell in row.cells:
   print cell.text.encode(&#39;gb2312&#39;),&#39;\t&#39;,
  print
 print &#39;\n&#39;

我們仍然使用剛才我們產生的文件，可以看到，輸出的結果為

注意：這裡我們使用gb2312編碼方式讀取，主要是保證中文的讀寫正確。一般情況下，使用的utf-8編碼方式。另外，python-docx主要處理docx文件，在載入doc文件時，會出現問題，如果有大量doc文件，建議先將doc文件批量轉換為docx文件，例如利用工具doc2doc

相關推薦：

python處理Excel xlrd的方法介紹

#Python處理csv檔案實例詳解

以上是用python處理MS Word的實例的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

PHP和Python：解釋了不同的範例Apr 18, 2025 am 12:26 AM

PHP主要是過程式編程，但也支持面向對象編程（OOP）；Python支持多種範式，包括OOP、函數式和過程式編程。 PHP適合web開發，Python適用於多種應用，如數據分析和機器學習。

PHP和Python：深入了解他們的歷史Apr 18, 2025 am 12:25 AM

PHP起源於1994年，由RasmusLerdorf開發，最初用於跟踪網站訪問者，逐漸演變為服務器端腳本語言，廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發，1991年首次發布，強調代碼可讀性和簡潔性，適用於科學計算、數據分析等領域。

在PHP和Python之間進行選擇：指南Apr 18, 2025 am 12:24 AM

PHP適合網頁開發和快速原型開發，Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發，語法簡單，適合快速開發。 2.Python語法簡潔，適用於多領域，庫生態系統強大。

PHP和框架：現代化語言Apr 18, 2025 am 12:14 AM

PHP在現代化進程中仍然重要，因為它支持大量網站和應用，並通過框架適應開發需求。 1.PHP7提升了性能並引入了新功能。 2.現代框架如Laravel、Symfony和CodeIgniter簡化開發，提高代碼質量。 3.性能優化和最佳實踐進一步提升應用效率。

PHP的影響：網絡開發及以後Apr 18, 2025 am 12:10 AM

PHPhassignificantlyimpactedwebdevelopmentandextendsbeyondit.1)ItpowersmajorplatformslikeWordPressandexcelsindatabaseinteractions.2)PHP'sadaptabilityallowsittoscaleforlargeapplicationsusingframeworkslikeLaravel.3)Beyondweb,PHPisusedincommand-linescrip

PHP類型提示如何起作用，包括標量類型，返回類型，聯合類型和無效類型？Apr 17, 2025 am 12:25 AM

PHP類型提示提升代碼質量和可讀性。 1)標量類型提示：自PHP7.0起，允許在函數參數中指定基本數據類型，如int、float等。 2)返回類型提示：確保函數返回值類型的一致性。 3)聯合類型提示：自PHP8.0起，允許在函數參數或返回值中指定多個類型。 4)可空類型提示：允許包含null值，處理可能返回空值的函數。

PHP如何處理對象克隆（克隆關鍵字）和__clone魔法方法？Apr 17, 2025 am 12:24 AM

PHP中使用clone關鍵字創建對象副本，並通過\_\_clone魔法方法定制克隆行為。 1.使用clone關鍵字進行淺拷貝，克隆對象的屬性但不克隆對象屬性內的對象。 2.通過\_\_clone方法可以深拷貝嵌套對象，避免淺拷貝問題。 3.注意避免克隆中的循環引用和性能問題，優化克隆操作以提高效率。