ホームページ  >  記事  >  Java  >  Javaを使用してWordの表内のテキストと画像を読み取る方法

Javaを使用してWordの表内のテキストと画像を読み取る方法

王林
王林転載
2023-05-03 16:04:061344ブラウズ

1. プログラム環境の準備

  • コードコンパイルツール: IntelliJ IDEA

  • #Jdk バージョン: 1.8.0

  • テストドキュメント: Word .docx 2013

  • Jar パッケージ: 無料の spire.doc.jar 3.9.0

#テストに使用される Word ドキュメントは次のとおりです:

Javaを使用してWordの表内のテキストと画像を読み取る方法

Jar インポートの手順と方法:

方法 1: 手動インポート。

プロジェクト構造 (Shift Ctrl Alt S) インターフェイスを開き、[モジュール]-[依存関係] を選択し、「 」、[JAR またはディレクトリ...] をクリックし、ローカル パス内の jar パッケージを選択し、追加します。それをチェックし、「OK」または「適用」をクリックしてjarをインポートします。

Javaを使用してWordの表内のテキストと画像を読み取る方法

方法 2: Maven ウェアハウスのインポート。

pom.xml ファイルで Maven パスを構成し、無料の spire.doc.jar 3.9.0 の依存関係を指定して、それをダウンロードしてインポートする必要があります。具体的な構成は次のとおりです:

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>http://repo.e-iceblue.cn/repository/maven-public/</url>
        </repository>
    </repositories>
<dependencies>
    <dependency>
        <groupid> e-iceblue </groupid>
        <artifactid>free.spire.doc</artifactid>
        <version>3.9.0</version>
    </dependency>
</dependencies>
2. Java コード

import com.spire.doc.*;
import com.spire.doc.documents.Paragraph;
import com.spire.doc.fields.DocPicture;
import com.spire.doc.interfaces.ITable;

import javax.imageio.ImageIO;
import java.awt.image.RenderedImage;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

public class GetTable {
    public static void main(String[] args)throws IOException {
        //加载Word测试文档
        Document doc = new Document();
        doc.loadFromFile("inputfile.docx");

        //获取第一节
        Section section = doc.getSections().get(0);

        //获取第一个表格
        ITable table = section.getTables().get(0);

        //创建txt文件(用于写入表格中提取的文本)
        String output = "ReadTextFromTable.txt";
        File textfile = new File(output);
        if (textfile.exists())
        {
            textfile.delete();
        }
        textfile.createNewFile();
        FileWriter fw = new FileWriter(textfile, true);
        BufferedWriter bw = new BufferedWriter(fw);

        //创建List
        List images = new ArrayList();

        //遍历表格中的行
        for (int i = 0; i 

3. テキストと画像の読み上げ効果

コードの編集が完了したら、プログラムを実行して、表内のテキスト データと画像。コード内のファイル パスは、IDEA プロジェクト フォルダー パスです (例:

C:\Users\Administrator\IdeaProjects\Table_Doc\ReadTextFromTable.txt

C:\Users\Administrator\IdeaProjects) \Table_Doc \Extracted table image-0.png

C:\Users\Administrator\IdeaProjects\Table_Doc\inputfile.docx

コードでは、ファイル パスを他のパスにカスタマイズできます。

#テキストデータ読み取り結果:

Javaを使用してWordの表内のテキストと画像を読み取る方法

画像読み取り結果:

以上がJavaを使用してWordの表内のテキストと画像を読み取る方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はyisu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。