Java 提取Word中的文本和图片

日期：2021-06-27 栏目：程序人生浏览：次

本文将介绍通过Java来提取或读取Word文档中文本和图片的方法。这里提取文本和图片包括同时提取文档正文当中以及页眉、页脚中的的文本和图片。

使用工具：Free Spire.Doc for Java （免费版）

Jar文件导入方法（参考）：

方法1：下载jar文件包。下载后解压文件，并将lib文件夹下的Spire.Doc.jar文件导入到java程序。导入效果参考如下：

Java 提取Word中的文本和图片

方法2：可通过maven导入。参考导入方法。

测试文档如下：

Java 提取Word中的文本和图片

Java代码示例（供参考）

【示例1】提取Word中的文本

import com.spire.doc.*; import java.io.FileWriter; import java.io.IOException; public class ExtractText { public static void main(String[] args) throws IOException{ //加载测试文档 Document doc = new Document(); doc.loadFromFile("test.docx"); //获取文本保存为String String text = doc.getText(); //将String写入Txt writeStringToTxt(text,"提取文本.txt"); } public static void writeStringToTxt(String content, String txtFileName) throws IOException { FileWriter fWriter= new FileWriter(txtFileName,true); try { fWriter.write(content); }catch(IOException ex){ ex.printStackTrace(); }finally{ try{ fWriter.flush(); fWriter.close(); } catch (IOException ex) { ex.printStackTrace(); } } } }

转载注明出处：https://www.heiqu.com/zydzdz.html

Java 提取Word中的文本和图片

相关推荐