基于springboot的java读取文档内容(超简单)
? ? ?读取一个word文档里面的内容,并取出来。
代码:
@SneakyThrows
@GetMapping(value = "/readWordDoc")
@ApiOperationSupport(order = 1)
@ApiOperation(value = "文档读取 ", notes = "文档读取 ")
public R ReadWordDoc () {
System.out.println("进来了");
String filePath = "F:\\\\工作\\\\测试\\\\测试文档2.doc"; // 替换为你的文档路径
String text = "";
StringBuffer text2 = new StringBuffer();
try (FileInputStream fis = new FileInputStream(filePath)) {
// 使用FileInputStream打开Word文档
XWPFDocument document = new XWPFDocument(fis);
// 读取段落内容
List<XWPFParagraph> paragraphs = document.getParagraphs();
for (XWPFParagraph para : paragraphs) {
// text = para.getText(); // 获取段落内容
text2.append(para.getText());
}
} catch (IOException e) {
e.printStackTrace();
}
// FileInputStream和XWPFDocument资源会自动关闭
System.out.println(text2); // 输出内容
return R.data(text2);
}
输出结果:
代码解析:
1. `@SneakyThrows` 注解:这是一个Lombok注解,用于自动处理异常,可以将受检异常转换为不受检异常。
2. `@GetMapping(value = "/readWordDoc")` 注解:这是一个Spring MVC注解,指定了该方法处理的GET请求路径。
3. `@ApiOperationSupport(order = 1)` 注解:这是一个Swagger注解,用于设置接口的展示顺序。
4. `@ApiOperation(value = "文档读取 ", notes = "文档读取 ")` 注解:这是一个Swagger注解,用于设置接口的名称和说明。
5. `public R ReadWordDoc()`?方法:这是一个公共的无参方法,表示该方法的访问修饰符是public,返回类型是一个自定义的R类型。
6. `String filePath`?变量:用于存储Word文档的文件路径。
7. `String text` 和 `StringBuffer text2` 变量:分别用于存储文档内容。
8. `try (FileInputStream fis = new FileInputStream(filePath))`:使用Java 7的try-with-resources语法,创建一个FileInputStream对象,并设置文档路径。
9. `XWPFDocument document = new XWPFDocument(fis)`:创建一个XWPFDocument对象,表示Word文档。
10. `List<XWPFParagraph> paragraphs = document.getParagraphs()`:获取文档中的所有段落,返回一个包含XWPFParagraph对象的列表。
11. `for (XWPFParagraph para : paragraphs)`:遍历段落列表。
12. `text2.append(para.getText())`:使用StringBuffer对象将每个段落的文本内容添加到text2中。
13. `catch (IOException e)`:捕获IOException异常,打印异常信息。
14. `System.out.println(text2)`:输出文档内容。
15. `return R.data(text2)`:将text2作为响应数据,返回一个R对象。
为了使上述代码能够编译和运行,需要引入以下依赖:
1. Spring Boot相关依赖,包括`spring-boot-starter-web`、`spring-boot-starter`等,用于构建Web应用程序。
2. Swagger依赖,用于生成API文档,如`springfox-swagger2`和`springfox-swagger-ui`。
3. Apache POI依赖,用于处理Word文档,如`poi-ooxml`和`poi-ooxml-schemas`。
这些依赖可以在项目的构建工具(如Maven或Gradle)中进行配置,并在项目中进行引用。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!