基于springboot的java读取文档内容(超简单)

2024-01-09 14:15:07

? ? ?读取一个word文档里面的内容,并取出来。

代码:

 @SneakyThrows
    @GetMapping(value = "/readWordDoc")
    @ApiOperationSupport(order = 1)
    @ApiOperation(value = "文档读取 ", notes = "文档读取 ")
    public R ReadWordDoc () {
        System.out.println("进来了");
        String filePath = "F:\\\\工作\\\\测试\\\\测试文档2.doc"; // 替换为你的文档路径
        String text = "";
        StringBuffer text2 = new StringBuffer();
        try (FileInputStream fis = new FileInputStream(filePath)) {
            // 使用FileInputStream打开Word文档
            XWPFDocument document = new XWPFDocument(fis);

            // 读取段落内容
            List<XWPFParagraph> paragraphs = document.getParagraphs();
            for (XWPFParagraph para : paragraphs) {
//                text = para.getText(); // 获取段落内容
                text2.append(para.getText());
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
        // FileInputStream和XWPFDocument资源会自动关闭
        System.out.println(text2); // 输出内容
        return R.data(text2);
    }

输出结果:

代码解析:

1. `@SneakyThrows` 注解:这是一个Lombok注解,用于自动处理异常,可以将受检异常转换为不受检异常。

2. `@GetMapping(value = "/readWordDoc")` 注解:这是一个Spring MVC注解,指定了该方法处理的GET请求路径。

3. `@ApiOperationSupport(order = 1)` 注解:这是一个Swagger注解,用于设置接口的展示顺序。

4. `@ApiOperation(value = "文档读取 ", notes = "文档读取 ")` 注解:这是一个Swagger注解,用于设置接口的名称和说明。

5. `public R ReadWordDoc()`?方法:这是一个公共的无参方法,表示该方法的访问修饰符是public,返回类型是一个自定义的R类型。

6. `String filePath`?变量:用于存储Word文档的文件路径。

7. `String text` 和 `StringBuffer text2` 变量:分别用于存储文档内容。

8. `try (FileInputStream fis = new FileInputStream(filePath))`:使用Java 7的try-with-resources语法,创建一个FileInputStream对象,并设置文档路径。

9. `XWPFDocument document = new XWPFDocument(fis)`:创建一个XWPFDocument对象,表示Word文档。

10. `List<XWPFParagraph> paragraphs = document.getParagraphs()`:获取文档中的所有段落,返回一个包含XWPFParagraph对象的列表。

11. `for (XWPFParagraph para : paragraphs)`:遍历段落列表。

12. `text2.append(para.getText())`:使用StringBuffer对象将每个段落的文本内容添加到text2中。

13. `catch (IOException e)`:捕获IOException异常,打印异常信息。

14. `System.out.println(text2)`:输出文档内容。

15. `return R.data(text2)`:将text2作为响应数据,返回一个R对象。

为了使上述代码能够编译和运行,需要引入以下依赖:

1. Spring Boot相关依赖,包括`spring-boot-starter-web`、`spring-boot-starter`等,用于构建Web应用程序。

2. Swagger依赖,用于生成API文档,如`springfox-swagger2`和`springfox-swagger-ui`。

3. Apache POI依赖,用于处理Word文档,如`poi-ooxml`和`poi-ooxml-schemas`。

这些依赖可以在项目的构建工具(如Maven或Gradle)中进行配置,并在项目中进行引用。

文章来源:https://blog.csdn.net/weixin_53607413/article/details/135381947
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。