基于Kettle开发的web版数据集成开源工具(data-integration)-应用篇

2024-01-08 20:06:36

📚第一章基本流程梳理

📗页面基本操作

从登录开始->新建项目->保存项目->运行项目开始(问题还是挺多的，不过主要还是借鉴任务编排这一块，无伤大雅)
在这里插入图片描述

在这里插入图片描述

select role_name,`describe` from dp_portal_role

📗对应后台服务流程

参照页面基本操作，梳理后台对应的服务及表等
在这里插入图片描述

项目主要对应两种表
- 项目信息表 dp_portal_project ：项目编号、名称、描述、类型、状态，分组编号、名称
- 项目附件信息表 dp_portal_project_file ：项目编号、项目文件内容project_file、项目版本号；其中project_file字段通过JSON串存放项目内容
运行项目
- 调用更新项目信息接口 ProjectServiceApiController.updateSelective
- 前端通过调用websocket服务，调用运行接口 ProjectExecutorController.executeById
  - @MessageMapping和@SendToUser注解是用来处理WebSocket消息并实现广播或点对点消息推送的:
    1. WebSocket客户端向服务器发送一条指向/executeById路径的消息。
    2. 服务器端通过@MessageMapping找到并执行executeById方法。
    3. 方法内部完成业务逻辑处理后，返回的结果会被自动通过WebSocket协议推送给对应用户，即在每个已认证用户的特定通道上发布结果。
  - projectExecutorService.asyncExecuteByFile
    - executeByFile.execute.start()
      - 构建TransMeta 对象,buildTransMeta(json转xml)
      - 设置本地引擎执行
      - 创建执行器
      - 启动
    - 调用Kettle本地引擎

📚第二章二开思路

通过上面的流程梳理，发现任务编排工作流主要在前端，各种字段属性和kettle对应都是前端传给后台的，后台直接保存的JSON串，我这里只需要任务编排这块功能，springcloud也用不到，后面如果借鉴该项目，大概要做哪些事？

📗前端

应该可以直接复用，我们用的也是vue2+element架构

📗后端

该项目涉及的技术组件比较多，用到了springcloud,相对来说有点麻烦，到了具体开发阶段，涉及的就比较多了，下一步可以先简单点，就导出一个作业文件，提取相关代码，能够成功执行作业之后，在开始大刀阔斧的开展工作，一步一步推进：

kettle本地引擎执行代码
作业文件组装、转换代码

📗后续补充：Kettle Local引擎源码使用记录

文章来源:https://blog.csdn.net/qq_36434219/article/details/135378698
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！