【书生·浦语大模型实战营03】《基于 InternLM 和 LangChain 搭建你的知识库》学习笔记

2024-01-08 22:03:01

《基于 InternLM 和 LangChain 搭建你的知识库》

常见术语

RAG: Retrieval Augmented Generation，检索增强生成

1. 大模型开发范式

1.1 RAG VS Finetune

在这里插入图片描述

RAG	Finetune
低成本	可个性化微调
可实时更新	知识覆盖面广
受基座模型影响大	成本高昂
单次回答知识有限	无法实时更新

1.1.2 Finetune

（2）成本高昂：需要GPU算力以及模型训练知识

4. 搭建知识库助手

4.1 RAG方案优化建议

在这里插入图片描述

基于RAG的问答系统性能核心受限于：
- 检索精度
- Prompt性能
一些可能的优化点：
- 检索方面：
  - 基于语义进行分割，保证每一个chunk的语义完整
  - 给每一个chunk生成概括性索引，检索时匹配索引
- Prompt方面：
  - 迭代优化Prompt策略

南溪：感觉“概括性索引”就有点像论文的摘要。

文章来源:https://blog.csdn.net/songyuc/article/details/135466277
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！