RAG笔记
记录一下 RAG 项目用到的专有名词和技术。
名词解释
跟 LLM 相关的参数:
温度/Temperature
用来控制文本生成的随机性或创造性,根据不同的任务场景,您可以参考以下设置:代码生成/数学解题:0.0;数据抽取/分析:1.0;通用对话:1.3;翻译:1.3;创意类写作/诗歌创作:1.5
当前 deepseek 取值范围 [0,2],默认0.6。topP
保证文本质量和连贯性的前提下增加生成内容的多样性,值越大多样性越高。
当前 deepseek 取值范围 [0,1],默认1。频率惩罚/Frequency Penalty
用于控制生成文本多样性,减少重复文本出现的可能。
当前 deepseek 取值范围 [-2,2],默认0。
跟向量数据库相关的参数:
相似度阈值/scoreThreshold
向量相似度权重/vectorWeight
召回数/topK
其他技术
LLM 应用开发平台:AI 工作流、RAG 管道、Agent、模型管理、可观测性功能。
- 工作流:在画布上构建和测试功能强大的 AI 工作流程
- RAG Pipeline:广泛的 RAG 功能,涵盖从文档摄入到检索的所有内容,支持从 PDF、PPT 和其他常见文档格式中提取文本的开箱即用的支持。
- Agent 智能体:基于 LLM 函数调用或 ReAct 定义 Agent,并为 Agent 添加预构建或自定义工具。内置工具,如谷歌搜索、DALL·E、Stable Diffusion 和 WolframAlpha 等。
- LLMOps:随时间监视和分析应用程序日志和性能。根据生产数据和标注持续改进提示、数据集和模型。
开源项目记录
Dify:
https://github.com/langgenius/dify
优点:功能齐全,star96k
缺点:有限开源,不可改图标,不可saas
ragflow:
https://github.com/infiniflow/ragflow
优点:功能基本满足,star51k,更新较快
缺点:bug较多,无RBAC
一个前后端分离的:
https://github.com/IA-PieroCV/chatresume-backend
https://github.com/IA-PieroCV/chatresume-frontend
优点:前端使用Vue3,可直接上手。
缺点:更新于2年前,star太少
https://github.com/1517005260/graph-rag-agent
优点:更新状态、star100+
纯python
阿里牵头做的:https://github.com/OpenSPG/KAG/tree/master
优点:更新状态、维护者较多、star6.7k
纯python
https://github.com/HKUDS/LightRAG/tree/main
优点:更新状态、维护者较多、star15.7k
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!