RAG笔记

记录一下 RAG 项目用到的专有名词和技术。

名词解释

跟 LLM 相关的参数:

  1. 温度/Temperature
    用来控制文本生成的随机性或创造性,根据不同的任务场景,您可以参考以下设置:代码生成/数学解题:0.0;数据抽取/分析:1.0;通用对话:1.3;翻译:1.3;创意类写作/诗歌创作:1.5
    当前 deepseek 取值范围 [0,2],默认0.6。

  2. topP
    保证文本质量和连贯性的前提下增加生成内容的多样性,值越大多样性越高。
    当前 deepseek 取值范围 [0,1],默认1。

  3. 频率惩罚/Frequency Penalty
    用于控制生成文本多样性,减少重复文本出现的可能。
    当前 deepseek 取值范围 [-2,2],默认0。

跟向量数据库相关的参数:

  1. 相似度阈值/scoreThreshold

  2. 向量相似度权重/vectorWeight

  3. 召回数/topK

其他技术

LLM 应用开发平台:AI 工作流、RAG 管道、Agent、模型管理、可观测性功能。

  1. 工作流:在画布上构建和测试功能强大的 AI 工作流程
  2. RAG Pipeline:广泛的 RAG 功能,涵盖从文档摄入到检索的所有内容,支持从 PDF、PPT 和其他常见文档格式中提取文本的开箱即用的支持。
  3. Agent 智能体:基于 LLM 函数调用或 ReAct 定义 Agent,并为 Agent 添加预构建或自定义工具。内置工具,如谷歌搜索、DALL·E、Stable Diffusion 和 WolframAlpha 等。
  4. LLMOps:随时间监视和分析应用程序日志和性能。根据生产数据和标注持续改进提示、数据集和模型。

开源项目记录

Dify:
https://github.com/langgenius/dify
优点:功能齐全,star96k
缺点:有限开源,不可改图标,不可saas

ragflow:
https://github.com/infiniflow/ragflow
优点:功能基本满足,star51k,更新较快
缺点:bug较多,无RBAC

一个前后端分离的:
https://github.com/IA-PieroCV/chatresume-backend
https://github.com/IA-PieroCV/chatresume-frontend
优点:前端使用Vue3,可直接上手。
缺点:更新于2年前,star太少

https://github.com/1517005260/graph-rag-agent
优点:更新状态、star100+
纯python

阿里牵头做的:https://github.com/OpenSPG/KAG/tree/master
优点:更新状态、维护者较多、star6.7k
纯python

https://github.com/HKUDS/LightRAG/tree/main
优点:更新状态、维护者较多、star15.7k


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!