<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
    <channel>
        <title>向量数据库 - Tag - 编程心语</title>
        <link>https://www.ithome.me/tags/%E5%90%91%E9%87%8F%E6%95%B0%E6%8D%AE%E5%BA%93/</link>
        <description>向量数据库 - Tag - 编程心语</description>
        <generator>Hugo -- gohugo.io</generator><language>zh-CN</language><lastBuildDate>Thu, 11 Jun 2026 00:00:00 &#43;0000</lastBuildDate><atom:link href="https://www.ithome.me/tags/%E5%90%91%E9%87%8F%E6%95%B0%E6%8D%AE%E5%BA%93/" rel="self" type="application/rss+xml" /><item>
    <title>用Python&#43;LangChain从零搭建RAG系统：让大模型读懂你的私有文档</title>
    <link>https://www.ithome.me/post/2026/06/11/rag%E7%B3%BB%E7%BB%9F%E5%AE%9E%E6%88%98/</link>
    <pubDate>Thu, 11 Jun 2026 00:00:00 &#43;0000</pubDate>
    <author>Simon</author>
    <guid>https://www.ithome.me/post/2026/06/11/rag%E7%B3%BB%E7%BB%9F%E5%AE%9E%E6%88%98/</guid>
    <description><![CDATA[为什么需要RAG？ 大语言模型（LLM）虽然强大，但它有一个致命短板——知识截止日期。ChatGPT不知道你公司上周发布的内部文档，Claude不了解你项目特有的业务逻辑。直接让LLM回答私有领域的问题，轻则答非所问，重则一本正经地胡说八道。
RAG（Retrieval-Augmented Generation，检索增强生成） 就是解决这个问题的利器。它的核心思路非常简单：
检索：根据用户问题，从你的文档库中找到相关片段 增强：把这些片段作为上下文，注入到Prompt中 生成：让LLM基于这些上下文生成准确回答 这种方式不需要微调模型，成本低、见效快，是目前企业级AI应用最主流的架构方案。
技术栈选型 我们用到的技术栈：
LangChain：RAG框架，负责文档加载、切分、检索、链式调用 ChromaDB：轻量级向量数据库，本地运行，无需额外部署 OpenAI Embeddings：将文本转为向量表示 OpenAI GPT：生成回答的大模型 完整代码实现 1. 环境准备 1 pip install langchain langchain-openai langchain-community chromadb tiktoken 确保设置了OpenAI API Key：
1 export OPENAI_API_KEY=&#34;sk-your-api-key-here&#34; 2. 加载文档 RAG的第一步是加载你的文档。LangChain支持多种数据源，这里我们以本地Markdown文件为例：
1 2 3 4 5 6 7 8 9 10 11 from langchain_community.document_loaders import DirectoryLoader, TextLoader # 加载指定目录下的所有.md文件 loader = DirectoryLoader( &#34;./docs&#34;, glob=&#34;**/*.md&#34;, loader_cls=TextLoader, loader_kwargs={&#34;encoding&#34;: &#34;utf-8&#34;} ) documents = loader.load() print(f&#34;共加载 {len(documents)} 个文档片段&#34;) 如果你需要加载PDF或Word文档，只需替换对应的Loader：]]></description>
</item>
</channel>
</rss>
