使用RAG和Langchain从头开始制作个人AI助理

2023-09-22 09:18:19科技专一的悟空

如果您有兴趣从头开始使用人工智能构建自己的个人助理，您可能有兴趣了解更多有关如何将人工智能与检索增强生成(RAG)和Langchain结合使用的信息。JamesBriggs亲切地演示了完整的过程，他将逐步引导您完成每个过程。

本教程涉及使用OpenAI的GPT3.5模型和Lang链库，其主要目标是构建一个能够回答有关近期事件或组织内部文档或个人文档的问题的AI聊天机器人，使其能够回答问题与特定主题或主题子集相关。ChatGPT3.5或ChatGPT4等传统模型可能难以完成这项任务。

RAG管道是此过程中的关键组件。它通过获取查询、将其输入语言模型(LM)并生成输出来发挥作用。该管道特别有利于解决有关近期进展或LM尚未接受过培训的特定内部信息的问题。Lang链库与OpenAI的GPT3.5和GPT4模型兼容，是构建此类聊天机器人的宝贵工具。

如何打造个人人工智能助理

聊天机器人的构建包括初始化聊天模型、添加用户查询和系统提示，然后将它们输入聊天模型以生成响应。然而，这个过程并非没有挑战。其中一项挑战是LM中出现“幻觉”，其中模型会生成不正确或无意义的响应，因为它仅依赖于训练期间学到的知识。

为了抵消这一限制，采用RAG管道将LM连接到外部知识库。该知识库可以独立于LM进行更新和管理，为聊天机器人提供动态且适应性强的信息源。虽然该视频演示了如何手动将上下文插入聊天机器人的提示中以改善其响应，但它承认这对于大规模应用程序来说不是一个实用的解决方案。

相反，RAG管道被建议作为一种更有效的方法来从大型知识库中自动检索和插入相关上下文。这个过程是通过使用矢量搜索引擎Pinecone来实现的。通过使用Pinecone建立矢量数据库，该数据库可以作为聊天机器人的知识库，为聊天机器人提供丰富的信息源。

本教程演示了RAG管道可以为聊天机器人回答复杂或特定问题的能力带来显着改进。通过从知识库中检索和合并相关上下文，聊天机器人可以提供更准确和相关的响应，从而增强其实用性和有效性。

什么是检索增强生成(RAG)

检索增强生成(RAG)是一种机器学习架构，结合了基于检索的模型和生成模型的优点。在自然语言处理中，基于检索的模型擅长从大型数据集中选择相关信息，但可能缺乏生成连贯且上下文相关的响应的能力。另一方面，生成模型可以生成流畅的文本，但可能难以合并外部数据库或文本语料库中存在的事实或特定信息。

在RAG中，该过程通常涉及两个关键步骤：

检索步骤：当给出问题或提示时，模型会查询数据库或语料库以检索可能包含相关信息的一组文档或段落。这通常是使用BM25等信息检索算法甚至神经检索机制来完成的。

生成步骤：然后将检索到的文档作为附加上下文输入生成模型，该模型综合信息以生成连贯且上下文相关的答案或文本。

这两个步骤的整合可以通过多种方式进行。例如，在“RAG-令牌”设置中，在解码阶段生成的每个令牌都可以触发新的检索操作，而在“RAG-序列”设置中，单个初始检索可能用于生成整个序列。

RAG的优点是它允许模型提取实时信息，这对于需要外部知识的问答任务特别有用。它还促进了NLP的更加模块化的方法，将信息检索和文本生成的关注点分开。

使用RAG、OpenAI的GPT3.5模型和Lang链库创建聊天机器人是一个复杂但有益的过程。尽管法学硕士存在幻觉带来的挑战以及手动上下文插入的局限性，但使用RAG管道和外部知识库可以显着提高聊天机器人的性能。正如JamesBriggs所演示的，这个过程为那些对人工智能和聊天机器人创建领域感兴趣的人提供了宝贵的指南。