检索增强生成¶
检索增强生成(RAG)是一种使生成式人工智能(Gen AI)模型能够检索并整合新信息的技术。它修改了与大型语言模型(LLM)的交互方式,使模型能够参考指定文档集来回应用户查询,并利用这些信息补充其预先存在的训练数据。这使得LLM能够使用特定领域和/或更新的信息。用例包括提供聊天机器人访问公司内部数据,或根据权威来源生成响应。
以下是集成: - vLLM + langchain + milvus - vLLM + llamaindex + milvus
vLLM + langchain¶
先决条件¶
- 设置 vLLM 和 langchain 环境
pip install -U vllm \
langchain_milvus langchain_openai \
langchain_community beautifulsoup4 \
langchain-text-splitters
部署¶
- 使用支持的嵌入模型启动 vLLM 服务器,例如:
- 启动支持聊天完成模型的 vLLM 服务器,例如
vLLM + llamaindex¶
先决条件¶
- 设置 vLLM 和 llamaindex 环境
pip install vllm \
llama-index llama-index-readers-web \
llama-index-llms-openai-like \
llama-index-embeddings-openai-like \
llama-index-vector-stores-milvus \
部署¶
- 使用支持的嵌入模型启动 vLLM 服务器,例如:
- 启动支持聊天完成模型的 vLLM 服务器,例如