Agent代理
概述
Agent代理的核心思想是使用语言模型来选择要采取的一系列动作。在链中,动作序列是硬编码的。在代理中,语言模型用作推理引擎来确定要采取哪些动作以及按什么顺序进行。
因此,在LangChain中,Agent代理就是使用语言模型作为推理引擎,让模型自主判断、调用工具和决定下一步行动。
Agent代理像是一个多功能接口,能够使用多种工具,并根据用户输入决定调用哪些工具,同时能够将一个工具的输出数据作为另一个工具的输入数据。
分类
根据几个维度对所有可用的代理进行分类:
模型类型:代理适用于那类模型。Chat(接收消息,输出消息)、LLM(接收字符串,输出字符串)
聊天历史: 代理是否支持聊天历史。如果支持,这意味着它可以用作聊天机器人。如果不支持,那么它更适合单一任务。
多输入工具: 代理是否支持具有多个输入的工具。如果一个工具只需要单个输入,那么LLM通常更容易知道如何调用它。
并行函数调用: 让LLM同时调用多个工具可以大大提高代理的效率
所需模型参数: 代理是否需要模型支持任何其他参数。某些代理类型利用了OpenAI 函数调用等功能,这些功能需要其他模型参数。如果不需要,则意味着一切都通过提示完成
代理名称 | 模型类型 | 聊天历史 | 多输入工具 | 并行函数调用 | 所需模型参数 | 描述 | Agent |
---|---|---|---|---|---|---|---|
OpenAI tools | Chat | √ | √ | √ | tools | OpenAI将调用单个函数的能力称为 函数,将调用一个或多个函数的能力称为工具。 | create_openai_tools_agent |
OpenAI functions | Chat | √ | √ | x | functions | 使用Op0nAl函数集合的代理。已弃用转而使用OpenAI tools | create_openai_functions_agent |
XML Agent | LLM | √ | x | x | 某些语言模型(例如 Anthropic 的 Claude)特别擅长推理/编写 XML。 | create_xml_agent | |
Structured chat | Chat | √ | √ | x | 使用结构化工具集的代理 | create_structured_chat_agent | |
JSON Chat Agent | Chat | √ | x | x | 代理使用 JSON 来格式化其输出,旨在支持聊天模型。 | create_json_chat_agent | |
ReAct | LLM | √ | x | x | 推理和执行,推理后决定调用工具或者根据工具返回结果确定完成任务 | create_react_agent | |
Self-ask with search | LLM | x | x | x | 通过追问和中间答案,引导发现最终答案 | create_self_ask_with_search_agent |
Agent的基本使用
构建一个具有两种工具的代理:一种用于在线查找,另一种用于查找加载到索引中的特定数据。
准备操作
在LangChain中有一个内置的工具,可以方便地使用Tavily搜索引擎作为工具。
访问Tavily(用于在线搜索)注册账号并登录,获取API 密钥
设置OpenAI和TAVILY的API密钥
import os
os.environ["OPENAI_BASE_URL"] = "https://xxx.com/v1"
os.environ["OPENAI_API_KEY"] = "sk-BGFnOL9Q4c99B378Bxxxxxxxxxxxxxxxx13bc437B82c2"
os.environ["TAVILY_API_KEY"] = 'tvly-Scx77cTxxxxxxxxxxxxx3rmxRIM8'
定义工具
首先需要创建想要使用的工具。这里使用两个工具:
Tavily(用于在线搜索)
创建的本地索引的检索器
1.Tavily在线搜索
# 加载所需的库
from langchain_community.tools.tavily_search import TavilySearchResults
# 查询 Tavily 搜索 API 并返回 json 的工具
search = TavilySearchResults()
# 执行查询
res = search.invoke("目前市场上苹果手机15的平均售价是多少?")
print(res)
执行查询结果如下:
2.创建检索器
根据上述查询结果中的某个URL中,获取一些数据创建一个检索器。
这里使用一个简单的本地向量库FAISS,使用FAISS的CPU版本,需要安装FAISS库:
pip install faiss-cpu
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.vectorstores import FAISS
from langchain_openai import OpenAIEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter
# 加载HTML内容为一个文档对象
loader = WebBaseLoader("https://www.ithome.com/0/718/713.htm")
docs = loader.load()
# 分割文档
documents = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200).split_documents(docs)
# 向量化
vector = FAISS.from_documents(documents, OpenAIEmbeddings())
# 创建检索器
retriever = vector.as_retriever()
# 测试检索结果
print(retriever.get_relevant_documents("iPhone 15平均销售价格是多少?")[1])
检索结果如下:
3.得到工具列表
from langchain.tools.retriever import create_retriever_tool
# 创建一个工具来检索文档
retriever_tool = create_retriever_tool(
retriever,
"iPhone_price_search",
"搜索有关 iPhone 15 的价格信息。对于iPhone 15的任何问题,您必须使用此工具!",
)
# 创建将在下游使用的工具列表
tools = [search, retriever_tool]
初始化大模型
选择将驱动代理的LLM,为了模型回答更严谨,设置temperature=0
from langchain_openai import ChatOpenAI
# 初始化大模型
llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)
创建Agent
这里使用LangChain中一个叫OpenAI functions的代理,然后得到一个AgentExecutor代理执行器。
AgentExecutor是代理执行器,它实际上调用代理,执行其选择的操作,将操作输出传回代理,然后重复。
from langchain import hub
# 获取要使用的提示
prompt = hub.pull("hwchase17/openai-functions-agent")
# 打印Prompt
print(prompt)
# 使用OpenAI functions代理
from langchain.agents import create_openai_functions_agent
# 构建OpenAI函数代理:使用 LLM、提示模板和工具来初始化代理
agent = create_openai_functions_agent(llm, tools, prompt)
from langchain.agents import AgentExecutor
# 将代理与AgentExecutor工具结合起来
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
运行Agent
注意:目前这些都是无状态查询
# 执行代理
agent_executor.invoke({"input": "目前市场上苹果手机15的平均售价是多少?如果我在此基础上加价5%卖出,应该如何定价??"})
执行部分日志记录如下:
> Entering new AgentExecutor chain...
Invoking: `iPhone_price_search` with `{'query': 'iPhone 15 average selling price'}`
苹果 iPhone 15/Pro系列国行价格出炉,5999 元起 - IT之家
根据搜索结果,苹果 iPhone 15 系列的国行价格从 5999 元起售。如果您想在此基础上加价5%,您可以按照以下方式定价:
- iPhone 15:5999 元 + 5% = 6298.95 元
- iPhone 15 Plus:6999 元 + 5% = 7348.95 元
- iPhone 15 Pro:7999 元 + 5% = 8398.95 元
- iPhone 15 Pro Max:9999 元 + 5% = 10498.95 元
您可以根据以上价格定价出售您的苹果手机 15 系列产品。希望这可以帮助到您!
> Finished chain.
添加记忆
目前代理是无状态的,这意味着它不记得以前的交互。为了给它记忆,需要传入chat_history
。
注意:
chat_history
是正在使用提示符中的一个变量,因此需要调用它。如果使用不同的提示,可能需要更改变量名称
具体Prompt提示模板内容如下: 记忆测试:
# 加载所需的库
from langchain_community.tools.tavily_search import TavilySearchResults
# 查询 Tavily 搜索 API 并返回 json 的工具
search = TavilySearchResults()
# 创建将在下游使用的工具列表
tools = [search]
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)
from langchain import hub
# 获取要使用的提示
prompt = hub.pull("hwchase17/openai-functions-agent")
# 使用OpenAI functions代理
from langchain.agents import create_openai_functions_agent
# 创建使用 OpenAI 函数调用的代理
agent = create_openai_functions_agent(llm, tools, prompt)
from langchain.agents import AgentExecutor
# 得到代理工具执行器
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
# 执行代理
# 传入一个空的消息列表给chat_history,因为它是聊天中的第一条消息
res = agent_executor.invoke({"input": "hi! my name is bob", "chat_history": []})
print(res)
from langchain_core.messages import AIMessage, HumanMessage
agent_executor.invoke(
{
"chat_history": [
HumanMessage(content=res['input']),
AIMessage(content=res['output']),
],
"input": "what's my name?",
}
)
执行日志如下,代理明显有了记忆
> Entering new AgentExecutor chain...
Hello Bob! How can I assist you today?
> Finished chain.
{'input': 'hi! my name is bob', 'chat_history': [], 'output': 'Hello Bob! How can I assist you today?'}
> Entering new AgentExecutor chain...
Your name is Bob! How can I assist you today, Bob?
> Finished chain.
自动跟踪这些消息,可以将其包装在RunnableWithMessageHistory中
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
message_history = ChatMessageHistory()
agent_with_chat_history = RunnableWithMessageHistory(
agent_executor,
lambda session_id: message_history,
input_messages_key="input",
history_messages_key="chat_history",
)
agent_with_chat_history.invoke(
{"input": "hi! I'm bob"},
config={"configurable": {"session_id": "<foo>"}},
)
agent_with_chat_history.invoke(
{"input": "what's my name?"},
config={"configurable": {"session_id": "<foo>"}},
)
执行日志如下:
> Entering new AgentExecutor chain...
Hello Bob! How can I assist you today?
> Finished chain.
> Entering new AgentExecutor chain...
Your name is Bob! How can I assist you, Bob?
> Finished chain.