谷歌开源了首个Agent开发套件—ADK,这也是OpenAI之后第二家大厂发布的标准化智能体SDK。
ADK能帮助开发人员极大简化开发超复杂流程的智能体,从大模型选择、自动化流程编排、测试到应用部署可一站式完成,并且支持双向音频、视频、MCP和最新的A2A协议。
例如,通过ADK开发一个跨平台的语音客服智能体,大概只需要100多行甚至更少的代码就能全部完成。再也不用像以前那样,切换不同平台API,模型选择或交互逻辑编写复杂代码,极大提升了开发效率。
开源地址:https://github.com/google/adk-python
ADK介绍
ADK架构以Python为主,在参数定义、模型集成、工具整合和指令驱动方面非常好用。
例如,下面这个案例只用了6行代码,就完成了一个简单的问答智能体开发。咱们只设置了使用的模型、智能体名称、功能描述、指令驱动和工具实例。其他的管理状态、协调工具调用以及和底层大模型的交互全部由ADK完成。
简单来说,用ADK开发就有点像拼乐高积木一样,喜欢哪块就拼哪个完全释放你的天马行空想法,再也不用为工具和底层技术发愁了。
from google.adk.agents import Agent
from google.adk.tools import google_search
root_agent = Agent(
name="search_assistant",
model="gemini-2.0-flash", # Or your preferred Gemini model
instruction="You are a helpful assistant. Answer user questions using Google Search when needed.",
description="An assistant that can search the web.",
tools=[google_search]
)
虽然ADK是谷歌开源的,但在大模型兼容方面还是非常灵活的,除了谷歌的Gemini系列模型之外,还支持Anthropic、Meta、Mistral AI、AI21 Labs、CAMB.AI、Qodo等200多个第三方开闭源模型。
ADK的亮点之一便是轻松开发复杂智能体,支持多层级结构组合的智能体实现复杂的协调和委派。开发者可以构建一个主智能体来处理主要任务,并将特定子任务委派给其他专业智能体。
简单来说,就是让主智能体指挥其他智能体来执行具体的任务。例如,你是一家电商公司需要开发客服智能体。希望能自动处理订单查询、商品推荐、售后服务等多种服务。
传统的方法会非常繁琐,你需要为不同的业务编写不同的逻辑代码并,且优化、重构也很麻烦。通过ADK你可以直接定义4个智能体,主体负责接收用户问题,并根据问题类型委派给相应的子智能体;订单查询智能体,专门处理与订单相关的问题,如订单状态、物流信息等。
商品推荐智能体,根据用户的历史购买记录和浏览行为,推荐相关商品;售后服务智能体,处理退换货、退款等售后服务问题。
上面这些只是为大家简单讲解,其实实际用ADK开发更简单高效,因为它还集成了搜索、地图、代码执行、服务等很多实用工具,也支持LangChain、CrewAI、MCP等第三方服务。
更详细的示例开源地址:https://github.com/google/adk-samples
谷歌ADK详细文档:https://google.github.io/adk-docs/get-started/tutorial/#step-1-your-first-agent-basic-weather-lookup
相关阅读:谷歌推出 A2A 开放协议,实现智能体间的自由 “对话”