继 BrouserUse, ComputerUse 等项目后,PhoneUse 类的项目终于出现了 —— DroidRun。
Droidrun,为 AI Agent 提供 Android 操作系统,让 AI 以最先进的自动化方式控制 Android 设备。
Droidrun 结合视觉理解与 UI 结构提取,实现流畅的交互体验。它不仅能打开 App、发送消息,还能自动导航菜单、处理错误,甚至完成复杂任务如订车或录视频。
Droidrun 主要功能
- 视觉+UI解析:结合视觉模型(识别屏幕内容)和 UI 结构提取(解析控件树),实现精准交互。
- 智能自愈机制:智能检测错误(如网络中断、界面变化),自动调整操作路径。
- Android Portal APK:类似Agent通行证的Android应用,部署后AI可通过它操控整个系统。
- 多系统管理(即将上线):支持多台设备多实例,支持复杂工作流与并行处理。
- 元素追踪(即将上线):精准提取点击元素,复现 LLM 行为,确保自动化一致性。
- 凭证管理器(即将上线):支持登录信息和 2FA 绑定,个性化你的使用体验。
Droidrun 作者表示,该项目后续会在 GitHub 开源。
详情查看:https://www.droidrun.ai/