Oppo 开源 X-OmniClaw,一款 Android 端侧 AI 智能体框架
Oppo AI 团队发布了 X-OmniClaw,这是一个开源的 Android AI 智能体框架,其核心感知和动作逻辑在设备端运行,仅在需要复杂推理时调用云端。与在虚拟 Android 副本上运行的云端移动 AI 系统不同,X-OmniClaw 可直接访问手机的摄像头、屏幕和本地文件,实现实时上下文感知。该框架基于三大支柱:全能感知(通过视觉语言模型融合摄像头、屏幕和语音输入)、全能记忆(从相册和会话历史中构建长期语义记忆,实现连续协助)和全能动作(通过 XML 解析、OCR 和设备端视觉执行任务,并支持行为克隆以快捷回放)。展示的能力包括通过摄像头识别产品并在淘宝上搜索、作为屏幕上的数学辅导老师,以及从相册照片中制作亮点视频。X-OmniClaw 基于 HermesApp 代码库,并受到 OpenClaw 的启发,将智能体 AI 扩展到智能手机。代码已在 GitHub 上发布,Oppo 承诺将持续更新。
关键事实
- 核心 AI 逻辑在设备端运行,仅复杂推理时调用云端。
- 利用手机摄像头、屏幕和麦克风进行实时感知。
- 从相册和会话历史构建长期语义记忆。
- 行为克隆让用户录制并通过 Android 深度链接回放导航快捷方式。
- 通过访问真实设备硬件和本地文件,优于基于云端的智能体。
KeyAudit 数据视角
📊 KeyAudit data: Base historical leak records: 377405