MiniCPM5-1B:最小智能体模型性能领先,可手机运行,仍有幻觉
OpenBMB 推出的 MiniCPM5-1B 是一款 10 亿参数的模型,在智能体和推理基准测试中平均得分 42.57,领先于同类最佳模型的 35.61。它原生支持工具调用和模型上下文协议(MCP),可在消费级硬件上本地运行智能体工作流,无需云连接。该模型采用 InfLLM v2 注意力机制高效处理长上下文,上下文窗口达 128K token(约 96000 单词)。后训练阶段通过强化学习和知识蒸馏将基准分数提升了 16 个百分点。测试中,MiniCPM5-1B 表现出较强的对话流畅性,但在经典逻辑陷阱(与寡妇的妹妹结婚)中失败,并在二选一问题上含糊其辞。然而,与 MCP 服务器配合时,提供比特币价格和股票推荐等智能体任务表现良好。该模型已在 Hugging Face 上以 Apache 2.0 许可证发布。
关键事实
- MiniCPM5-1B 基准测试平均分 42.57,领先其他 1B 模型。
- 原生支持工具调用和 MCP,可实现离线智能体工作流。
- 128K token 上下文窗口支持长对话和文档处理。
- 在经典逻辑陷阱和二选一测试中表现不佳。
- 在 Hugging Face 以 Apache 2.0 许可证发布。
KeyAudit 数据视角
📊 KeyAudit 数据库:比特币 历史泄露记录 2550869 条