2026-05-28 · 来源: Decrypt Security

MiniCPM5-1B：最小智能体模型性能领先，可手机运行，仍有幻觉

OpenBMB 推出的 MiniCPM5-1B 是一款 10 亿参数的模型，在智能体和推理基准测试中平均得分 42.57，领先于同类最佳模型的 35.61。它原生支持工具调用和模型上下文协议（MCP），可在消费级硬件上本地运行智能体工作流，无需云连接。该模型采用 InfLLM v2 注意力机制高效处理长上下文，上下文窗口达 128K token（约 96000 单词）。后训练阶段通过强化学习和知识蒸馏将基准分数提升了 16 个百分点。测试中，MiniCPM5-1B 表现出较强的对话流畅性，但在经典逻辑陷阱（与寡妇的妹妹结婚）中失败，并在二选一问题上含糊其辞。然而，与 MCP 服务器配合时，提供比特币价格和股票推荐等智能体任务表现良好。该模型已在 Hugging Face 上以 Apache 2.0 许可证发布。

关键事实

MiniCPM5-1B 基准测试平均分 42.57，领先其他 1B 模型。
原生支持工具调用和 MCP，可实现离线智能体工作流。
128K token 上下文窗口支持长对话和文档处理。
在经典逻辑陷阱和二选一测试中表现不佳。
在 Hugging Face 以 Apache 2.0 许可证发布。

KeyAudit 数据视角

📊 KeyAudit 数据库：比特币历史泄露记录 2550869 条

阅读原文 →

MiniCPM5-1B：最小智能体模型性能领先，可手机运行，仍有幻觉

关键事实

KeyAudit 数据视角

相关情报