Manus是一个“智能体”人工智能平台,上周开始预览版发布,引发的热潮甚至超过了泰勒·斯威夫特(Taylor Swift)的演唱会。
Hugging Face的产品负责人称马努斯是“我用过的最令人印象深刻的人工智能工具”。人工智能政策研究员迪恩·鲍尔(Dean Ball)将马努斯描述为“最先进的AI计算机”。马努斯的官方Discord服务器在短短几天内成员数量就超过了13.8万,而据报道,马努斯的邀请码在中国二手交易应用闲鱼上的售价高达数千美元。
Manus并非完全独立开发。根据社交媒体上的报道,该平台结合使用了现有的和经过微调的人工智能模型,包括Anthropic的Claude和阿里巴巴的通义千问(Qwen),以执行撰写研究报告和分析财务文件等任务。
在X(原推特)上的一个热门视频中,Manus的研究负责人季逸超(Yichao “Peak” Ji)暗示,该平台在某些方面优于OpenAI的深度研究(deep research)和Operator等智能体工具。季逸超声称,在一个名为GAIA的通用人工智能助手流行基准测试中,马努斯的表现超过了深度研究,该测试旨在评估人工智能通过浏览网页、使用软件等方式完成任务的能力。
“Manus不仅仅是一个聊天机器人或工作流程,”季逸超在视频中表示。“它是一个完全自主的智能体,弥合了构思与执行之间的差距……我们将其视为人机协作的未来范例。”
但一些早期用户反映,Manus并非万能的解决方案。人工智能初创公司Pleias的联合创始人亚历山大·多里亚(Alexander Doria)在X上的一篇帖子中提到,他在测试Manus时遇到了错误信息和无限循环的问题。其他X用户指出,Manus在回答事实性问题时会出错,并且并不总是提供信息来源——有时还会遗漏网上容易找到的信息。
我让该平台处理一个在我看来相当简单直接的请求:从我配送范围内一家评分很高的快餐店订购一个炸鸡三明治。大约十分钟后,Manus崩溃了。第二次尝试时,它找到了一个符合我要求的菜单选项,但Manus无法完成订购流程——甚至都无法提供结账链接。
当我要求Manus预订从纽约市飞往日本的航班时,它同样表现不佳。我给出的指示在我看来是明确的(例如,“寻找商务舱航班,优先考虑价格和灵活的日期”),但Manus所能做的最好的事情就是提供几个航空公司网站和Kayak等机票搜索引擎上的票价链接,其中一些链接还是无效的。
我希望接下来的几个任务能有好的结果,于是我让Manus在步行距离内的一家餐厅预订一张单人桌。几分钟后它失败了。然后我要求该平台开发一款以《火影忍者》为灵感的格斗游戏。半小时后它出错,这时我决定放弃。
Manus的一位发言人通过私信向TechCrunch发送了以下声明:“作为一个小团队,我们的重点是不断改进Manus,打造真正能帮助用户解决问题的人工智能智能体……当前封闭测试版的主要目标是对系统的各个部分进行压力测试并找出问题。我们非常感谢大家提供的宝贵见解。”
那么,如果Manus未能兑现其技术承诺,为何它会如此受欢迎呢?有几个因素促成了这一点,包括邀请码稀缺所营造的排他性。有些媒体迅速将Manus吹捧为一项人工智能突破;称它为“国货之光”。与此同时,社交媒体上的人工智能影响力人士传播了关于Manus能力的错误信息。一个广泛传播的视频展示了一个桌面程序,表面上看是Manus,它在多个智能手机应用上执行操作。季逸超证实,该视频实际上并不是Manus的演示。
X上的其他有影响力的人工智能账号试图将Manus与中国人工智能公司DeepSeek进行比较——这些比较并不一定基于事实。与DeepSeek不同,蝶变效应没有开发任何内部模型。而且,尽管DeepSeek公开了许多技术,但Manus至少目前还没有。
公平地说,对于蝶变效应而言,Manus目前还处于非常早期的使用阶段。该公司表示正在努力扩大计算能力,并在问题被报告时及时修复。但就目前这个平台而言,Manus似乎是一个炒作先行于技术创新的案例。