多伦多六六网 www.66.ca › 多伦多新闻 ›娱乐热点 › 查看内容

炒到10万，一夜爆火的Manus却不好用

2025-3-8 07:06 PM| 发布者: 梦里花落知多少| 查看: 169| 评论: 0

近日，自称“全球第一款通用AI Agent产品”的Manus一夜之间爆火。

其宣称性能“吊打”Open AI同款，邀请码被炒至天价，甚至能卖到9万、10万元一个。

Manus火得突如其来，但不算莫名其妙。

火的原因有两点，一是多家造势，风很大，但实测的人少，神秘感强，叠加“本土团队”光环，又是一个后来居上的案例；二是大模型的好，大家都见识了，但一直停留在聊天上。现在急需趁手的聚合式工具，把脑子里的想法变变现。

忽然，说曹操曹操就到，正中下怀。

聚合式工具也没那么玄妙，相当于“高德打车”吧。

Manus是什么？行内叫智能体（Agent），通俗点可以叫“工具人”。这个工具人就是以大模型为“大脑”，自己“动手”使用工具来完成任务。Manus英文就是“手”的意思。

有代表性的工具人当属OpenAI的深度研究（Deep Research）和Anthropic的计算机应用（Computer Use）。以实测结果来看，Manus达不到宣传片里的效果：幻觉较多，任务基本以失败告终。

炒到10万，一夜爆火的Manus却不好用

在二手平台上，Manus邀请码最贵已被炒至10万元级别

炒到10万，一夜爆火的Manus却不好用

产品官网显示，在GAIA基准测试（评估通用AI助手解决真实世界问题的能力）中，Manus在所有三个难度级别上，都取得了新的最先进（SOTA）表现关键，是不是“工具人”，要看它是不是真的能自行决定怎么完成任务、挑什么工具，而不是靠编好的代码。

Manus目前未有任何信息能证明自己是真正的智能体——没有人为设计的工作流程。因此，只能说它在宣传里呈现出“智能体”或通用人工智能（AGI）的样子，并围绕这一概念作文章。

而Manus也绝非一无是处。作为一款应用，界面简洁友好；大脑（思考）、手（操作）、交付的层次非常清晰，组合起来也是相对合格的当代“牛马”，还是能帮你提高一点生产力。

下文将举例说明Manus如何完成工作任务、优势和局限以及技术逻辑是什么。省流版：别花好几万买什么邀请码，一个“毛坯房”不值得。

“工具人”绝不能纯聊天，不干活儿，专业工具人都是一边聊一边干：左面对话框，右面操作台。Manus和Claude的界面都是如此。

根据“我有一个朋友”的实测，给Manus由浅入深地提了几个独立的要求，比如写小说，给苹果股价建模，写一个游戏等等，结果不太乐观。

整个流程是这样的：用户在对话框里发布指令，Manus在操作台一顿输出，用户可以清晰地看到Manus使用工具的过程，并接收它的操作结果。

Manus的操作流程展示

收到指令后，Manus是这样使用工具的：

首先，建立一个总文件夹写明“大目标”，再建立多个清单式的子文件夹，将任务分解，最后逐一完成子文件夹的“小目标”。完成小目标时，它可能在浏览器一通搜索，也可能写一段代码。

也就是说，Manus主要工具就三种，浏览器工具（Agent），计算机语言Python和一部分命令行。

其次，利用超文本标记语言HTML来输出“结果”。

也就是说，Manus用网页呈现所有的结果。

有人问，它不是做了10页PPT给我了吗？这也是Manus“聪明”的地方，其实它没有PPT工具，为了你的PPT，它用前端工具写了一大堆页面，通过命令行把前端页面打包成一个压缩包，下载下来是一堆前端网站，每个前端网站就是一页PPT——虽然甲方很过分，但乙方还是出色地完成了任务。

在具体测试Manus的过程中，有两个问题明显暴露。

一是浏览器工具的局限。

遇到反爬虫网站或需要人机验证的网站，它根本无法读取数据。比如，你想要在多个购物网站比价一款手机，进不去的网站它只能作罢，最后给出的是在搜索页标题里找出来的价格的比较。总之，它给出的结果非常粗糙，根本达不到你想要的结果。

这也是浏览器工具的通病。Open AI给出过统计数据，其浏览器Agent在数据集上只能完成58.1%的任务，而人类能完成78.2%，差距是巨大的。

但是，Open AI的浏览器工具能力还是不差的，能帮人订餐厅，买机票。而Manus的浏览器工具只能打开页面，下滑，极少数时候点进某个网页。因此，Manus应该没有训练自己的浏览器Agent，仅能做一些初步的简单工作。

炒到10万，一夜爆火的Manus却不好用

Manus官方展示的买房案例

而且，Manus选择工具也有局限。它有时非常豪爽地用Next.js写代码，这是一个全栈项目，前后端都能用的那种。但是Manus又没有部署后端的能力，各种报错之后陷入“深深的思索”。

二是幻觉严重。

比如给苹果公司做财务估值，Manus这次没有利用浏览器搜索，而是写了一个Python脚本，在脚本里调用“雅虎金融”的接口来读取公司相关数据。

然而，在实际过程中，它并没有提供真实数据，而是撰写了一堆模拟数据——也就是自己编的数据。反查它的操作流程，确实没有调用过任何API，也没有任何搜索过程，幻觉是比较严重的。

它最后给出的报告，当然也是完全不能用的。

Manus可以打开Python进行分析，并生成HTML网页文件

在处理任务时，Manus普遍将大模型和Python脚本混在一起操作，上下文极长，更容易产生错误。用户如果不留心或缺乏分辨能力，也更容易被“蒙骗”。

Manus AI创始人肖弘在接受采访时，提到了理解智能体的核心：虚拟机。

其实，智能体应该是一个“DeepSeek”+“我”的东西。这里的“我”是执行角色。

在没有智能体之前，我布置任务，大模型思考目标、分解步骤，“我”来执行并拿到结果。有了智能体之后，我布置任务，智能体直接给我结果。

就像我需要10页PPT，DeepSeek给我写好每一页内容，“我”复制到PPT里。现在，我需要10页PPT，智能体就给了我10页PPT。

Manus团队北京办公园区入口新京报记者浦峰/摄

本来需要我使用电脑（做PPT），现在是大模型在使用我的电脑（做PPT）。

这就是智能体的本质。

如果用的是软件搭出来的硬件系统，那么这个智能体就是大模型+虚拟机。

如果直接调用现实中的电脑，那么这个智能体就是大模型+计算机。一年前Claude就能拿用户的电脑做网页了。

这是因为现在大模型还较难真正接入物理世界，只能在“真假”计算机上下功夫。如果万物互联，“大模型+锅碗瓢盆”可能直接把餐饮业干倒闭了，当然倒闭的肯定也不只一个行业了。这是后话。

智能体的背后，是“模型即产品”的思路。

正如Open AI的深度研究，Anthropic的计算机应用，都不再套用自家的通用模型，而是根据应用场景，训练全新的强化模型，这个强化模型本身就是一个好用的产品。

反过来看Manus，当然是没有自家的大模型，也缺乏专门训练的相关工具，但是聚合的思路和表现形式很成功，也将大模型“纯文本工作”——写代码、写文字的优势，通过网页交付清晰地展示了出来。

在训练模型的逻辑上，Manus可能也并没有实现Claude人、大模型、环境三者即时反馈的简洁模式，而依然遵循之前人、大模型、任务分解、工具使用、进程演化、目标达成等复杂结构。

炒到10万，一夜爆火的Manus却不好用

Manus AI合伙人张涛在社交平台回应称，“目前采取邀请码机制，是因为此刻服务器容量确实有限”

在DeepSeek非常成功的今天，发展智能体是顺应了形势的需要、大众的需求。各家AI公司都希望抓住这个机会来发力。抢占流量也是发力的一部分。

对于普通消费者而言，最重要的还是多观察，多了解，别急着掏钱。人工智能不会毁灭你的生活，但是焦虑会。

鲜花

握手

雷人

路过

鸡蛋

收藏分享邀请

上一篇：生涯首次郑钦文战胜前世界第一阿扎伦卡下一篇：54岁杨钰莹现身广东，皮肤超好，娇俏如少女

		自动登录	找回密码
密码			立即注册


微信热文	闲聊灌水	时政热点	生活情感	交友聚会	娱乐活动	吃喝玩乐	购物省钱	移民留学	安家置业
投资理财	就业创业	亲子宝贝	学习教育	美食厨房	保健医疗	旅游胜地	汽车天下	体育健身	AI智能

炒到10万，一夜爆火的Manus却不好用

最新评论

相关分类