多伦多 六六网  www.66.ca

 找回密码
 立即注册

扫描二维码登录本站

搜索

炒到10万,一夜爆火的Manus却不好用

2025-3-8 07:06 PM| 发布者: 梦里花落知多少| 查看: 169| 评论: 0

近日,自称“全球第一款通用AI Agent产品”的Manus一夜之间爆火。

其宣称性能“吊打”Open AI同款,邀请码被炒至天价,甚至能卖到9万、10万元一个。

Manus火得突如其来,但不算莫名其妙。

火的原因有两点,一是多家造势,风很大,但实测的人少,神秘感强,叠加“本土团队”光环,又是一个后来居上的案例;二是大模型的好,大家都见识了,但一直停留在聊天上。现在急需趁手的聚合式工具,把脑子里的想法变变现。

忽然,说曹操曹操就到,正中下怀。

聚合式工具也没那么玄妙,相当于“高德打车”吧。

Manus是什么?行内叫智能体(Agent),通俗点可以叫“工具人”。这个工具人就是以大模型为“大脑”,自己“动手”使用工具来完成任务。Manus英文就是“手”的意思。

有代表性的工具人当属OpenAI的深度研究(Deep Research)和Anthropic的计算机应用(Computer Use)。以实测结果来看,Manus达不到宣传片里的效果:幻觉较多,任务基本以失败告终。

炒到10万,一夜爆火的Manus却不好用

在二手平台上,Manus邀请码最贵已被炒至10万元级别

炒到10万,一夜爆火的Manus却不好用

产品官网显示,在GAIA基准测试(评估通用AI助手解决真实世界问题的能力)中,Manus在所有三个难度级别上,都取得了新的最先进(SOTA)表现关键,是不是“工具人”,要看它是不是真的能自行决定怎么完成任务、挑什么工具,而不是靠编好的代码。

Manus目前未有任何信息能证明自己是真正的智能体——没有人为设计的工作流程。因此,只能说它在宣传里呈现出“智能体”或通用人工智能(AGI)的样子,并围绕这一概念作文章。

而Manus也绝非一无是处。作为一款应用,界面简洁友好;大脑(思考)、手(操作)、交付的层次非常清晰,组合起来也是相对合格的当代“牛马”,还是能帮你提高一点生产力。

下文将举例说明Manus如何完成工作任务、优势和局限以及技术逻辑是什么。省流版:别花好几万买什么邀请码,一个“毛坯房”不值得。

“工具人”绝不能纯聊天,不干活儿,专业工具人都是一边聊一边干:左面对话框,右面操作台。Manus和Claude的界面都是如此。

根据“我有一个朋友”的实测,给Manus由浅入深地提了几个独立的要求,比如写小说,给苹果股价建模,写一个游戏等等,结果不太乐观。

整个流程是这样的:用户在对话框里发布指令,Manus在操作台一顿输出,用户可以清晰地看到Manus使用工具的过程,并接收它的操作结果。

Manus的操作流程展示

收到指令后,Manus是这样使用工具的:

首先,建立一个总文件夹写明“大目标”,再建立多个清单式的子文件夹,将任务分解,最后逐一完成子文件夹的“小目标”。完成小目标时,它可能在浏览器一通搜索,也可能写一段代码。

也就是说,Manus主要工具就三种,浏览器工具(Agent),计算机语言Python和一部分命令行。

其次,利用超文本标记语言HTML来输出“结果”。

也就是说,Manus用网页呈现所有的结果。

有人问,它不是做了10页PPT给我了吗?这也是Manus“聪明”的地方,其实它没有PPT工具,为了你的PPT,它用前端工具写了一大堆页面,通过命令行把前端页面打包成一个压缩包,下载下来是一堆前端网站,每个前端网站就是一页PPT——虽然甲方很过分,但乙方还是出色地完成了任务。

在具体测试Manus的过程中,有两个问题明显暴露。

一是浏览器工具的局限。

遇到反爬虫网站或需要人机验证的网站,它根本无法读取数据。比如,你想要在多个购物网站比价一款手机,进不去的网站它只能作罢,最后给出的是在搜索页标题里找出来的价格的比较。总之,它给出的结果非常粗糙,根本达不到你想要的结果。

这也是浏览器工具的通病。Open AI给出过统计数据,其浏览器Agent在数据集上只能完成58.1%的任务,而人类能完成78.2%,差距是巨大的。

但是,Open AI的浏览器工具能力还是不差的,能帮人订餐厅,买机票。而Manus的浏览器工具只能打开页面,下滑,极少数时候点进某个网页。因此,Manus应该没有训练自己的浏览器Agent,仅能做一些初步的简单工作。

炒到10万,一夜爆火的Manus却不好用

Manus官方展示的买房案例

而且,Manus选择工具也有局限。它有时非常豪爽地用Next.js写代码,这是一个全栈项目,前后端都能用的那种。但是Manus又没有部署后端的能力,各种报错之后陷入“深深的思索”。

二是幻觉严重。

比如给苹果公司做财务估值,Manus这次没有利用浏览器搜索,而是写了一个Python脚本,在脚本里调用“雅虎金融”的接口来读取公司相关数据。

然而,在实际过程中,它并没有提供真实数据,而是撰写了一堆模拟数据——也就是自己编的数据。反查它的操作流程,确实没有调用过任何API,也没有任何搜索过程,幻觉是比较严重的。

它最后给出的报告,当然也是完全不能用的。

Manus可以打开Python进行分析,并生成HTML网页文件

在处理任务时,Manus普遍将大模型和Python脚本混在一起操作,上下文极长,更容易产生错误。用户如果不留心或缺乏分辨能力,也更容易被“蒙骗”。

Manus AI创始人肖弘在接受采访时,提到了理解智能体的核心:虚拟机。

其实,智能体应该是一个“DeepSeek”+“我”的东西。这里的“我”是执行角色。

在没有智能体之前,我布置任务,大模型思考目标、分解步骤,“我”来执行并拿到结果。有了智能体之后,我布置任务,智能体直接给我结果。

就像我需要10页PPT,DeepSeek给我写好每一页内容,“我”复制到PPT里。现在,我需要10页PPT,智能体就给了我10页PPT。

Manus团队北京办公园区入口 新京报记者 浦峰/摄

本来需要我使用电脑(做PPT),现在是大模型在使用我的电脑(做PPT)。

这就是智能体的本质。

如果用的是软件搭出来的硬件系统,那么这个智能体就是大模型+虚拟机。

如果直接调用现实中的电脑,那么这个智能体就是大模型+计算机。一年前Claude就能拿用户的电脑做网页了。

这是因为现在大模型还较难真正接入物理世界,只能在“真假”计算机上下功夫。如果万物互联,“大模型+锅碗瓢盆”可能直接把餐饮业干倒闭了,当然倒闭的肯定也不只一个行业了。这是后话。

智能体的背后,是“模型即产品”的思路。

正如Open AI的深度研究,Anthropic的计算机应用,都不再套用自家的通用模型,而是根据应用场景,训练全新的强化模型,这个强化模型本身就是一个好用的产品。

反过来看Manus,当然是没有自家的大模型,也缺乏专门训练的相关工具,但是聚合的思路和表现形式很成功,也将大模型“纯文本工作”——写代码、写文字的优势,通过网页交付清晰地展示了出来。

在训练模型的逻辑上,Manus可能也并没有实现Claude人、大模型、环境三者即时反馈的简洁模式,而依然遵循之前人、大模型、任务分解、工具使用、进程演化、目标达成等复杂结构。

炒到10万,一夜爆火的Manus却不好用

Manus AI合伙人张涛在社交平台回应称,“目前采取邀请码机制,是因为此刻服务器容量确实有限”

在DeepSeek非常成功的今天,发展智能体是顺应了形势的需要、大众的需求。各家AI公司都希望抓住这个机会来发力。抢占流量也是发力的一部分。

对于普通消费者而言,最重要的还是多观察,多了解,别急着掏钱。人工智能不会毁灭你的生活,但是焦虑会。


鲜花

握手

雷人

路过

鸡蛋

最新评论

联系电话:647-830-8888|多伦多六六网 www.66.ca

GMT-5, 2025-3-9 08:25 AM , Processed in 0.044486 second(s), 23 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部