小编:摘要加上用户也可以使用。有一个共识是今年的大型AI主题是代理商。 摘要加上用户也可以使用。有一个共识是今年的大型AI主题是代理商。如果我们过去习惯了AI的“嘴动作”,那么下一次是“动手” AI季节。毕竟,因为AI可以理解和聪明,所以我们为什么不能完成工作? 2025年的下半年刚刚开始,定义AI的Openai突然向经纪人发布了答案。值得注意的是,乍一看,Manus模式在几个月前爆炸令人惊讶。在7月18日凌晨,Sam Altman和四名OpenAI研究人员介绍了即将推出的Openai Agent模型进行直播。简而言之,您可以在代理模式下直接提出对Chatgpt的要求:如果您缺少婚礼鞋,则可以为我购买何时在电子商务平台上为我购买;或者,为我设计宠物外围,下订单并直接打印;查找信息,并直接生成PPT。然后,Chatgpt将采用虚拟机自我并运行一个步骤。在演示中,一项复杂的任务大约需要10分钟才能完成。但是从结果来看,完成非常高。 Chatgpt可以在虚拟环境中调用文本浏览器,视觉浏览器和终端。基于终端,您甚至可以调用云服务API,图像生成器,运行代码等。更重要的是,此时,OpenAI不再是Prus用户的首选,再加上用户和用户可以快速启动,并且可以每月使用40次。大价值,丰满。山姆·奥特曼(Sam Altman)以他的签名真诚向屏幕说:这是一个全新的范式。当我们学会了浏览互联网并最终学会识别骗局信息时,当今的整个社会需要知道如何与代理商联系和协调。 01Agent模式可以做什么?直接观看Openai经纪人的演示,您会发现其直观的体验与几个月前受欢迎的手工非常相似。在用户的请求之后,virtUAL机器将自动自动,并将自动执行某些任务。在实施过程中,代理商反复要求用户在任何时候确认并允许使用MANU。同时,用户还可以在任务中间种植新的要求并与实时互动。通过引入OpenAI,代理模式可以调用Tatlong工具:文本浏览器,Visual浏览器和终端。该模型可以独立于选择和切换不同的工具。该工具的组合设计相对独特:文本的浏览器负责浏览大量文本并寻找信息,而视觉浏览器负责查找信息并直接模仿一些键和鼠标的触点,或者使用它来读取图像信息。在终端,您可以运行代码,使用PPT和Excel生成文件,并调用一些云API。研究人员建议,首先由Openaisa示威提供埃德(Ed)他们计划参加另一个朋友的婚礼,选择符合服装要求的连衣裙(考虑地点,天气,价格中期)来预订酒店,并提供礼物建议。 MA在CHATGPT代理模式下的第一个Moveresearch和上述要求。代理启动虚拟计算机并加载环境(几秒钟)。然后,Chatgpt首先尝试了文本浏览器,并打开了用户的网页以搜索婚礼信息,服装要求,天气等。发现需要进一步确认婚礼日期时,该模型还要求澄清,但用户选择让它继续自行进行理解。找到天气并放置信息后,AI开始推荐适当的衣服,然后移至视觉浏览器以检查礼服的效果。完成任务后,继续搜索酒店和礼物。可以看出,结尾处提供的婚礼旅程建议报告是V长长而细节,覆盖着礼服,酒店和礼物。附有许多链接,在线预订网站的屏幕截图也附在了是否有酒店空间的索引上。 AI只花了十分钟就完成了这样的报告。与熟悉的问答相比,它似乎更长,但是与实际的货物工作相比,AI似乎比人们更好。如果此演示仍然反映了其研究能力,则另一项演示直接展示了动手能力。研究人员要求为团队吉祥物(一只可爱的狗,名叫伯尼)制作一批笔记本贴纸,并下订单500件。代理直接使用终端函数,并调用图像Gen API提出狗样式作为贴纸的设计模式的描述。然后,代理商打开了Kathe浏览器,访问贴纸m子网站,将设计的照片上传到网站,充满了数字,尺寸等。贴纸,并在购物车中添加了产品。最后,是如果要使用此插图,它对用户积极确认?您继续下订单吗?用户是否需要输入信用卡以自己付款,或者让它继续完成?任务仍然是让用户接管持续7分钟的信用卡输入。具有相同的功能,代理还连接到Google Drive API(类似于国内网络磁盘)本身,并且在阅读文件后,它会生成PPT。审查了天气表,并形成了带有带注释的地图的详细旅行电子表格 +旅行指南。这项工作有点复杂,经纪人花了大约25分钟才能完成。 02理解:AI的功能提高了OpenAI,此时推出的代理商的新模型确实不是全新的变化,而是由OpenAI在今年上半年推出的两种工具组成:运营商和深入研究。操作员是最初向Pro用户开放的浏览器代理工具,可以研究图形操作接口并进行一些操作。在深度研究中是一种深刻的审查工具,可以阅读大量网页并直接生成研究报告。 Openai说,在启动这两个工具时,发现许多用户对运营商的快速单词实际上类似于深入的研究活动,例如“计划旅程和预订”。 In -Depth研究的用户高度要求提高“登录网站并访问受保护资源”的能力,这确实是操作员可以做的。因此,团队决定将这两种产品结合起来。它实际上与仅留在公司的Openai团队的文化很近。 Openai非常重视工程师的自我驾驶。通常有许多类似的项目同时推广,任何想做的人都可以前进。操作员和深入研究的整合似乎取得了成功。两个代理项目促进了fr最终集成了不同的角度,并进行了一些惊人的化学反应,并避免了浏览器的图形界面无用的使用仅用于读取文本材料,从而使后者的深度报告的持续时间不高。还提到了Ni Openai在提供不同的工具后如何训练模型。仍在使用加强研究。最初,该模型“笨拙”尝试解决所有工具的相对简单问题。也就是说,它一开始就不能确定哪种工具更合适。通过奖励更好,合理的行为来解决问题,该模型可以逐渐学习如何使用这些工具。在什么情况下,该工具最合适?例如,如果您创建创意作品,请首先找到公共资源;然后使用终端编写代码,并包括作品;最后使用视觉浏览器证明结果。在一堆演示中,OpenAI也被忽略了,以抛出新的基准标记。在人文学科中AST考试,可以使用浏览器,计算机和终端的代理模型获得了42%的高分,这是不使用工具的O3的两倍。这也是世界上领先的球员 - 格罗克宣布,Grok 4的工具很重,可以实现45%的测试。使用工具后的高级数学推理能力也进一步提高了。在已发表的基准测试中,与人进行了两种比较。一种是能够在网页(Webarena)上工作的能力,另一个是操作电子表格(电子表格bench)的能力。可以看出,在两个基准中,代理模型仍然不如人们好,但是网页操作已经达到了人们的水平。这意味着,即使您只包含这些工具不如人们的好处,大型模型也会达到重要的功能。 Antantesa时期,显然是提高大型模型功能的上限。 03代理人的联系时间真的来了D代理商无疑是2025年AI领域的全部趋势。但是在风暴下,用户身体的真正意义通常是不完美的:工作太长了;部分复杂的任务通常会犯错。一位早期操作员用户评论说:“每次点击和滚动都像在热气中游泳。”这次,OpenAI将操作员与深入的研究结合在一起,也许是为了减轻“粘性感觉”并允许代理商真正运行。当Openai独立结束时,一个更直接的问题在于Manus等所有第三方开发人员:ITBirth是繁荣的代理应用程序生态系统中的,还是直接崩溃了所有创业公司?答案不清楚。对于用户而言,以下是一个更个人的挑战:隐私和安全性。当AI单击网页并在我们看不到的虚拟机上输入我们的个人信息时,谁将确保安全?如果它是由我们的信用卡号被网络钓鱼网站欺骗的,谁负责? Openai回答说他们会服用O严格的调查和安全措施,但也希望整个社会可以花时间适应和建立习俗。聊天期后,代理周期实际上是完全不同的新阶段。在聊天期间,我们学会了适应AI的“嘴” - 我们逐渐习惯了幻觉,并学会了以其甜美的言语认识到真实的。这是关于“信息凭据”的挑战。在代理商期间,挑战完全转向了AI的“手”。我们需要回答一个全新的问题:我们想对AI信任多少?我们要赋予多少权威,让它做我们做多少现实世界?因此,我们与AI的关系将因此重新定义。从更宏观的角度来看,经纪人的爆炸会再次以更加清晰的方式向我们推动一个旧问题:当AI可以“工作”时,我们的工作会发生什么?当AI可以独立完成包含数据提取和图像验证的复杂报告时,并完成ONL直接预订,白色工人的工作得到了加强和加速,还是完全受到威胁?他们的答案仍在空中漂浮。但是,无论我们接受,恐惧还是混乱,更加自动代理的新时期确实在加速。 当前网址:https://www.dongfanghuayuan.com//a/keji/1060.html 你可能喜欢的: 解密游戏大全 十大经典 局部美国用户反馈三星 公路自行车喜好者戴耳 8 地下有趣的游戏是什么 情侣智能感应手环,不 喜信:珠海联通荣获 费城耳机耳机的耳机促 特斯拉 FSD 在欧洲等地 中国武汉将建世界最高