刚才，Openai发布了自己的代理模式Manus风格_pg娱乐电子游戏

小编：摘要加上用户也可以使用。有一个共识是今年的大型AI主题是代理商。

摘要加上用户也可以使用。有一个共识是今年的大型AI主题是代理商。如果我们过去习惯了AI的“嘴动作”，那么下一次是“动手” AI季节。毕竟，因为AI可以理解和聪明，所以我们为什么不能完成工作？ 2025年的下半年刚刚开始，定义AI的Openai突然向经纪人发布了答案。值得注意的是，乍一看，Manus模式在几个月前爆炸令人惊讶。在7月18日凌晨，Sam Altman和四名OpenAI研究人员介绍了即将推出的Openai Agent模型进行直播。简而言之，您可以在代理模式下直接提出对Chatgpt的要求：如果您缺少婚礼鞋，则可以为我购买何时在电子商务平台上为我购买；或者，为我设计宠物外围，下订单并直接打印；查找信息，并直接生成PPT。然后，Chatgpt将采用虚拟机自我并运行一个步骤。在演示中，一项复杂的任务大约需要10分钟才能完成。但是从结果来看，完成非常高。 Chatgpt可以在虚拟环境中调用文本浏览器，视觉浏览器和终端。基于终端，您甚至可以调用云服务API，图像生成器，运行代码等。更重要的是，此时，OpenAI不再是Prus用户的首选，再加上用户和用户可以快速启动，并且可以每月使用40次。大价值，丰满。山姆·奥特曼（Sam Altman）以他的签名真诚向屏幕说：这是一个全新的范式。当我们学会了浏览互联网并最终学会识别骗局信息时，当今的整个社会需要知道如何与代理商联系和协调。 01Agent模式可以做什么？直接观看Openai经纪人的演示，您会发现其直观的体验与几个月前受欢迎的手工非常相似。在用户的请求之后，virtUAL机器将自动自动，并将自动执行某些任务。在实施过程中，代理商反复要求用户在任何时候确认并允许使用MANU。同时，用户还可以在任务中间种植新的要求并与实时互动。通过引入OpenAI，代理模式可以调用Tatlong工具：文本浏览器，Visual浏览器和终端。该模型可以独立于选择和切换不同的工具。该工具的组合设计相对独特：文本的浏览器负责浏览大量文本并寻找信息，而视觉浏览器负责查找信息并直接模仿一些键和鼠标的触点，或者使用它来读取图像信息。在终端，您可以运行代码，使用PPT和Excel生成文件，并调用一些云API。研究人员建议，首先由Openaisa示威提供埃德（Ed）他们计划参加另一个朋友的婚礼，选择符合服装要求的连衣裙（考虑地点，天气，价格中期）来预订酒店，并提供礼物建议。 MA在CHATGPT代理模式下的第一个Moveresearch和上述要求。代理启动虚拟计算机并加载环境（几秒钟）。然后，Chatgpt首先尝试了文本浏览器，并打开了用户的网页以搜索婚礼信息，服装要求，天气等。发现需要进一步确认婚礼日期时，该模型还要求澄清，但用户选择让它继续自行进行理解。找到天气并放置信息后，AI开始推荐适当的衣服，然后移至视觉浏览器以检查礼服的效果。完成任务后，继续搜索酒店和礼物。可以看出，结尾处提供的婚礼旅程建议报告是V长长而细节，覆盖着礼服，酒店和礼物。附有许多链接，在线预订网站的屏幕截图也附在了是否有酒店空间的索引上。 AI只花了十分钟就完成了这样的报告。与熟悉的问答相比，它似乎更长，但是与实际的货物工作相比，AI似乎比人们更好。如果此演示仍然反映了其研究能力，则另一项演示直接展示了动手能力。研究人员要求为团队吉祥物（一只可爱的狗，名叫伯尼）制作一批笔记本贴纸，并下订单500件。代理直接使用终端函数，并调用图像Gen API提出狗样式作为贴纸的设计模式的描述。然后，代理商打开了Kathe浏览器，访问贴纸m子网站，将设计的照片上传到网站，充满了数字，尺寸等。贴纸，并在购物车中添加了产品。最后，是如果要使用此插图，它对用户积极确认？您继续下订单吗？用户是否需要输入信用卡以自己付款，或者让它继续完成？任务仍然是让用户接管持续7分钟的信用卡输入。具有相同的功能，代理还连接到Google Drive API（类似于国内网络磁盘）本身，并且在阅读文件后，它会生成PPT。审查了天气表，并形成了带有带注释的地图的详细旅行电子表格 +旅行指南。这项工作有点复杂，经纪人花了大约25分钟才能完成。 02理解：AI的功能提高了OpenAI，此时推出的代理商的新模型确实不是全新的变化，而是由OpenAI在今年上半年推出的两种工具组成：运营商和深入研究。操作员是最初向Pro用户开放的浏览器代理工具，可以研究图形操作接口并进行一些操作。在深度研究中是一种深刻的审查工具，可以阅读大量网页并直接生成研究报告。 Openai说，在启动这两个工具时，发现许多用户对运营商的快速单词实际上类似于深入的研究活动，例如“计划旅程和预订”。 In -Depth研究的用户高度要求提高“登录网站并访问受保护资源”的能力，这确实是操作员可以做的。因此，团队决定将这两种产品结合起来。它实际上与仅留在公司的Openai团队的文化很近。 Openai非常重视工程师的自我驾驶。通常有许多类似的项目同时推广，任何想做的人都可以前进。操作员和深入研究的整合似乎取得了成功。两个代理项目促进了fr最终集成了不同的角度，并进行了一些惊人的化学反应，并避免了浏览器的图形界面无用的使用仅用于读取文本材料，从而使后者的深度报告的持续时间不高。还提到了Ni Openai在提供不同的工具后如何训练模型。仍在使用加强研究。最初，该模型“笨拙”尝试解决所有工具的相对简单问题。也就是说，它一开始就不能确定哪种工具更合适。通过奖励更好，合理的行为来解决问题，该模型可以逐渐学习如何使用这些工具。在什么情况下，该工具最合适？例如，如果您创建创意作品，请首先找到公共资源；然后使用终端编写代码，并包括作品；最后使用视觉浏览器证明结果。在一堆演示中，OpenAI也被忽略了，以抛出新的基准标记。在人文学科中AST考试，可以使用浏览器，计算机和终端的代理模型获得了42％的高分，这是不使用工具的O3的两倍。这也是世界上领先的球员 - 格罗克宣布，Grok 4的工具很重，可以实现45％的测试。使用工具后的高级数学推理能力也进一步提高了。在已发表的基准测试中，与人进行了两种比较。一种是能够在网页（Webarena）上工作的能力，另一个是操作电子表格（电子表格bench）的能力。可以看出，在两个基准中，代理模型仍然不如人们好，但是网页操作已经达到了人们的水平。这意味着，即使您只包含这些工具不如人们的好处，大型模型也会达到重要的功能。 Antantesa时期，显然是提高大型模型功能的上限。 03代理人的联系时间真的来了D代理商无疑是2025年AI领域的全部趋势。但是在风暴下，用户身体的真正意义通常是不完美的：工作太长了；部分复杂的任务通常会犯错。一位早期操作员用户评论说：“每次点击和滚动都像在热气中游泳。”这次，OpenAI将操作员与深入的研究结合在一起，也许是为了减轻“粘性感觉”并允许代理商真正运行。当Openai独立结束时，一个更直接的问题在于Manus等所有第三方开发人员：ITBirth是繁荣的代理应用程序生态系统中的，还是直接崩溃了所有创业公司？答案不清楚。对于用户而言，以下是一个更个人的挑战：隐私和安全性。当AI单击网页并在我们看不到的虚拟机上输入我们的个人信息时，谁将确保安全？如果它是由我们的信用卡号被网络钓鱼网站欺骗的，谁负责？ Openai回答说他们会服用O严格的调查和安全措施，但也希望整个社会可以花时间适应和建立习俗。聊天期后，代理周期实际上是完全不同的新阶段。在聊天期间，我们学会了适应AI的“嘴” - 我们逐渐习惯了幻觉，并学会了以其甜美的言语认识到真实的。这是关于“信息凭据”的挑战。在代理商期间，挑战完全转向了AI的“手”。我们需要回答一个全新的问题：我们想对AI信任多少？我们要赋予多少权威，让它做我们做多少现实世界？因此，我们与AI的关系将因此重新定义。从更宏观的角度来看，经纪人的爆炸会再次以更加清晰的方式向我们推动一个旧问题：当AI可以“工作”时，我们的工作会发生什么？当AI可以独立完成包含数据提取和图像验证的复杂报告时，并完成ONL直接预订，白色工人的工作得到了加强和加速，还是完全受到威胁？他们的答案仍在空中漂浮。但是，无论我们接受，恐惧还是混乱，更加自动代理的新时期确实在加速。

当前网址：https://www.dongfanghuayuan.com//a/keji/1060.html

你可能喜欢的：