
智谱、openai“较上劲”!ai智能体又进化了:微信拜年、操作电脑不在话下
来源: 财联社 作者:《每日财讯网》编辑 发布时间:2025-01-27
春节将至,年味儿渐浓,ai给出了拜年新思路,让ai智能体(ai agent)送上春节祝福,一句话就能实现——
据自媒体测试,给ai下达“给群里所有人发送新春祝福语”的任务后,ai为该微信群的各位定制了不一样贺词,且“细心”附上了对方名字,无需手动操作便完成发送。


用glm-pc发定制化新春祝贺时glm-pc的思考过程
这番操作出自智谱刚上线的电脑智能体glm-pc。
1月23日,智谱正式上线glm-pc。据介绍,glm-pc是基于智谱多模态大模型 cogagent,全球首个面向公众、回车即用的电脑智能体(agent)。它能像人类一样“观察”和“操作”计算机,协助用户高效完成各类电脑任务。glm-pc还推出了深度思考模式,并新增逻辑推理和代码生成功能。

2024年10月,智谱发布的手机版智能体autoglm火速出圈,跟手机端的autoglm不一样,glm-pc引入了代码机制,而在深度思考模式下,glm-pc接收任务后会生成一套非常详细的思维链,再去执行,代码式的思维链可进一步强化glm-pc对复杂任务的规划、推理、和反思的能力。
目前,glm-pc的window和mac客户端已同步上线。智谱表示,正与联想、华硕等知名pc 厂商展开深度合作探讨,共同推动aipc的创新与发展。
晚些时候,openai的ai智能体operator在北京时间1月24日凌晨亮相,它能够代理用户执行基于网页的操作,直接与网页交互——像人类一样点击、滚动和输入文字,自动执行各种复杂操作,包括编写代码、预订餐厅、购物等。后续的部分用户测试显示,operator还可以完成在arxiv上进行论文分类搜索,阅读多篇论文并完成综述整理的复杂工作。


用operator预定餐厅

用operator买菜
与智谱的深度思考模式类似,operator可通过新模型“计算机使用智能体”(computer-using agent,简称cua)的系统进行复杂的思维链反思和步骤规划,cua结合了高级的图形用户界面感知能力与结构化的问题解决能力,能够将任务分解为多步骤计划,并在遇到挑战时自我调整和纠正,大大提高了operator完成任务的精度和复杂性。
目前,openai的“operator”智能体以“研究预览”(research preview)的形式向美国的chatgpt pro用户开放。(小k注:chatgpt pro的订阅费用为每月200美元,该服务专为需要高级ai功能的专业用户设计,提供无限制访问包括gpt-4o和o1在内的高级模型)
openai表示还将扩展智能体的动作空间,在接下来几周/几个月内推出更多的智能体。此外,其还计划开放api接口,让开发者能够基于cua构建自定义的计算机智能体。
2025智能体元年?
openai总裁greg brockman为operator打call并强调,“2025年是智能体之年”。

openai曾被曝出内部agi路线图,将这一终极目标的实现划分了五级。目前openai正向ai智能体,即l3级迈进(代理者,可以采取行动的系统)。
2024年,智谱同样将agi的实现划分了5级。智谱ceo张鹏在agent open day上再次阐述了公司对ai能力演进的战略构想——截至目前,llm已经初步具备了人类与现实物理世界互动的部分能力,智能体将会极大地提升l3使用工具能力,同时开启对l4自我学习能力的探索。
无论是智谱还是openai,其智能体最大的独特之处在于具备独立思考、调用工具的能力。对于普通用户而言,其最核心的功能是ai自主操作硬件设备,辅助完成复杂推理任务。
手机上的智能体能够精准操控各类应用,实现跨场景智能交互;电脑端的智能体被训练用于与图形用户界面gui(在屏幕上看到的按钮、菜单和文本框)进行交互,意味ai能适应几乎所有的计算机环境,进一步凸显了ai玩转各类操作系统的能力。
另据《科创板日报》不完全梳理,谷歌、微软、anthropic在内的头部厂商正争先推出ai智能体产品——
微软在其dynamics365平台一口气推出10个自主ai智能体,称相当于187名全职员工的产出;
谷歌发布号称“智能体时代”最强大模型gemini 2,提供多模态开发接口,让智能体能“看懂”物理世界;
anthropic为大模型claude迭代了新功能——computer use,让ai可以像人一样操控电脑。claude3.5 sonnet是首个支持计算机控制的模型,能够模拟人类操作计算机,包括移动光标、点击按钮和输入文本;
华为公布了一项可让ai像人类一样操作手机的新研究成果,相关团队提出了一个手机控制架构:lightweight multi-modal app control(轻量级多模态应用控制,简称limac)。
华创证券表示,随着ai技术的不断进步,ai agent已经不再局限于简单的任务执行,当前正逐步实现从0到1的跨越式创新。众多企业和研究机构投入研发,推出创新产品。行业结构初步形成,相关产业链和生态系统逐渐完善。根据root analysis,预计全球ai代理市场规模将从2024年的52.9亿美元增长到2035年的2168亿美元,2024-2035年预测期内的复合年增长率为40.15%。
天风证券表示,展望2025年,ai agent和推理需求的指数级增长有望引领规模化ai应用元年,持续推动软件产品能力边界的拓展,赋能企业实现更高效的运营和成本优化。以字节跳动为代表的企业通过豆包ai等核心产品的广泛应用,率先全面布局ai市场,显著提升推理能力和多场景适配性,为国内ai agent技术实践提供了落地基础。结合大模型与aiagent未来的技术进步,智能化应用场景加速拓展,助力企业级市场实现降本增效。这一现象将引领tobsaas行业迎来新一轮成长机遇,为中国软件行业在未来五年孕育出一批高成长型红利企业奠定基础。
中国银河证券表示,ai agent将是通往通用人工智能时代的必经之路,大模型快速迭代升级推动ai agent能力提升,长期来看ai agent关键在于推理能力,未来ai agent广泛渗透时,对于推理算力的需求将是指数级爆发增长。
责任编辑:《每日财讯网》编辑
下一篇:没有了!

〖免责申明〗本文仅代表作者个人观点,其图片及内容凯发棋牌的版权仅归原所有者所有。如对该内容主张权益请来函或邮件告之,本网将迅速采取措施,否则与之相关的纠纷本网不承担任何责任。