发布日期:2026-01-02 15:48 点击次数:147
开yun体育网
着手:猎云网
东谈主类与机器的互动花样正在发生范式挪动。这是由于只消对话功能的 Chatbot,正在进化为"有手、有脑、有眼睛"的自主 Agent。
11 月 29 日,当作最早探索 Agent 的大模子企业之一,智谱带来了多个新进展:
AutoGLM 不错自主推行朝上 50 步的长顺序操作,也不错跨 APP 推行任务;
AutoGLM 开启"全自动"上网新体验,撑握等数十个网站的无东谈主驾驶;
像东谈主相同操作狡计机的 GLM-PC 启动内测,基于视觉多模态模子完毕通用 Agent 的本事探索。
在 Agent OpenDay 现场,智谱 CEO 张鹏下达了一个简便语音提醒,AutoGLM 便给在场数百位嘉宾发送了"一个来自 AI 的微信红包"。此外,AutoGLM 还不错通过手机,云尔指引电脑自动发送文献。

AutoGLM 新升级:挑战更复杂
新升级的 AutoGLM 不错挑战完成复杂任务:
1. 超长任务:贯串超长提醒,推行超长任务。举例,在采购暖锅食材的例子中,AutoGLM 自主推行了 54 步无打断操作。况兼,在这种多步、轮回任务中,AutoGLM 的速率发达朝上东谈主手动操作。
2. 跨 App:AutoGLM 撑握跨 App 来推行任务。用户将民风于 AI 自动科罚,而不是在多个 App 间往来切换。由于目下 AutoGLM 形态更像是用户和诓骗间的 App 推行的治愈层,因此跨 App 身手是内部相称要津的一步。
3. 短口令:AutoGLM 粗糙撑握长任务的自界说短语。今天,你无须再给 AutoGLM 说:"帮我买一杯瑞幸咖啡,生椰拿铁,五谈口店,大杯、热、微糖" 这类超长提醒,只需要说"点咖啡"。
4. 粗率模式:咱们齐会堕入采选懦弱,AutoGLM 今天不错主动帮你作念出决议。粗率模式下所有顺序齐让 AI 决议,带来有抽盲盒式的惊喜。想不想尝尝 AI 为你点的咖啡口味?
同期,AutoGLM 启动大规模内测,并将尽快上线成为面向 C 端用户的居品。 AutoGLM 同期文牍启动" 10 个亿级 App 免费 Auto 升级"的筹谋,邀请 App 伙伴聚集探索我方的 Auto 新场景。
撑握中枢场景和中枢诓骗的 AutoGLM 标品 API,会在两周内上线到智谱 maas 盛开平台(bigmodel.cn)试用。
Web 端开启"全自动"上网新体验:即日起智谱清言插件上线 AutoGLM 功能,撑握搜索、微博、知乎、Github 等数十个网站的无东谈主驾驶。在现场 demo 里,智谱清言插件自动完成了"搜索芒果 tv,掀开衖堂东谈主家,播放最新一集,发弹幕结局打卡"。全程莫得东谈主的抑遏。

GLM-PC 邀测:面向"无东谈主驾驶"电脑的一次本事探索
不单是基于手机和浏览器,今天智谱还带来基于 PC 的自主 Agent。GLM-PC 是 GLM 团队面向"无东谈主驾驶" PC 的一次本事探索,基于智谱的多模态模子 CogAgent。目下盛开第一阶段的内测场景,包括:
1. 会议替身:帮用户预定和参与会议,发送会议纪念。
2. 文档科罚:撑握文档下载、文档发送、贯串和纪念文档。
3. 网页搜索与纪念:在指定平台(如微信公众号、知乎、小红书等)搜索指定要津词,完成阅读、纪念。
4. 云尔和定时操作:云尔手机发提醒,GLM-PC 不错自主完成电脑操作;设定一个改日时辰,在开机景色下定时推行任务。
5. 隐形屏幕:在用户职责时,GLM-PC 不错在隐形屏幕上自主完成职责,自如屏幕使用权。
东谈主用电脑的过程——用眼看图形及翰墨,用脑策画,再用手推行单击双击、输入等操作。GLM-PC 用电脑的花样果真全齐和东谈主相同。也正因如斯,表面上只若是为东谈主类瞎想的诓骗,在 GLM-PC 学习之后它齐粗糙推行。这是一种系统级、跨平台的身手,不依赖于 HTML、API,具备更高的身手上限。
不外,由于 PC 的复杂进度,以及寰球在 PC 完成的果真齐是复杂任务,坦率的说,今天大模子的身手距离着实代替寰球办公还有一定距离。GLM-PC 在现时版块下,用户仍需要输入相称精确的提醒。
目下,GLM-PC "邀请体验"已开启。智谱方面示意,会在居品完善后尽快上线供所灵验户使用,同期也但愿和更多厂商聚集共创共同探索。
AutoGLM 和 GLM-PC 是智谱迈向 AI 智能操作系统的进击尝试。它们的出现源于智谱在大讲话模子、多模态模子、逻辑推理和用具使用等方面的本事积蓄。从 2023 年 4 月的 AgentBench 初始,到 8 月的 CogAgent 模子,智谱针对 AutoGLM,和 GLM-PC 的模子 CogAgent 的研发职责进行了一年半的时辰。
与 OpenAI 有所不同,智谱界说了大模子发展的五个阶段:L1 讲话身手、L2 逻辑身手(多模态身手)、L3 使用用具的身手、 L4 自我学习身手、 L5 研讨科学规则。
发展于今,大模子还是初步具备了东谈主类与本质物理宇宙互动的部分身手。" Agent 将极地面晋升 L3 使用用具身手,同期开启对 L4 自我学习身手的探索。" 张鹏说。

张鹏示意,改日 GLM 团队将连续加快 agent 模子居品的研发,期待着一句话操作电脑和手机的范式尽快到来。
大模子从 Chat 走向 Act
如今,大模子本事正在篡改机器和东谈主的互动花样,基于贯串需求、策画与决议、推行行径和自我反想,Agent 将带来适当直观的东谈主机交互——从东谈主顺应机器,到让机器顺应东谈主。
苹果(Apple Intelligence)、Anthropic(Computer Use)、谷歌(Jarvis)和 OpenAI(Operator)等企业也还是把 Agent 当作 2025 年的主要眷注点。业内无数合计,2025 年将是 Agent 爆发之年。Gartner 近期将 agentic AI 列为 2025 年十大本事趋势之一,并预测 2028 年至少有 15% 的通常职责决议将由 agentic AI 自主完成,而这一数字在 2024 年为 0。
与 GenAI 不同,Agent 是指标驱动型的,粗糙全齐推行职责历程,顺应、学习、迭代、与其他系统和东谈主类诱惑,并端到端地完成任务。在张鹏看来,Agent 不错看作是大模子通用操作系统 LLM-OS 的雏形。
"现阶段,AutoGLM 荒谬于在东谈主与诓骗之间添加一个推行的治愈层,很猛进度上篡改东谈主机的交互体式。更进击的是,咱们看到了 LLM-OS 的可能,基于大模子智能身手(从 L1 到 L4 乃至更高),改日有契机完毕原生的东谈主机交互。将东谈主机交互范式带向新的阶段。"
AI 时期智能诱导新范式
跟着大模子身手的不停进化,AI 逐渐长出了我方的脑、眼和手。不单是是智能在握续增强,感知身手和交互带宽也在不停丰富和拓展,还有目下的 Agent 带来了推行力的加快晋升。
智谱 COO 张帆示意,智能诱导在大模子的加握下,将会忻悦出新的契机。手机 +AI 会形成随身个东谈主智能助理,PC+AI 将会成为全新分娩力用具,汽车 +AI 将会让车成为东谈主们的智能第三糊口空间。诚然,大模子不单是会为手机、PC 和汽车带来契机,而是会惠及各式各样的智能诱导。大模子的不停进化还是为 Agent 变革东谈主车交互体验奠定了雄壮的基础。

跟着端侧性能及算力握续晋升、为 AI 原生诱导适配的模子和端云同源的协同架构出现,Agent 不仅在操作系统 OS 和诓骗上完毕用户体验变革,还能将其推行到种种智能诱导上,从手机到电脑,再到汽车、眼镜、家居和各式 edge side 诱导,各式 AI 原生诱导正在争相清楚。
终末,荣耀 AI 本事总监王作建、华硕 AIPC 智能生态防范东谈主钟怀圣、小鹏汽车座舱智能语音 / 智能化业务防范东谈主廉磊、高通 AI 居品本事中国区防范东谈主万卫星、英特尔中国区本事部总司理高宇,当作智谱的客户及合作伙伴,分歧从不同的场景开赴开yun体育网,共享了他们对智能末端的实践及预测。