过去一年,大模型 Agent 的能力边界正在从会聊天、会写代码,快速扩展到会使用真实软件。其中最典型的场景,就是让大模型直接操作 Chrome 浏览器:打开网页、阅读内容、点击按钮、填写表单、上传文件、下载资料,甚至完成跨网页、多步骤的复杂任务。
谷歌这次的重拳出击,用浏览器上网的体验势必将会改善。 托AI的福,衰颓许久的Web生态最近几年又重新繁荣了起来。