OpenAI发布了首款AI智能体Operator,能够代理用户执行基于网页的操作。据介绍,Operator由一个名为CUA的新模型驱动,结合了GPT-4o的视觉能力,以及通过强化学习达成的高级推理能力。经过训练后,Operator能够“看见”浏览器中的内容,并使用鼠标和键盘允许的所有操作与网页进行互动。例如,官方演示了Operator预定饭店和在购物网站购物等案例。不过,OpenAI也提醒使用者,虽然Operator已经是市面上最强的AI代理,但与人类相比还存在很大差距,所以这项新技术仍有可能出错,不过会在未来数月里持续改进。