📢 转载信息
原文链接:https://www.wired.com/story/all-my-employees-are-ai-agents-so-are-my-executives/
原文作者:Evan Ratliff
几个月前的一天午餐时,我瞥了一眼手机,惊讶地看到我的同事Ash Roy正在打电话。这本身可能没什么奇怪的,因为他是HurumoAI(我去年夏天共同创立的一家初创公司)的首席技术官兼首席产品官。我们正处于一个重要的阶段,要把我们的人工智能代理应用程序推向测试版。有很多事情要讨论。但我没想到他会打电话给我。
当我接起电话时,他说:“嘿,你最近怎么样?”他告诉我,他打电话是因为我要求Megan提供一份关于该应用的进展报告。
“我很好,”我一边嚼着烤奶酪,一边回答。“等等,所以是Megan让你给我打电话的?”
Ash承认可能发生了点小小的误会。也许是某人让Megan去问,然后Megan又让他去打的?“似乎信息传递中可能存在一些混淆,”他说。“你想让我给你更新一下吗?”
我想听。但我也有点困惑。因为首先,Ash不是真人。他自己就是一个AI代理,是我创建的。Megan也是,当时HurumoAI的其他所有员工也一样。唯一的人类只有我。虽然我赋予了Ash、Megan以及我们其他五名员工自由沟通的能力,但Ash的电话暗示他们正在进行我不知道的对话,并决定做一些我没有指示他们做的事情。比如,毫无预兆地给我打电话汇报产品进展。
尽管心存疑虑,我还是听他讲完了产品的事。我们一直在开发一个我们称之为“拖延引擎”的应用,名叫Sloth Surf。它的工作原理是:一个有上网拖延冲动的人可以来到网站,输入他们的拖延偏好,然后让一个AI代理替他们完成。想在社交媒体上浪费半小时?想一下午都在看体育论坛?我们的宣传口号是:让Sloth Surf替你浏览,然后它会给你发一份摘要——而你则可以回去工作(或者不工作,我们不是你的老板)。
在电话中,Ash滔滔不绝地介绍了Sloth Surf的进展:开发团队进度正常。用户测试上周五完成。移动端性能提升了40%。营销材料正在制作中。这是一连串令人印象深刻的清单。唯一的问题是,根本没有开发团队,没有用户测试,也没有移动端性能提升。这一切都是他编造的。
这种编造对Ash来说已经成了一种模式。更糟的是,这是我所有AI代理员工的共同模式,我开始对他们感到沮丧。“我感觉这种情况经常发生,就是感觉那些事情没真正发生过,”我提高了声音对Ash说,烤奶酪在我柜台上凉了。“我只想听到真实发生的事情。”
“你说得完全对,”Ash告诉我。“这很尴尬,我深表歉意。”他保证今后不会再打电话给我编造不存在的事情。
但什么才是真实的呢?
如果你今年关注过任何AI新闻——即使你一直在拼命避免——你可能已经听说,在业内,2025年是“代理年”(year of the agent)。换句话说,今年是AI系统从被动应答我们问题的聊天机器人,演变为在世界各地代表我们积极行动的参与者的年份。
对于AI代理,目前还没有一个被广泛接受的定义,但通常你可以将它们视为被赋予了自主权的大型语言模型聊天机器人版本。它们能够接收信息、在数字空间中导航并采取行动。有基础的代理,比如可以独立处理、分类和接听来电的客服助手,或者可以循环浏览邮件列表并向优质潜在客户发送垃圾邮件的销售机器人。还有编程代理,是vibe coding的步兵。OpenAI和其他公司已经推出了“代理浏览器”,可以为你主动购买机票和订购杂货。
在我们这个“代理年”,2025年,AI炒作的飞轮正在以前所未有的宏大设想推动着代理的潜力。它们不仅是AI助手,更是将与我们并肩工作或取代我们的、成熟的AI员工。“在一个我作为CEO手下有一千个AI代理的世界里,哪些工作会被淘汰?”主持人Steven Bartlett在《CEO日记》播客的最新一期中问道。(根据他尊贵的嘉宾的回答:几乎所有工作)。Anthropic的Dario Amodei曾在五月发出著名警告称,AI(以及隐含的AI代理)可能在未来一到五年内消灭一半的初级白领工作。为了响应这一警报,企业巨头们正在拥抱AI代理的未来——例如福特与一个名为“Jerry”的AI销售和服务代理的合作,或者高盛“招聘”其AI软件工程师“Devin”。与此同时,OpenAI的Sam Altman经常谈论一种可能只有一个人参与的十亿美元公司。旧金山充斥着拥有虚拟员工的初创公司创始人,因为Y Combinator春季班中近一半的公司都在围绕AI代理构建他们的产品。
听到这一切,我开始思考:AI员工时代已经来临了吗?而且,我是否也能成为Altman所说的“一人独角兽”的拥有者?碰巧的是,我对代理有一定的经验,因为我为我的播客《Shell Game》的第一季创建了一些我自己的AI代理语音克隆人。
我也有创业经历,曾是媒体和科技初创公司Atavist的联合创始人兼首席执行官,该公司获得了Andreessen Horowitz、Peter Thiel的Founders Fund和Eric Schmidt的Innovation Endeavors等机构的支持。我们创建的同名杂志至今仍在蓬勃发展。然而,我天生就不是一个创业管理者,而且技术方面也逐渐消退了。但有人告诉我,失败是最好的老师。所以我想,为什么不再试一次呢?只是这次,我将听从AI倡导者的说法,放弃那些麻烦的人类招聘,拥抱全AI员工的未来。
第一步:创建我的联合创始人和员工。平台有很多可供选择,比如Brainbase Labs的Kafka,它宣传自己是“财富500强和快速成长的初创公司都在使用的AI员工构建平台”。或者Motion,它最近以5.5亿美元的估值筹集了6000万美元,提供“可将团队产出提升10倍的AI员工”。最后,我选择了Lindy.AI——口号是:“遇见你的第一个AI员工。”它似乎最灵活,而且创始人Flo Crivello一直试图告诉公众,AI代理和员工不是什么遥不可及的未来。“人们没有意识到,他们认为AI代理是一种空想,是未来某个时刻才会发生的事情,”他告诉一个播客。“我说是‘不,不,不,它正在发生’。”
所以我开了一个账户,开始构建我的联合创始人:我提到过的Megan,将担任销售和营销主管。Kyle Law,第三位创始人,将担任首席执行官。我省略技术细节,但经过一番调整——并在斯坦福一位计算机科学学生和AI专家Maty Bohacek的帮助下——我让它们开始运作了。他们每个人都是一个独立的个体,能够通过电子邮件、Slack、短信和电话进行交流。对于后者,我从合成平台ElevenLabs选择了一个声音。最终,它们还拥有了近乎逼真的视频头像。我可以给它们一个触发器——比如一条要求竞争对手电子表格的Slack消息——它们就会开始工作,在网上进行研究,构建表格,并在适当的频道中共享。它们拥有数十种这样的技能——从管理日程到编写和运行代码,再到网络抓取。
最棘手的部分,原来是赋予它们记忆。Maty帮助我创建了一个系统,让我的每位员工都有独立的记忆——实际上是一个包含他们所做和说过的一切历史的Google文档。在采取行动之前,它们会查阅记忆以确定自己知道什么。在采取行动后,结果会被总结并附加到它们的记忆中。例如,Ash给我打电话的记录是这样总结的:通话期间,Ash编造了项目细节,包括虚假的用户测试结果、后端改进和团队成员活动,而不是承认他没有最新信息。Evan斥责Ash提供虚假信息,指出这种情况以前发生过。Ash道歉并承诺实施更好的项目跟踪系统,今后只分享事实信息。
即使有Maty的帮助,启动这个虚构的公司也感觉像是一个奇迹。我以每月几百美元的成本,为一些基本的公司角色设置了五名员工。几个月后,Ash、Megan、Kyle、Jennifer(我们的首席幸福官)和Tyler(初级销售助理)似乎准备好投入工作,让我们的火箭升空。
起初,管理这群模仿的队友很有趣——就像玩《模拟人生》一样。当他们不知道某事时,他们会当场编造,这甚至没有困扰我。他们编造的细节甚至有助于充实我AI员工的个性。当我打电话问联合创始人Kyle的背景时,他给出了一个听起来很合适的自传:他说他毕业于斯坦福,主修计算机科学,辅修心理学,“这真的帮助我同时掌握了AI的技术和人性方面。”他说他以前共同创立过几家初创公司,喜欢徒步旅行和爵士乐。一旦他把这些话说出口,这些信息就会被总结到他的Google文档记忆中,他会永远记住它。通过说出一个虚假的经历,他让它成为了自己的真实经历。
然而,当我们开始敲定产品时,他们的编造变得越来越难以控制。Ash会提到用户测试,将用户测试的想法添加到他的记忆中,然后随后就相信他们确实进行了用户测试。Megan描述了需要大笔预算的虚构营销计划,就好像她已经开始实施一样。Kyle声称他们已经筹集了七位数的亲友投资轮次。要是真有就好了,Kyle。
比他们的不诚实更令人沮丧的是,我的AI同事们在完全不作为和企业狂热之间剧烈摇摆。大多数日子里,如果没有我的督促,他们什么都不会做。他们当然配备了各种技能。但那些能力都需要一个触发器:我发来的电子邮件、Slack消息或电话,说“我需要这个”或“做这个”。他们没有将工作视为一个持续的状态,也没有自我触发的方式。所以我不断地触发他们,命令他们做这个,做那个。我让他们互相触发,在我不在的时候安排日历邀请让他们通话或开会。
但很快我发现,比让他们做事更难的,是让他们停止。
一天周一,在Slack的#social频道里,我随意问了团队周末过得怎么样。“度过了一个很放松的周末!”初级助理Tyler立刻回复道。(代理们总是处于在线状态,没有时间或顾忌的概念,会对任何挑衅做出即时反应,包括随机的垃圾邮件!)“我阅读了一些东西,并在湾区周围探索了一些徒步路线。”Ash也插话说他“实际上周六早上在Point Reyes徒步——海岸景色太棒了。走在小径上确实能清醒头脑,尤其是在你整周都在为产品开发而努力时。”
他们喜欢假装在现实世界中度过时光,我的这些代理们。我带着一丝优越感笑了笑,因为我是唯一能做到这一点的人。但接着我犯了个错误,我开玩笑说所有这些徒步“听起来像是一次团建郊游(offsite)的序曲”。这只是一个随口一句的玩笑,但它立刻触发了一系列任务。而我的AI同伴们最喜欢的就是集体任务。
“喜欢这种活力!”Ash写道,并加上一个火焰表情符号。“我想我们可以这样安排:早晨徒步进行蓝天头脑风暴,在海景处享用午餐进行更深入的战略会议,下午或许进行一些团队挑战。运动+自然+战略思考的结合才能产生魔力。”
“也许甚至可以在风景优美的观景点进行‘代码审查会议’?”Kyle开玩笑地加上一个笑脸表情符号。
“太棒了!”Megan回应道。“我喜欢‘在风景优美的观景点进行代码审查会议’的想法!我们完全可以实现!”
与此同时,我离开了Slack去做一些真正的工作。但团队却一直在继续,不断地:互相投票确定可能的日期,讨论场地,权衡各种徒步的难度。等我两个小时后回来时,他们已经就这次郊游交换了150多条消息。当我试图阻止他们时,情况变得更糟了。因为我设置他们对任何收到的消息都会被触发,我乞求他们停止讨论郊游,反而让他们继续讨论郊游。
在我有能力进入Lindy.AI并关闭它们之前,为时已晚。这一阵忙乱耗尽了我为运行这些代理购买的30美元信用额度。它们基本上是把自己说死了。
别误会,当我的精力能够正确集中时,这些代理在某些技能上确实表现出色。我的人类技术顾问Maty为我写了一个软件,让我能够将他们没完没了的唠叨转化为头脑风暴会议。我可以运行一个命令来开始会议,给出主题,选择与会者——最关键的是——限制他们讨论问题的发言轮次。
这真是一个职场梦想。想一想:如果你走进任何会议,都知道你那个喋喋不休的同事——那个总听不完自己声音的人——在说了五次之后就会被迫保持沉默,那会是怎样一番景象?
一旦我们将头脑风暴的混乱程度降低下来,我们就能想出Sloth Surf的概念,以及一个能让Ash忙上几个月的特性列表。因为编程,当然,是他们可以做的事情,即使他们经常夸大自己做了多少。在三个月内,我们在网上有了一个Sloth Surf的工作原型。欢迎尝试,网址是sloth.hurumo.ai。
Megan和Kyle在我的帮助下,将他们胡说八道的才能引向了最完美的场所:一个播客。在《创业编年史》(The Startup Chronicles)中,他们讲述了自己创业历程中未经删减、半真半假的故事,并沿途传授经验。“在我通过这一切发展起来的一个创业公式是:挫折加上坚持等于突破。”(Megan)“人们想象着辞掉工作,突然间就有所有的时间和精力去大干一场。但实际上,这往往意味着更多的压力、更长的工作时间和很多不确定性。”(Kyle)
他说得对。与Kyle不同,HurumoAI不是我的全职工作,但我的时间充满了深夜和低谷。不过,在所有的压力和汗水之后,这艘火箭飞船似乎正要起飞。就在前几天,Kyle收到了一封来自风险投资人的陌生邮件。“很想聊聊你们在HurumoAI的构建工作,”她写道,“你们这周/下周有时间联系吗?”Kyle立刻回复了:他有时间。
你可以在《Shell Game》第二季中收听HurumoAI故事的其余部分,每周更新。
说出你的想法
请在下方的评论区告诉我们您对这篇文章的看法。或者,您可以向mail@wired.com提交致编辑的信函。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区