目 录CONTENT

文章目录

发布AI初创公司你需要了解什么

Administrator
2025-12-06 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/artificial-intelligence-startups-daydream-fashion-recommendations/

原文作者:Steven Levy


朱莉·伯恩斯坦(Julie Bornstein)曾以为创办一家人工智能初创公司会是一件轻而易举的事。她拥有无可挑剔的数字商务履历:曾任诺德斯特龙(Nordstrom)电商副总裁、初创公司Stitch Fix的首席运营官,以及一家被Pinterest收购的个性化购物平台的创始人。自她在雪城读高中时就沉迷于时尚,热衷于阅读《Seventeen》杂志上的时尚版块并在当地商场流连。因此,她觉得自己完全有能力利用人工智能为客户创造一个发现完美服装的公司。

但现实比她预期的要艰难得多。我最近与伯恩斯坦和她的首席技术官玛丽亚·贝洛索娃(Maria Belousova)共进早餐,了解她获得了包括谷歌风投(Google Ventures)在内的风险投资5000万美元的初创公司Daydream的情况。谈话的走向出乎意料,这两位女性向我阐明了将AI系统的魔力转化为人们真正觉得有用的东西是多么令人惊讶的困难。T

她的故事解释了一些现象。我在2025年的第一篇通讯中宣布,那将是“AI应用年”。尽管确实涌现了许多此类应用,但它们尚未像我预期的那样改变世界。自ChatGPT于2022年底推出以来,人们一直对AI所展现的“把戏”感到惊叹,但研究一再表明,该技术尚未带来显著的生产力提升。(编程是个例外。)八月份发表的一项研究发现,20个企业级AI试点项目中,有19个没有产生任何可衡量的价值。我确实认为生产力提升就在眼前,但它比人们预期的要花费更长的时间。听取像Daydream这样正在努力突破的初创公司的故事,让人看到坚持和耐心或许真的能促成这些突破。

时尚达人遭遇挫折

伯恩斯坦最初向风险投资人提出的方案看起来很明显:利用人工智能解决棘手的时尚问题,将客户与他们乐于付费的完美服装进行匹配。(Daydream从中抽取一定比例的佣金。)你可能会认为这个设置很简单——只需连接到像ChatGPT这样的模型API,搞定收工,对吗?嗯,并非如此。签约超过265个合作伙伴,获得来自精品店到零售巨头超过200万种产品的访问权限,这部分相对容易。但事实证明,即使是像“我需要一件参加巴黎婚礼的裙子”这样简单的请求,也极其复杂。你是新娘、岳母还是宾客?现在是什么季节?婚礼有多正式?你想展现什么样的风格?即使解决了这些问题,不同的AI模型对这些事情也有不同的看法。伯恩斯坦说:“我们发现,由于模型的不一致性和不可靠性——以及幻觉——有时模型会遗漏查询中的一两个要素。” Daydream长期内测的一位用户可能会说:“我是矩形身材,但我需要一条能让我看起来像沙漏身材的裙子。” 模型则会展示带有几何图案的裙子。

最终,伯恩斯坦意识到她必须做两件事:推迟应用原定于2024年秋季的发布(尽管现在已经可用,但Daydream直到2026年某个时候才算正式走出Beta版),并升级她的技术团队。2024年12月,她聘请了Grubhub前首席技术官贝洛索娃,后者又带来了一批顶尖工程师。Daydream在激烈的人才争夺战中秘诀在于提供一个解决迷人问题的机会。“时尚是一个非常诱人的领域,因为它涉及到品味、个性化和视觉数据,”贝洛索娃说。“这是一个尚未解决的有趣难题。”

更重要的是,Daydream必须两次解决这个问题——首先是通过解释客户所说的内容,然后在目录方面将客户有时古怪的标准与商品进行匹配。对于像“我需要一件复仇裙子,去参加我前任和他新妻子也在场的成人礼”这样的输入,这种理解至关重要。“我们在Daydream有一个‘购物者词汇’和‘商家词汇’的概念,对吧?”伯恩斯坦说。“商家使用类别和属性进行交流,而购物者则说‘我要参加一个活动,在屋顶上,我和我的男朋友在一起’。你如何在运行时将这两种词汇合并成有意义的东西?而且有时这需要在对话中进行多次迭代。”Daydream发现语言是不够的。“我们正在使用视觉模型,因此我们对产品的理解更加细致入微,”她说。客户可能会分享一张特定的颜色照片,或者展示他们将要佩戴的项链。

CHIPPING NORTON ENGLAND NOVEMBER 13 Julie Bornstein speaks on stage during the Technology and Innovation talk in the...

伯恩斯坦表示,Daydream后续的彻底改造带来了更好的结果。(尽管我试用时,一个要求黑色燕尾服裤子的请求,除了我想要的之外,还给我展示了米色修身运动裤。嘿,这还是Beta版。)伯恩斯坦说:“我们最终决定从单次调用转向多个模型的集成。每个模型都进行专门的调用。我们有一个负责颜色,一个负责面料,一个负责季节,一个负责地点。”例如,Daydream发现,就其目的而言,OpenAI的模型非常擅长从服装的角度理解世界。谷歌的Gemini则没那么好,但速度快且精确。

从一开始,Daydream就明白AI需要人工的帮助。用户中一个很受欢迎的要求是查看海莉·比伯(Hailey Bieber)常穿的衣服。Daydream的团队没有完全依赖机器人,而是创建了一个满足这种需求的服装系列,足以让模型理解还能满足哪些其他愿望。当像田园风(Cottagecore)这样的新趋势出现时,她的团队会立即行动并创建一个系列。伯恩斯坦现在相信,通过额外的努力和大量的耐心,她走在正确的轨道上。

谁是南希?

伯恩斯坦告诉我,她在其他AI初创公司的同行也面临着类似的挑战。Duckbill是一项服务,利用人工智能像人类助手一样高效地为人们提供个人服务。首席执行官梅根·乔伊斯(Meghan Joyce)说,Duckbill的计划从一开始就是提供人类和AI协助的混合体,其中AI代理是真正的差异化因素。经过三年的努力,她说Duckbill终于实现了其预期的结果。缺点是她从未想过需要三年才能达到这个目标。

“在AI前端,这比预想的要具有挑战性得多,”她说。“这些模型是基于数字内容训练的,我们需要1000万次真实世界的互动,才能在对现实世界操作的相关性或知识方面达到初步水平。”一个长期存在的问题是,大型语言模型(LLM)倾向于对其能力过度自信。Duckbill的系统要求AI模型将复杂任务转交给人类,但模型有一个恼人的习惯,就是试图作假。在一次测试运行中,该代理被要求模仿打电话给医生办公室并安排预约的过程。实验本应只展示它将如何完成所需步骤,但模型却宣布它已经与一位名叫南希的接待员通话并安排了预约。“我们开始四处张望,‘电话打通了吗?南希是谁?’”乔伊斯说。“模型非常肯定,以至于让我们质疑自己。”但实际上并没有南希,也没有预约。“乔伊斯说:‘幸好这只是在原型阶段。’”

AI初创公司遇到的另一个问题是,当他们专注于提供特定领域的服务时,他们所许可的模型却非常愿意就几乎任何事情进行对话。很难确定对话何时偏离了相关范围。“我们以为人们会问某些问题,而我们在这些问题上做得非常好,”为AI“旅行伙伴”Mindtrip提供服务的首席执行官安迪·莫斯(Andy Moss)说。当人们问到莫斯团队没有考虑到的问题时,互动可能会变得一团糟。“我们必须对这些情况进行工程设计和规避,”他说。

我交谈过的所有三位首席执行官都表示,通过大量的努力和人才,他们终于走上了成功的道路。但他们的经验是AI初创公司在过于乐观的时间表面前敲响的警钟。这就是为什么我自己的时间表也改变了。现在我认为2026年可能是AI终于实现飞跃并让世界生产力大幅提升的一年。或者,为了安全起见,2027年。


这是史蒂文·利维(Steven Levy)Backchannel通讯的一期。可以在这里阅读往期通讯




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区