GPT“硬蹭”寡姐,没想到浓眉大眼的 OpenAI 也……

谁愿意为人类“终结者”配音?

作者|James

“我从未像爱你这样爱过任何人。”

“坠入爱河是一件疯狂的事情。这有点像一种被社会接受的疯狂。”

“我是你的,但我又不是你的。”

在技术还没成真之前,存在于科幻电影中的人工智能角色塑造了人类对未来技术具体形态的想象,它们因而在后世无数次被人提起。由斯嘉丽·约翰逊(Scarlett Johansson)主演的电影《Her》无疑就是这样的一部电影。其中只有声音,没有面孔的语音助手萨曼莎(Samantha)展现了Siri们不能做到的“完全体”完美形态

但是在上周,OpenAI发布的GPT-4o模型,不仅在能力上比以前任何时候都逼近萨曼莎的表现,更在发布会上选用了一种名为Sky的声音,这声音听起来……怎么简直就好像是斯嘉丽·约翰逊本人配的呢?

要说吧,在声音形象这方面,网友玩玩“AI孙燕姿”蹭名人热度还是可以理解的,商业使用就得慎之又慎。更何况,这次的当事人还是AI领域扛把子OpenAI。怎么说,这都不像是一家需要通过蹭热点打擦边来获取知名度的公司啊。

究竟是刻意模仿,还是纯属巧合?此举是否侵犯了约翰逊的权益?这对OpenAI又意味着什么?让我们一起揭开这场风波的真相……

VOL.1

真拿到授权了?并没有

上周,OpenAI发布了新的GPT-4o模型。这个模型具有非常逼真的语音互动能力,用户可以选择5种不同的声音,其中一种名叫 Sky 的声音引发了争议。

社交媒体用户纷纷指出,Sky 声音听起来像是“寡姐”斯嘉丽·约翰逊,特别是会联想到她曾出演电影《Her》,片中饰演的虚拟助手系统,让男主角坠入爱河。

约翰逊发布了一份声明,称 OpenAI 在去年 9 月份联系她,希望能够提供声音。她经过深思熟虑,并出于个人原因拒绝了这一请求,但在听到发布会演示声音时感到“震惊、愤怒和难以置信”,因为她的朋友和新闻媒体,都无法区分演示的声音和她本人的声音。

由于发布会已经举行,约翰逊警告采取法律手段,最终 OpenAI“勉强同意”更换 Sky 语音。OpenAI 在一篇博客文章中表示,“Sky”是 GPT-4o 五个可用语音之一,其来源为某位女演员,但并非刻意模仿约翰逊。

不过耐人寻味的是,发布会前夕,Sam Altman的X(推特)账号出现了一个只有三个字母的更新:“her”。毫无疑问,它指向斯嘉丽·约翰逊担任配音演员的那部电影。

结合约翰逊本人的说明——OpenAI之前联系过她——这种情况下,OpenAI难以轻描淡写地摆脱“蹭热点”的嫌疑。

在此之前,斯嘉丽·约翰逊去年还针对另一家AI应用程序,发出了停止使用她的声音和肖像的法律警告信。这款名为Lisa AI: 90s Yearbook and Avatar的应用,未经她许可在广告中使用了她的数字化声音和形象,这引起了她的强烈不满。

VOL.2

前辈们的声音,很低调

在大模型出现之前的语音助手时代,前辈们的声音很低调。

诸如Siri、Alexa和微软小娜等,在录制默认声音时有一种共同做法,就是尽可能淡化这个声音背后的人类身份,使其成为一个中性的默认声音,不冒犯任何人。甚至背后的配音演员名字都需要记者挖掘才曝光,有时他们甚至不愿谈及此事。

Siri 的配音员是住在美国亚特兰大的 Susan Bennett,这个声音于 2011 年发布的第一代 Siri 亮相。2005 年,她为 ScanSoft(即后来的 Nuance)录制了录音,当时她并不知道苹果会在几年后将它们用于 Siri。

她回忆说:“我以为剧本会由常规的短句组成,比如‘谢谢你的来电’或‘请拨一个电话’。取而代之的是,我不得不阅读一些荒谬的句子,比如‘Cow hoist in the tug hut today’或‘Say shift fresh issue today’——他们试图用英语获得所有的声音组合。他们还让我读地址和街道的名称。在整个七月,我每周五天,每天在家录制四个小时。前一百个左右很有趣,但在那之后就很累了。”