被ChatGPT“复制”声音，“寡姐”斯嘉丽发文怒斥，OpenAI紧急停用，生成式AI面临深度伪造的新危机？

2024-05-22
小编: 网络
正體

分享到：

导读: 当地时间5月20日，外媒NPR独家公布了被影迷称为“寡姐” 、科幻电影《她》中AI助手饰演者斯嘉丽·约翰逊发布的一篇声明，斯嘉丽指控OpenAI的ChatGPT非法使用其声音，同时要求将语音下

丝瓜网小编提示，记得把"被ChatGPT“复制”声音，“寡姐”斯嘉丽发文怒斥，OpenAI紧急停用，生成式AI面临深度伪造的新危机？"分享给大家！

当地时间5月20日，外媒NPR独家公布了被影迷称为“寡姐”、科幻电影《她》中AI助手饰演者斯嘉丽·约翰逊发布的一篇声明，斯嘉丽指控OpenAI的ChatGPT非法使用其声音，同时要求将语音下架。

上周，OpenAI发布了最新旗舰模型GPT-4o，引爆科技圈。在发布会上，OpenAI展示了ChatGPT最新语音功能，不少人发现，其富有表现力的合成声音Sky与《她》中斯嘉丽饰演的AI助手的声音惊人地相似，这引发了激烈的讨论。

斯嘉丽声明称，2023年9月，ChatGPT推出语音模式时，OpenAI曾找过她希望为其配音，但由于个人原因拒绝。就在GPT-4o演示前两天，OpenAI还曾试图说服斯嘉丽，但在联系上之前，新模型就已发布。基于此，斯嘉丽的法律团队此前已向OpenAI发送两封声明，要求该公司详细说明其开发这种声音的过程。

由于斯嘉丽的指控，OpenAI在当地时间5月19日发表声明宣布暂停使用这款AI声音模板。同时，作为回应，该公司也公布了ChatGPT中5个配音的详细创作流程，称这是从400多名专业配音和演员中挑选出来的。

实际上，这已经不是OpenAI初次面临类似的指控。更早之前，《纽约时报》和《权力的游戏》原著作者乔治·马丁等在内的内容创作者都曾因版权问题将该公司告上法庭。而随着这场斗争延伸至语音领域，外媒Wired认为，这可能会带来新的有关深度伪造的威胁。

“寡姐”斯嘉丽：ChatGPT“偷”走我的声音

“当我听到发布演示时，我感到震惊、愤怒，并且不敢相信阿尔特曼会追求一种听起来与我如此相似的声音，以至于我最亲密的朋友和新闻媒体都无法分辨。”斯嘉丽在声明中这样写道。

图片来源：NPR记者Bobby Allyn的X账号

实际上，自去年9月OpenAI推出ChatGPT的语音模式以来，Sky的声音就一直可用。ChatGPT的语音模式一共有Breeze、Cove、Ember、Juniper和Sky五种声音。但直到上周OpenAI演示了最新的旗舰AI模型GPT-4o模型，使声音更具表现力时，Sky的声音与斯嘉丽的联系才变得清晰起来。

在上周的发布会上，OpenAI展示了ChatGPT最新语音功能，得益于反应速度的大幅提升，该功能几乎等同“实时对话”。随后，OpenAI首席执行官阿尔特曼在X平台上发布了“her”这个词，暗示科幻电影《她》已走入现实。不少人意识到，ChatGPT中富有表现力的合成声音与《她》斯嘉丽·约翰逊饰演的AI助手的声音惊人地相似，由此引发了外界激烈的讨论。

图片来源：X平台

而斯嘉丽的声明也指出，阿尔特曼用“她”来指代这部电影，似乎在鼓励全世界将ChatGPT最新演示与其表演联系起来。

她在声明中表示，2023年9月，ChatGPT推出语音模式时，阿尔特曼找到她，询问她是否愿意为ChatGPT配音，去安慰用户，弥合AI与人类之间巨大的差异所带来的不适感。斯嘉丽表示，经过深思熟虑后，她拒绝了这一提议。就在GPT-4o演示前两天，OpenAI还曾试图说服斯嘉丽，但在联系上之前，新模型就已发布。基于此，斯嘉丽的法律团队此前已向OpenAI发送两封声明，要求该公司详细说明其开发这种声音的过程。

OpenAI回应：暂停Sky语音，ChatGPT的5种声音来自400多份投稿

当地时间5月19日，OpenAI表示公司正采取措施解决问题，同时正在暂停使用这款AI声音模板。

该公司还公布了ChatGPT中5个配音的详细创作流程，称每一种声音都经过了长达五个月的精心挑选，且是从合作的配音演员中进行采样的，且每位演员的报酬都高于市场最高水平。

图片来源：OpenAI官网

OpenAI在声明中写道：“我们认为AI的声音不应该刻意模仿名人的独特声音——Sky的声音不是对斯嘉丽·约翰逊的模仿，而是属于另一位专业女演员，使用她自己自然的说话声音。为了保护他们的隐私，我们不能分享我们配音演员的名字。”

据悉，2023年5月，OpenAI的选角机构和选角导演发出了人才招募。不到一周，他们就收到了400多份配音演员和银幕演员的投稿。将近5个月后，他们挑选出了5种声音发布到ChatGPT中。

该公司为ChatGPT的声音制定了一套标准，仔细考虑了每个声音的独特个性及其对全球观众的吸引力。这些标准包括：有不同背景或能说多种语言的演员；一种听起来有“永恒”（timeless）感觉的声音；一种平易近人、能激发信任的声音；一种音色丰富，且温暖、引人入胜、充满自信、魅力十足的声音；自然且易于听取。