文章详情
导航

看似福音的AI配音,也可能引发新的社会问题

行业新闻 412 87

以前的文字,声音曾是人类沟通的唯一工具。因为声音的传播距离是非常有限的,所以当时人类的生存是以“部落”为单位,关系非常密切。到了以后,随着传播媒介逐步发展,我们不再需要彼此间近距离的交流来获取大量的信息,反而,却突然开始失去了单一声音带给我们的感觉,这种最原始的媒介承载了人类最充沛的情感。

在一月份,世界上第一部用人工智能模拟人声的纪录片在央视播出,而这一纪录片名为《创新中国》,在整个过程中都是由“已经逝去”的声音来完成的。这一奇迹的背后,是科大讯飞运用语言合成技术成功帮助 AI模拟了我国已故著名配音演员、语言艺术家李易的声音。

校讯飞强大的语言合成技术让 AI模拟声音成功感动了李易老师的学生、朋友和家人。在 AI自然流畅的语言解说中,似乎还可以再见故人的音容笑貌。这一语音合成技术主要由三个环节组成:

一种是输入文本,让机器模拟人类对自然语言的理解过程,对文本进行语言处理,主要包括文本规整、词切、语法语义分析,然后给出后续步骤所需的发音提示;

第二,对音段特征,如音、音、音等,使机器能够处理语言中特有的韵律,使机器的模拟声音更自然、更准确地传达真实的语义。

最终,根据前两部分处理的结果进行语音合成。经过这几步, AI模拟出的声音与人声已十分相似,即使是最熟悉的人在某些情况下也难以分辨出机器人和人声的界限。

AI配音拉动的两架“马车”

所以,如此令人惊叹的人工智能配音技术,它的边界到底能延伸多远?智慧型相对论分析家(aixdlun)杨苏颖就此提出了人工智能配音的两大用武之地。

目前,“粉丝经济”已成为文娱产业经济增长的主要支柱之一。近年来,随着养成类偶像节目的火爆,粉丝们对明星投入的情感越来越多,由此带动该群体为明星付费的意愿也同样高涨。网上流传着范冰冰的弟弟范丞丞在新浪微博上发了付费阅读的自拍,一夜暴富(被经纪人否认)。现在,明星圈这么火,何不利用 AI语音合成的 VR、 AR技术打造出虚拟范丞丞,让他们更真实地出现在粉丝的日常生活中?想要深入挖掘中国粉丝的潜力,这样的虚拟二次元偶像“荷兹”比腾讯视频之前在明日之子制作更多,听现实中熟悉的偶像声音叫自己起床,这样的虚拟偶像会更容易被粉丝接受。

根据国外媒体的报道,有研究显示,年老的夫妻会因一方丧偶而增加死亡,这种现象叫做“心碎综合症”。哈佛大学和威斯康斯大学麦迪逊大学的两名科学家在这项研究中发现,丧妻导致男性“全因死亡”的几率增加了18%,女性在丧偶后,“全死因死亡”的概率增加了16%。并可以合理地推断出,在其他丧偶或丧双亲的情况下,这种“心碎综合症”一定也会出现,如唐山地震和汶川地震后。心理医生说,要修复这个创伤非常困难。不过, AI配音的 AI可能能做到,它能利用以前存在过的声音合成亲人的声音,如果心理医生说的话能用亲人的声音表达,也许能帮助病人更快地摆脱阴霾。

AI配音舞台上也可以唱“黑脸”

然而,所有技术都是刀子的翻版,人工智能配音技术解决问题的同时也会带来新的问题,智能相对论分析家杨苏颖认为,这项技术在广泛应用之前,还需要接受很多拷问。

我们对手机上的高德地图很熟悉,但大家都不知道的可能是其导航应用中采用的林志玲声音其实部分是采用了人工智能配音技术后期合成的。那大家可能觉得语音合成要提前到科技公司去录制这么纯正的声音。

但实际上,语音合成对音频质量的要求并不高,利用海量的因特网音频也能实现人声模仿。Google研究软件工程师的一篇论文《Looking toListen at the Cocktail Party》中使用了一种全新的视听模式,可以在不同的噪音中,将重叠的人声分离出来,形成每个说话人单独纯净的声音信号。与此同时,讯飞还提出了一种自动无监督方式,可以快速获得单个目标语音人的纯音库。

此前在伯明翰阿拉巴马大学进行的一项调查显示,如果 AI得到的信息足够多,它就能生成任何虚假图片或视频。如今,个人声音已越来越成为个人身份的一个标志,对个人声音利益的侵犯与肖像一样,都有可能导致个人人格、财产利益的损失。明星形象拥有肖像权,如果他们的照片被他人私自用于商业目的,他们可以一纸诉状将他人告上法庭以维护自己的肖像权。但目前我国立法界和学界对声音权的保护还没有一个统一的定论,如果个人的声音被他人盗用,则不可能得到法律的保护。

人们也许听说过声纹鉴定,一般说来,人的发声是特定性而稳定的,虽然不能说完全达到指纹那么精确,但仍有越来越多的国家将声纹鉴定作为嫌疑人辨认的重要手段。

但是,在GeekPwn2017国际安全极客大赛中,白帽黑客却在对战中使用声纹识别。实况5组有4组选手根据《王者荣耀》中的英雄妲己的声音样本,利用 AI语音合成技术模拟妲己声音通过“声纹”的验证,成功地通过“声纹”的验证,成功地欺骗了用户。

语音识别在现实中的应用非常广泛,离我们最近的还有手机声纹解锁,另外,在智能家居产品中,以及公共安全领域,它也有很多应用。但当声纹识别与 AI语音合成技术相遇时,一场智能游戏开始了,一场意外打开了个人隐私安全的潘多拉魔盒。AI语音合成技术越高明,绑架科技的人就会越容易进入你的生活。

另外,在警方侦查工作中,原来通过声纹分析可以判断说话人的性别、年龄、方言(居住地区)等特征,为侦查提供方向和范围,但 AI配音的干扰要求刑侦手段快速跟上科技发展的步伐,否则声纹鉴定的有效性就会受到普遍质疑,从而为侦查提供另一层保护伞。

《创新中国》中 AI配音的表现十分惊人,人类激动的泪水也证实了语音合成技术的成功。所以,有人不禁要问, AI配音如果在业界广泛使用,会不会取代传统的配音演员?配音员由四个字组成,不仅“配音”重,其实也是“演员”。早些时候口碑极佳的综艺《声临其境》,在充分展示了优秀演员的配音功力的同时,也让观众看到了配音过程中,配音者不仅是提供声音,更是一种表演。由于配音必须与剧本人物的情绪相一致,甚至包括呼吸的频率也要正确。

当前建立机器的情感识别系统已经很困难,机器深度学习需要大量的数据进行量化分析,而人类的情感是最难量化的。因此,更不要说让机器产生情感从而进行配音表演。配音员与演员这两个职业是异曲同工,所以用 AI配音代替传统配音演员独立参与影视制作是不可能的。

然而, AI配音代替游戏配音和读书配音还是不错的选择。和四平八稳的纪录片一样,这种配音不需要调动太多的情感,即使人工智能配音需要有几种不同的情感色彩,机器学习的量也在可控制的范围内,不会像影视剧那样复杂。

关于 AI配音这件事,有人反对,有人担心。技术善论的技术邪恶论战不会停止,但只要控制阀门仍然掌握在人类手中,事情就不会这么糟。


免责声明:以上整理自互联网,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。(我们重在分享,尊重原创,如有侵权请联系在线客服在24小时内删除)

  • 新稿
  • 最新问题
已经到底啦!
预约配音服务 关闭
预约成功后,我们工作人员会尽快与您联系请保持电话通畅
预约成功
您已预约成功,我们工作人员会尽快与您联系 请保持电话通畅
配音客服微信二维码

关注【客服微信】

抢先听最新案例,新客礼包等你拿!

提交
复制成功 微信号:18996381623 添加微信好友, 详细了解! 打开微信