欢迎访问:沃派博客 每天不定时发布IT文章相关资讯
当前位置:沃派博客-沃派网 > IT文章 > 正文

“AI主播”跨越拟真技术“恐怖谷”,或将带来电视新闻事业的革命性变化

11-10 IT文章

原标题:“AI主播”跨越拟真技术“恐怖谷”,或将带来电视新闻事业的革命性变化

“AI主播”跨越拟真技术“恐怖谷”,或将带来电视新闻事业的革命性变化

文|航通社

11月8日,新华社和搜狗在乌镇峰会现场发布的“AI主播”可以说是确确实实地在全世界范围内引起了反响。

有些国内产品会找一些“不入流”的外文网站出稿,假装获得了“全球媒体”关注,但这次的“AI主播”不在此列。CNN、BBC、The Verge、CNET、南华早报等都在主要的版面给了这两位“主播”一席之地。

这倒并不是因为新华社版“AI主播”在技术上有多先进,而是说,更多是因为一个国家级主流媒体运用虚拟主播技术,这项举动本身具有强烈的象征性意义。

就像之前曾经被沙特授予“公民权”的那位女性机器人“索菲亚”一样,“她”也不一定是当今世界上技术最先进的机器人,只不过是说这件事情可以成为时代进步的一个强烈的隐喻。

没准,未来再回顾21世纪第二个十年的时候,这个镜头可以作为无数关键时刻其中的惊鸿一瞥。

低级失误

两位“AI主播”的外观和声音是分别取材自新华网络电视(CNC)中文台和英文台的两个主持人,其中被广泛传播到全世界的演示视频,是以新华英文台的主持人形象示人的英语“AI主播”所播报的一则关于进口博览会的新闻。

在这则两三分钟的新闻当中,还是不可避免地出现了比较低级的失误:将阿里巴巴创始人马云的名字“Jack Ma”误读成了“Jack Massachusetts”,这是因为语音合成系统读到这部分文字稿的时候,判断“MA”两个字母是美国马萨诸塞州的缩写。

在很多情况下,需要读到美国某个小地方地名的时候,就需要把“MA”理解为“马萨诸塞州”,但预防此类问题,既可以通过将“Jack Ma”一词特殊化处理,也可以通过将美国地方地名特殊化处理的方法来化解。在对外演示的视频中出现这样的错误,恰恰证明了新华社和搜狗并未针对主播们的“处女秀”而对演示“弄虚作假”,完全是以真面目示人。

开始跨越“恐怖谷”

世界各国媒体在观察这对“AI主播”的时候,都说“他们”暂时还没有实现新华社本身所宣传的那样,能够百分之百的替代真人的效果,同时还是被卡在了所谓“恐怖谷”当中。也就是说,当类人形象的拟真度达到90%左右,尚未能够100%以假乱真的情况之下,会产生一种不自然的机械感,甚至会令人毛骨悚然。

早几年,人们都是在达到“恐怖谷”级别后,稍微往后退缩一点,即进一步的增强机器与人之间的差异,用一个本来就知道是机器人,或是卡通形象的脸,就可以规避让人害怕的麻烦,也创造出初音未来,或是“会说话的汤姆猫”这样的角色。

“AI主播”跨越拟真技术“恐怖谷”,或将带来电视新闻事业的革命性变化

(图 / DailyMotion)

因此,早在大概2013-14年,使用机械声音味道很浓重的合成语音,加上明显不像是真人的卡通形象,替代人类去做一些资讯播报的做法,已经在普通的电脑和手机用户中普及泛滥。

在YouTube上,世界各国的上传者为了争取(骗取)点击和贴片广告费,会在一些突发新闻出来的时候,抢着发一些“混淆视听”的视频内容。最开始,网上可能只有图文消息出来,暂时还缺乏电视台或广播电台的真人播报录像,或者这些录像会因为版权问题被清理掉。那么,这一段时间之内如果有人去YouTube试图寻找新闻报道,就会遇到一个“空窗期”。

做假视频内容的人会将图文报道贴入“谷歌翻译”等文本转语音(TTS)软件,生成配音,再把随便什么地方找的配图一搭配,辅以花花绿绿的字体,最重要的是配上“突发新闻、最新报道、现场直播”这样的有利于搜索引擎抓取(SEO)的标题,本来想看电视台报道的观众就会遇到这些招摇撞骗的垃圾信息,从而上当受骗。

某个专门上传这种“骗点击”(Clickbait)视频的号长这样:

“AI主播”跨越拟真技术“恐怖谷”,或将带来电视新闻事业的革命性变化

航通社在《都8102年了,机器人还是“静若瘫痪,动如癫痫”》一文中曾提到过:

“研发更像人的交互界面始终存在风险,所以更多的服务型机器人从‘肉体’到‘灵魂’——即内置的AI操作系统——都在恐怖谷前停下了脚步。

大家宁可表现得像‘面瘫’版喜羊羊,也不愿意冒产品滞销的风险,向着真正像人一样的终极目标迈出那一步。”

版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/1365.html