您的位置:首页 >公司 >

多项AI技术合为一体,科大讯飞虚拟主播闪亮登场引发全场喝彩

2019-08-14 13:10:21    来源:中国金融商报网

随着人工智能技术的发展,虚拟主播也如雨后春笋般涌现,其实,虚拟主播就是结合了多学科的一项技术,包括语音识别,人脸相关的技术,人脸识别、人脸建模,还有深度学习,这样多学科的一个融合。国内人工智能和智能语音行业领导者科大讯飞在此方面有着不可比拟的优势。

就在科大讯飞2019新品发布会上,使用了全球首个多语种A.I.虚拟主播,能实现中、英、日、韩、俄、西、法7国语言,以及维吾尔语、藏语2种民族语言同时进行直播,在发布会现场引起了关注。就人工智能语音技术技术革新而言,科大讯飞无疑已经走在了行业前列。

在此之前,今年全国两会上科大讯飞就推出了人工智能虚拟主播小晴,这次以全身形象亮相新品发布会,作为大会的串场主持人。在发布会上,科大讯飞的虚拟主播不止主持得惟妙惟肖,还表演了变声技术,其模拟了多个男女声音,惟妙惟肖的声音让人以为这几位嘉宾真的来到了现场。相信之后科大讯飞能够让变声技术运用在娱乐领域中,实现声音的cosplay。

目前在网络上AI换脸技术获得了许多网友的热捧,此次科大讯飞的语音cos秀给未来直播以及视频等娱乐领域带来了更多的可能。而且科大讯飞的虚拟主播不仅拥有流畅动听的话语还有自然的表情动作,这让人感受到极强的娱乐性。或许在未来的影视剧中,会大面积出现科大讯飞的声音cos。毕竟这不止节约了影视剧制作成本,还加快了影视剧制作的进程。

当然,科大讯飞的虚拟主播之所以能够如此惟妙惟肖,是因为科大讯飞在多个技术维度都有创新。就拿虚拟主播来说,其就将科大讯飞语音合成、机器翻译、图像处理等人工智能技术进行了结合。目前整个行业中,能够将这么多科技前沿技术融合得这样好的企业,屈指可数。

据了解本次发布会上,客串主持人的虚拟主播,其表情和声音的模拟也是可以调节的。先输入播报的内容,通过科大讯飞的语音合成技术进行语音合成,然后利用多模态合成模型基于语音驱动表情序列生成对应的表情序列。这样就能够达到声像一致,给人展现出如同主播在主持的感受。

科大讯飞在语音识别和语音合成等技术上已然走在了行业领跑位置,多个虚拟主播的亮相便是最好的证明。有理由相信,在此领域,科大讯飞未来的路一定能够走得更远!

相关阅读