人工智能解读唇语 不止能解码语音和语言翻译
使用人工智能来解码语音和语言已有先例,而现在人们又能够根据人工智能来解读唇语。...
据外媒报道,一种新型的语音合成器可以跳过语音记录,而直接将说话者嘴部动作转换为语句。研究人员表示,该设备将能帮助声带麻痹患者发声,向脑机接口又迈进一步。描述该装置的研究发表在《PLOS计算生物学》期刊上。
这项研究的作者来自法国国家科学研究中心。文章中提到,“这种语音合成器将人体主要语音发音器(舌,颚,口和嘴唇)的运动转换成智能语音。”说话者的发言,以及嘴部各个部位的位置会被同时记录,然后通过人工智能网络算法进行分析。
此处使用的人工智能算法是基于人类大脑建模的深层神经网络(DNN)。算法设计针对偏复杂的模式识别。该深层神经网络DNN通过测量舌头、下颚、软腭和嘴唇的协调动作(又称为“发音语音信号”)来识别嘴正在发音的某个词语。
作者解释道,DNN计算模型对这些测量的数据进行训练,将“发音语音信号”转换成“声学语音信号”,“这项研究中,我们让用于训练DNN模型的用户,以及陌生新用户都来测试语音合成器的实时控制性能,从而评估它在是否能很好地成为脑机接口的一部分。
”语音脑机接口将能通过解码皮层的语言相关活动,实时控制语音合成器,从而帮助有严重发声障碍的人恢复交流。为帮助连声道都无法震动的患者“说话”,科学家将必须掌握如何解码大脑信号,并将其翻译成语音。
谷歌不久前推出了多语言之间机器翻译系统。该系统被成为“Zero-Shot翻译系统”,并具有自我学习能力。它能将未学习过的两种语言翻译成一种已经学习过的语言 --换言之,通过人工智能训练学习了如何实现X语言对Y语言的翻译后,系统就能立即自动掌握从X到Z语言的翻译。
Google Brain的博文把这项翻译技术称为神经机器翻译系统(Google Neural Machine Translation ,简称GNMT)。
-
AR/VR/人工智能昙花一现?谁来让电视更聪明
从百废待兴到繁花似锦,电视都经历过。放眼当下的互联网电视,也呈现出一片百家争鸣的热闹景象,但是深剖来看,电视创新的脚步似乎因为从性价比模...
-
日本研发人工智能治疗癌症 AI应用医疗前景广阔
近日,日本国立癌症研究中心宣布,将与产业技术综合研究所等机构共同开发运用人工智能(AI)的系统,向每一位癌症患者提供最合适的治疗。...
-
谷歌大脑负责人谈人工智能:科幻变现实
11月26日消息,据财富》网站报道,GoogleBrain团队的联合创始人杰夫?迪恩在接受财富》杂志的采访时谈到,研究者在推动人工智能时面临着的挑战是如何把监督学习和非监督学习结合起来,他还解释了强化学习这一AI技...
-
谷歌DeepMind人工智能 学会读唇语让监控变“监听”
谷歌的人工智能DeepMind又厉害了。近日,DeepMind部门与牛津大学研究人员共同创造了一个记录:在测试的上千小时BBC视频片段中,DeepMindAI实现...
-
人工智能AI将成为网络安全防御神器
AI将成为网络安全防御神器凤凰科技讯北京时间11月24日消息,据外媒报道,随着互联网的普及,人们的财产也在迅速数字化(私人照片、客户敏感数据、知识产权等),这时如何保护它们就成了企业和个人的重要一课。虽然每年都...
-
IBM人工智能新突破 根据语音推断年龄
近日,IBM在人工智能领域取得了两个新突破。长远来看,这些成就似乎微不足道,但IBM的JasonPelecanos称这些突破对于越来越智能的机器来说是必不可少的。...