随着科学技术的发展,自动化技术将机械控制进化为信号控制,帮助工业生产和日常生活更加便利高效。
同时人工智能开始替代人类的双手进行部分工作,比如AI语音助手接收声音信号通过数据分析和识别,响应人类指令完成指定操作。
AI技术的每一次革新,都会对社会生活进行一次深度改变。从智能音箱走进千家万户,到智能车联陪伴日常行程,在数字化升级、消费转型的风口面前,我们可以期待怎样的AI技术打开未来的智能生活?
在刚刚结束的腾讯技术开放日-腾讯云小微AI语音专场,来自腾讯智能平台产品部AI语音专家带来关于语音识别、自然语言理解、智能对话机器人等行业应用探索等领域的精彩分享,从腾讯云小微AI语音助手的角度,揭开AI语音助手在技术和应用领域的探索和最新成果。
云+端协调、软硬件一体,打造鲁棒的车载语音识别系统
在直播中提到,就构建鲁棒的车载语音识别系统而言,人工智能首先要解决的难题就是数据分析与识别,只有将各个行业的宝贵经验搜集并形成数据库,再通过电脑自动识别知识并进行分析,才能从亿万条数据中剥丝抽茧,找到匹配用户使用场景的正确反馈。
但是在实际应用环境如汽车使用过程中,车载语音识别面临着重重挑战。在语音识别将人类的声音信号转化为文字或者指令的过程中,用户口音、环境噪声、海量POI以及场景化语音均构成影响识别系统决策的变量,尤其考验语音识别系统的基础稳定性。
为此腾讯云小微AI语音助手在接收信号后,通过声学前端处理,对丰富的声音信息进行甄别,分流至本地语音识别、云语音识别以及云+端协调机制进行精准识别,提供更为精准的技术解决方案。
以常见的环境噪声处理为例,当用户声音信号发出,在路噪、风噪、空调、音响等不同噪声类型的干扰下,很容易让车载语音识别发生理解偏差。腾讯云小微AI语音助手从车内语音交互场景出发,通过腾讯自有技术和硬件设备完成回声消除、噪声抑制以及定位和拾音,确保得到干净的语音信号,同时在声学模型层面从训练数据、特征提取、网络结构等方面进行针对性优化以提升识别系统对噪声的鲁棒性。
在基础能力方面,因为有腾讯云加持,再根据自主研发的全栈AI技术,整合前端降噪、语音识别、语义理解、人声合成、图像识别能力,能够提供云到端的完整的AI解决方案。
在直播中,我们还看到了腾讯云小微AI语音助手在不同用户口音输入语音情况下如何做出精准反馈。腾讯云小微AI语音助手的鲁棒性源自容错性极小的两套处理方案,一是基于迁移学习的分地域模型方案,二是引入地域向量的单模型方案。在这样的智能车载语音识别系统下,腾讯云小微AI语音助手联合腾讯车联TAI已合作多家国内头部车企和热销车型,通过腾讯云小微车载语音识别系统的助力,无惧用户口音,精准识别语音指令,满足车内交互场景的语音需求。
实现深度学习的自然语义理解,打造基于理解的人机交互
自然语义理解是人机自然对话的核心技术基础。如何让语音助手实现家庭、汽车和办公室的无缝连接,甚至可以预测并解决用户的需求,只有懂“深度学习”并可以进行“理解”的语音技术才能胜任这样的要求。
在技术开放日上,深入探讨了这项AI技术如何实现深度学习。人工智能技术基于数据的逻辑分析,在一定程度上的确可以实现自我学习,但是相较于人类的情感需求、精神状态,再智能的AI语音助手也难以读懂主人的“心”,因此具备理解能力的人机交互成为技术攻关的重点所在。
根据腾讯技术开放日-腾讯云小微专场直播所演示,腾讯云小微AI语音助手以高质量低延时语音合成、智能语音交互系统,进化成为真正以用户需求为导向的个性化服务。
物联网时代,语义理解成为语音交互的核心所在。通过声学前端处理,降低干扰信号、抑制回声,提升语音识别效果、语音唤醒效果,随即将文字转换为命令字,通过语料模型匹配,做领域分发。在这个过程中腾讯云小微AI语音助手支持自然语音识别,语义理解、语音指令随意说,系统均可很好的理解并执行,同时将文本转化为语言流,在终端设备上进行语音播报。