华科学家研发可穿戴人工喉
2023-04-11 2306 王雅林 澳门日报
失语者或可再次“开口说话”
中国清华大学积体电
路学院日前发布消息称,
该校研究团队在智能语音交
互方面取得重要进展,其研发
的可穿戴人工喉可以感知喉部
发声相关信号,并通过人工智
能模型将其识别和合成为语音
。研究结果为语音辨识与交
互系统提供了一条新的技术
途径。
语音是人类交流的重要方式,但说话人的健康状态等因素往往会影响声音识别。研究人员表示,一直以来,团队在致力改进语音辨识和交互技术以应对微弱的声源或嘈杂的环境。多通道声学感测器可以显着提高声音识别的精度,但会导致更大的设备体积,而可穿戴设备能够获取高品质的原始语音或其他生理信号。
然而,目前尚无充分的证据表明喉部肌肉的运动模式和反映在体表的发声器官振动中隐含着可识别的语音特徵,且尚无实验证明其作为语音辨识技术的完备性。
为解决上述问题,研究团队开发了一款基于石墨烯的智能可穿戴人工喉,同商业麦克风和压电薄膜相比,人工喉对低频的肌肉运动、中频食管振动和高频声波资讯有很高的灵敏度,同时也具有抗杂讯的语音感知能力。对声学信号和机械运动的混合模态的感知使人工喉能够获得更低的语音基频信号。
此外,该器件还可以通过热声效应实现声音的播放功能。人工喉的製作过程简单、性能稳定、易于集成,为语音辨识和交互提供了一种新的硬体平台。
团队还利用人工智能模型对人工喉感知的信号进行语音辨识和合成,实现了对基本语音元素(音素、声调和词语)的高精度识别,以及对喉癌患者模糊语音的识别与再现,为声音障碍者的沟通和交互提供了一种创新的解决方案。实验结果表明,人工喉採集的混合模态语音信号可以识别基本语音元素(音素、音调和单词),平均準确率为百分之九十九点○五。同时人工喉的抗杂讯性能明显优于麦克风,在六十分贝以上环境杂讯下仍能保持识别能力。通过集成AI模型,人工喉能够识别一名喉切除术患者模糊说出的日常词彙,準确率超过九成。识别出的内容被合成为语音在人工喉上播放,可以初步恢复患者的语音交流能力。
一枚硬币大小的石墨烯片,贴在颈部靠近喉咙处,就能帮助发音障碍者获得新“声”。研究团队介绍称,该人工喉还有很大的优化和拓展空间,例如提高声音的品质和音量,增加语音的多样性和表情,以及结合其他生理信号和环境资讯实现更自然和智能的语音交互。研究团队希望通过进一步的研究和合作,让人工喉造福更多的声音障碍者和语音交互的使用者,为他们解决声音问题提供帮助。
本文或来源网络共享或用户投稿文章,不代表澳门新闻日报立场,转载联系原作者并注明出处:https://www.yeeea.com/keji/4058/