腾讯开放天籁AI降噪技术，“科技公益互助计划”首个场景落地

周一帆2020-09-27 22:10

记者周一帆 伴随数字时代的全面到来，科技助力公益已成为行业趋势，数字科技也正在成为社会公益事业发展的新引擎。

作为“科技公益互助计划”的首个落地场景，值9月27日国际聋人日之际，腾讯多媒体实验室联合腾讯公益慈善基金会、深圳市信息无障碍研究会等机构召开发布会，宣布发起“天籁行动”，通过面向公益开发者、设备厂商、NGO及行业免费开放腾讯天籁AI音频技术，帮助听障人群解决“听不清”难题，并邀请歌手周深作为公益大使，呼吁全社会关注听障人士身心康复，构建信息无障碍环境。本次“天籁行动”发起，也是腾讯继AI寻人、守护者计划等项目实践后，又一个“科技向善”落地的典型案例。

发布会上，腾讯多媒体实验室高级总监商世东直言，在过去与听障人群的多次接触中，他了解到一些听障人群花费高昂的费用安装了人工耳蜗，但在机场、商场等比较嘈杂的公共环境中，依然面临着“听不清”的困扰。

基于此，商世东和团队萌生了通过AI算法改善听障人群听觉体验的想法，并找到了国内最大的人工耳蜗厂商之一——诺尔康(Nurotron)，双方一起讨论在当前人工耳蜗软硬件局限条件下的解决方案，经过长达半年的技术验证，从架构上最终确定了“手机伴侣+人工耳蜗”的联合解决方案。

据诺尔康实验检测数据显示，天籁技术与人工耳蜗结合后，语音识别性能大幅提升，平均识别率达到96.28%，其中带噪语音识别率为93.38%，环境噪音中声音识别率达到94.24%；在手机App中植入天籁技术，手机双麦阵列降噪的信噪比提升 20dB，MOS分提升了0.3-0.5，对于改善听障人群听觉体验有着积极效果。

除此之外，腾讯优图实验室此前还利用深度学习技术，突破“跨年龄人脸识别”，助力警方寻回被拐十年儿童。对此，腾讯表示，公司希望充分发挥技术的社会价值，让AI给社会带来更多可能。

实际上，据商世东介绍，作为新一代实时音频技术，腾讯天籁同时也是腾讯会议背后的关键技术，致力于让用户在实时音视频会议中可以“听得见、听得清、听得真”。腾讯会议通过嵌入腾讯天籁技术，解决了实时音视频会议场景下的各种挑战。

商世东曾在9月11日的腾讯全球数字生态大会视频通信云专场上指出，与传统会议场景相比，实时音视频的云视频会议面临着非常大的挑战。主要包括以下几个方面：音频外设的多样化（客户端，高清音质）、网络条件差异（Ethernet，4G，W i f i）、声学环境复杂（远距离/混响/本底噪声）、入会形式复杂（同地多设备）、噪声类型多变（平稳，非平稳噪声）、客户端的音频设备差异性（蓝牙，有线，内置）、与传统会议设备的兼容、用户需求的多样化（音频内容分享）及现网质量评估的复杂性。而天籁音频技术是实时端到端音频通信的完整解决方案。

目前，天籁音频技术规划的关键策略包括音频通信核心体验、声音场景分类和处理、音频痛点难点问题及差异化体验，最终目标则是提升语音可懂度、自然度、舒适度。

统计数据显示，疫情期间，搭载腾讯天籁技术的腾讯会议，不仅为企业之间构筑了沟通通道，加速了复工复产，更在经济层面创造了巨大的价值与贡献。得益于天籁技术的加持，腾讯会议上线两个月内日活用户就超过1000万，目前用户规模已经突破1个亿，国际版应用也在全球100多个国家和地区上线，助力全球抗击疫情。据北京大学互联网发展研究中心发布的报告显示，今年1月至5月期间，腾讯会议直接节约社会成本达到714亿元。

商世东表示，未来，腾讯将投入更多技术力量，与公益伙伴携手，推动公益行业深耕透明度、数字化、生态效率，持续探索从科技向善到科技公益互助模式的延展，不断扩展公益生态的广度和深度。