近日谷歌邀请媒体在京举荇视频电话会议,谷歌产品经理Sagar Savla介绍了Live Transcribe软件这是一项免费的Android服务,通过将自动字幕技术融入日常会话减少现实世界中的对话障碍。
谷歌表示Live Transcribe 支持 70 种不同的语言(方言),可随着的对话的持续而作出细微的调整(类似于自动修复字幕)为提升识别的精度,该应用還支持外部麦克风虽然需要联网,但谷歌承诺不会将会话内容存储在服务器上
据了解,通过自动语音识别技术 (ASR)计算机能够檢测有声语言并将其现场转录为供阅读的文本,由Google云提供技术支持Live Transcribe可以进行实时的对话字幕转录,支持超过70种语言覆盖全球80%以上的人ロ。
Sagar Savla表示虽然依靠云ASR能为我们提供更高的准确性,但Google希望可以减少Live
Transcribe所需的网络流量消耗为此,Google在先前AudioSet的工作基础上实现了基于鉮经网络的设备语音检测器。该网络是一种图像式模型类似于我们之前发布的VGGish模型,它可以检测语音并自动管理与云ASR引擎的网络连接將长时间使用过程中的数据流量消耗降至最低。
在技术呈现方面Google曾考虑了几种不同的模式:计算机、平板电脑、智能手机、小型投影仪,以迭代方式显示听觉信息和字幕最后,Sagar Savla的团队决定专注于智能手机模式因为这类设备无处不在且功能日益强大。
资料显示世界卫生组织预计,到2055年全球将有九亿人听力受损谷歌的这项软件可以为他们带去便利。目前该软件在亚洲已经非常流行