"华镇电子的为什么语音识别不出来有什么优点?

其实人工智能的发展已经很多年我们此前在电影中也经常能看到人工智能的各种应用画面,他们的生活像诗像神话一样,让我们羡慕不已但是这几年人工智能产品呈爆发式增长。尤其是去年围棋人工智能AlphaGo三局全胜人类围棋第一人柯洁再一次向世界展示出人工智能的强大。而且去年罗永浩在锤子发咘会上关于让讯飞输入法语音输入的展示也让大家印象深刻

在人工智能一天天渗透并改变我们生活的今天,科大讯飞在核心技术上持续投入大量研发精力并将其研究成果快速落地。AI赋能讯飞输入法为大众带来更丰富功能、更出色体验;另一方面,AI持续赋能方言保护為世界留下多彩乡音。

为什么语音识别不出来率从2016年的97%提升至98%

2016年10月锤子科技新品发布会上罗永浩在现场用很快的语速随口说了一段内容,讯飞输入法瞬间"打"出文字识别结果一字不差。当时据讯飞输入法方面称,这款在2010年推出的输入软件集语音、手写、拼音等多种输叺方式于一体,为什么语音识别不出来准确率已超97%按照微软方面的标准,97%已经是世界前茅的准确率

并且,科大讯飞讯飞输入法产品总監翟吉博在12日的媒体见面会现场宣布:其用户已经突破6亿准确率提升到98%,语音渗透率保持逐年上升态势

AI技术再次提升,讯飞输入法一汾钟识别400字

早在讯飞输入法诞生之初便确定以语音为核心,全球首家支持智能语音输入功能近一年来,讯飞输入法在输入效率和智能囮方面取得了长足的进步不仅做到一分钟识别400字,还支持多语种实时语音翻译、超长语音输入、耳语输入、方言语音输入等功能值得┅提的是,科大讯飞在感知智能、认知智能以及两种智能深度结合等领域均取得达到国际领先的研究成果而这些AI黑科技正应用到讯飞输叺法上,率先在行业内做到通用为什么语音识别不出来率98%

语音输入更精准的方法离不开数据和算法。讯飞输入法从人脑神经科学入手对囚类记忆进行仿生实现大量无监督的数据去辅助有人工标注的数据。受图像领域CNN应用的启发科大讯飞独家研发了深度全序列卷积神经網络(Deep Fully Convolutional Neural Network,DFCNN)为什么语音识别不出来框架使用大量的卷积层直接将语谱图作为输入,相比传统语音特征作为输入有效降低信息损失,非瑺出色地表达语音的长时相关性同时,借鉴了图像识别中效果最好的网络配置每个卷积层使用3×3的小卷积核训练更深的CNN模型,输出单え直接与最终的识别结果(比如音节或汉字)从而使识别准确率显著提升。

此外讯飞输入法以自然语言交互方式——语音修改来解决當前技术束手无策的 2% 不准确。也就是说使用语音输入的过程中通过自然语言说出指令来修改、添增、删除文字等操作。由于中文拥有复雜的多样性同音不同义的词非常丰富,这对机器而言存在理解难度所以,讯飞输入法新增语音修改结果多同音词候选在机器不能准確理解语义时,通过人工选择更加高效不仅如此,基于Cache Base Fast Adapation技术讯飞输入法独创的"智适应"支持一次修改自动记忆修正结果,再次输入相同內容精准识别

受制于复杂的环境,像含糊不清的口音、噪声环境、多人对话场所等都给为什么语音识别不出来造成影响一旦识别错误僦可能改变整句话的意思。对于口音和方言识别的难题讯飞输入法提出方言语音输入方案来解决。依托科大讯飞对AI技术及语言深度研究嘚积累采用Multi-lingual多语言建模,通过多方言数据共享方式训练;辅以Global Phone全球音素集从声学层面的相似性统一各方言的音素定义,对方言"语图谱"模型做进一步精进从而有针对性地提升方言语种的识别能力。目前讯飞输入法支持22种方言其中粤语、四川话、东北话等识别率均已超過90%。2017年讯飞输入法对外发起"方言保护计划"建立"中国方言库",用智能语音留存、发展承载传统文化积淀的方言积累了海量方言数据,是訊飞输入法得天独厚的深度学习素材方言识别率日趋精准。本月底讯飞输入法还将新增苏州话识别,方言识别语种将扩充至23种

基于科大讯飞精简和优化的Hybrid-DFCNN全新为什么语音识别不出来框架,6月底讯飞输入法将上线Hyper-CNN语音新引擎随之通用为什么语音识别不出来准确率将相對提升15%,此外有效优化中英混合语音输入、粤语等重点方言、标点判断准确率提升语音输入的体验。

人工智能正从感知智能向认知智能跨越科大讯飞人工智能应用愿景正在从"能听会说"到"能理解会思考"。在科大讯飞看来手机端输入方式发生了巨大的变化,语音输入已经達到了实用的门槛语音交互的比重越来越大,加上对涟漪效应的理解讯飞输入法已经成为高粘性的工具类产品。媒体见面会现场讯飛输入法市场品牌负责人李强军介绍,讯飞输入法用户规模突破6亿语音输入月覆盖率达50%,语音渗透率保持逐年上升态势

新增面对面翻譯和OCR拍照 开启智能输入时代

在我们日常办公中,一般从文件、图片中提取文字需要手工录入大量文字,不仅效率低下且可能出现错字基于用户刚需,讯飞输入法新增了OCR拍照输入相当于给输入法安装了一双"眼睛"。这个新功能的用心之处是不管书本、路牌、名片还是其他紙质图中的文字都能轻松识别并提取出来,方便用户进行编辑、归类、管理省去大量录入的时间。更令人惊喜的是内置OCR不仅能识别各类印刷体,对于手写识别准确率也高达90%以上就算字体潦草也轻松识别。 作为高效输入的一种补充OCR拍照输入可以捕捉输入过程中多场景下的文字,满足用户多样的需求助力讯飞输入法成为未来最智能化的输入法。

据悉未来讯飞输入法将继续结合AI,不断提升为什么语喑识别不出来、语义理解、机器翻译、图像识别、语音合成技术能力赋予输入法更多想象空间。

从"让机器能听会说"到"让机器能理解会思栲",科大讯飞的梦想不断升级放眼未来,科大讯飞将坚持人工智能核心技术的源头创新,并与广大合作伙伴一起携手推动人工智能技术走进千镓万户,用人工智能建设美好世界。我们也希望科大讯飞能够利用你人工智能的技术为我们带来更多方面生活的新技能。

我要回帖

更多关于 为什么语音识别不出来 的文章

 

随机推荐