js68801金沙国际
北京捷通华声科技股份有限公司——全方位人工智能手艺取服务提供商js68801金沙国际

4787.comNEWS

北京捷通华声科技股份有限公司——全方位人工智能手艺取服务提供商

> 4787.com >

两会讲演辨认准确率超98%,灵云语音云上线新ASR引擎、党政会议语

 公布于:2019-03-21 09:46   阅读:

方才完毕的天下两会,不仅是人大代表忙碌的时候,更是让宽大媒体记者劳碌了起来。用时两周的两会,各大媒体记者需求整顿上百个大大小小的会议、几千名人大代表的种种会议精神和谈话内容,确保消息的时效性。如果出能速记到一字不差,便只得老老实实彻夜整顿会议灌音,费时辛苦。

为了轻易更多媒体记者快速整顿访谈、会议消息稿件,捷通华声在灵云语音云上线最新ASR引擎的基础上,推出党政会议专业范畴言语模子,面临两会谈话、当局讲演、党团会议等相干灌音实现了超高的转写辨认准确率,得到媒体记者同等好评。

党政专业范畴模子优化成绩超高辨认准确率

“我的天!那语音云也忒牛了!本计划熬夜整顿两会灌音的,没想到等了几分钟,灌音内容便酿成了笔墨,太费事了!”一名方才完毕两会事情的记者用了灵云乐识转写灌音后赞叹讲,“并且那准确率太下了,党政相干的专业辞汇险些齐转写对了!”

金沙js58官方网站

两会当局讲演转写效果,准确率远99%

近期,有很多记者运用了灵云语音云转写了两会相关内容的灌音后,纷纷表示辨认准确率大幅进步,像“第十三个五年计划纲领草案”、“周全建成小康社会”、“户籍生齿城镇化率”等等党政范畴的专业辞汇皆转写的非常正确。“之前需求花几个小时整顿的灌音,如今等几分钟便能转写成笔墨,没想到专业辞汇还很准,根基不需要做什么窜改。”

怎样作育失常准的识别率?

本次辨认准确率提拔显着的优越体验,得益于捷通华声针对语音云灵云乐说的语音辨认手艺,在中心ASR引擎的晋级和言语模子的定制范畴练习优化。

js68801金沙国际

语音辨认体系构造框图

从语音辨认道理来说,影响语音辨认准确率很重要的身分就是语音辨认体系的模子,般包孕声学模子、言语模子两局部,捷通华声经由过程抢先的人工智能手艺,在两方面针对党政会议的灌音均停止了针对性的优化。

声学模子是从语音旌旗灯号中抽取的特性到音节概率的盘算。作为语音辨认体系的重要组成局部,它占有着语音辨认大部分的盘算开消,决意着语音辨认体系的机能。捷通华声经由过程将最新推出的全新一代灵云语音辨认引擎应用到语音云中,对建模单位粗粒度、模子练习要领、解码帧率停止立异优化,有用提拔了语音辨认引擎的实行效力、鲁棒性,加强了口音、语速适配才能,大幅提拔了声学模子的结果,识别率得以实现逾越式提拔。

言语模子是音节到字概率的盘算。捷通华声近期经由过程对言语模子停止定制场景练习优化,推出了专门针对党政会议的言语模子,该模子将大量关于党政会议、讲演的语音及文本语料放入个中停止了练习优化,面临触及党政相干的范畴辞汇,实现了更好的婚配度,从而在专业范畴的辨认准确率上有了更大幅度的提拔。

除党政会议范畴,灵云语音云借具有新闻媒体、会议办公、情绪写作、IT科技、影视娱乐、医疗保险、法律法院务等多种场景的语音辨认模子以供用户选择,知足差别范畴的音频转写,资助各行各业的用户实现高效纪录和信息输入。

在线转写编纂 边听边改更高效

语音转写为笔墨后,为更好天进步笔墨整顿效力,语音云借具有在线分音频节点编纂功用,用户能够点击恣意需编纂的笔墨,体系会定位到该处笔墨的音频节点,然后边听该段音频边立即修正笔墨,哪里笔墨转写禁绝,能够随时点击定位到响应灌音上停止修正。

一样平常一段一小时的采访灌音需求花三四个小时才气整顿完,而有了这个壮大功用,经由过程边听边校正,一小时的灌音听完也便整顿完了。而且,完整制止了整顿灌音时听着灌音手动按下停息,在word上敲打笔墨后再返来点击继承播放的庞大操纵。

 
2015.com



金沙js58官方网站