灵云人工智能论坛

 找回密码
 立即注册
搜索
查看: 3464|回复: 3

语音识别是什么? [复制链接]

shake 非 VIP 会员 

Rank: 10Rank: 10Rank: 10

最佳新人 活跃会员 热心会员 推广达人 宣传达人 灌水之王 突出贡献 优秀版主 荣誉管理 论坛元老

发表于 2013-8-9 12:07:57 |显示全部楼层
本帖最后由 shake 于 2013-8-19 10:37 编辑

语音识别(Automatic Speech Recognition,简称ASR),就是让机器通过分析和理解过程把语音信号转变为相应的文本或命令的尖端技术,简单的说就是让计算机“听”懂人说话。目前提供中文普通话的语音识别功能,技术上分为关键词检出、有限词识别、语法识别、自由说识别
踩过的脚印
回复

举报

MiMi 非 VIP 会员 

Rank: 3Rank: 3

发表于 2013-8-16 09:00:19 |显示全部楼层
什么是“非特定人有限词识别”?

Rank: 1

发表于 2013-8-19 09:54:28 |显示全部楼层
以前有“特定人”的识别,也就是需要让这个人先说几句话进行训练或模型适配,然后针对这个人的识别率会比较高。但由于需要先采集录音,很麻烦,因而只在个别领域里得到过应用。技术发展到现在,基本上都是“非特定人”的了,也就是说无论是谁,上来直接说就能识别。这就需要模型的通用性、适应性、鲁棒性更好。
“有限词识别”则是相对于“自由说”而言的,就是说的内容局限在有限的词条内,而不是任意说的内容都能识别,常用于一般的命令控制场景下。扩展一下是“语法识别”,可以按照一定的语法规则说,但仍然不是可以任意地说。
其实上面这么分有点误导,其实应该是分为 关键词检出、有限词识别、语法识别、自由说识别,这几类比较准确一些。至于特定人、非特定人,每种识别类型都是可以再分为这两类,而且现在基本上都是非特定人了。
匿名  发表于 2017-5-5 11:16:57
可以实时转写吗
验证问答 换一个 验证码 换一个

Archiver|任务|灵云 ( 京ICP证030095号 )

GMT+8, 2017-7-28 16:53 , Processed in 0.068390 second(s), 22 queries .

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部