杂志名称:工程技术
主管单位:科技部西南信息中心
主办单位:重庆维普资讯有限公司
出版周期:月刊
国内刊号;CN50-9203/TB
国际刊号:ISSN1671-5519
出版语言:中文
发行范围:全国公开发行
杂志开本:16开
出版地:重庆市
总编:车东林
总监:李红举
邮箱:gcjszzcom@163.com
网址:www.gcjszz.com
收录情况:
中国维普网全文收录期刊
中国核心期刊(遴选)收录期刊
中国学术期刊(光盘版)全文收录期刊
发布日期:2018-10-23基于深度学习的语音识别系统研究
- 杂志名称: 基于深度学习的语音识别系统研究
- 作者:
详细内容
信息技术日新月异的进步使语音识别成为可能,在全球范围内引发了极大的关注,语音识别的准确率和效率不断提高。人工神经网络(ANN)最早于上世纪八十年代开始引入声学领域,并利用反向传播方法(BP)对网络进行训练。随着相关研究的补充和完善,传统神经网络已经难以满足使用需求,各种缺陷越来越突出,人们开始寻求新的识别方法,尝试通过高斯混合模型(GMM)实现语音识别。2006年,著名学者Hinton将深度学习
[1]引入语音识别过程,可以比较有效地防止陷入局部最优。以深度神经网络(DNN)为基础的声学模型
[2]得到了大范围应用,极大地促进了语音识别的效果的优化。
1 隐马尔科夫模型
1.1 概述
可以通过参数

对特定的隐马尔科夫模型进行表示
[3]。模型的状态集合是

,其中

为状态个数;

代表不同状态下能够观测到的输出,集合中

代表可观测符号数量;

代表

时刻到

完成状态转换的概率,全部的

共同构成矩阵

,即:

,

成立,

。

代表能够观测到的状态的概率情况,分析过程中结合观测量对HMM模型进行区分,包括离散和连续两种类型。

为

时刻的观测值,它是由不可见的内部状态

决定的,则有:

为初始状态分布,有

={

},

。如图1-1所示,HMM是个双重随机过程。下一时刻出现状态转移的概率仅取决于该时刻所在的位置,不受历史位置信息的影响,是一种很有代表性的马尔科夫链,通过参数A进行描述。通常用随机过程B来表示依附于状态的观测事件的概率,得到观测值序列。

图1-1
1.2 隐马尔可夫模型的三个基本问题