语言信号处理实用教程 本书特色
语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,是一门新兴的交叉学科。涉及到数字信号处理、模式识别、语言学、生理学及认知学科和人工智能等许多学科领域。从技术角度讲,语音信号处理是信息高速公路、多媒体技术、办公自动化、现代通信及智能系统等新兴领域应用的核心技术之一。用数字化的方法进行语音的传送、存储、识别、合成、增强等是整个数字化通信网中*重要、*基本的组成部分之一。计算机和集成电路技术的发展,推动了语音信号处理的实用化。 内容包括绪论、语音信号处理基础知识、语音信号时域分析、语音信号频域分析、语音信号的同态处理和倒谱分析、矢量量化技术、神经网络在语音信号处理中的应用、语音识别、说话人识别、语音增强等内容,以及语音信号的线性预测分析、矢量量化技术、隐马尔可夫模型、语音编码、语音合成、语音信号处理实验等内容,同时学会用matlab语言来处理实际的语音信号。
语言信号处理实用教程 目录
第1篇 语音信号处理基础篇
第1章 绪 论
1.1 语音信号处理概述
1.2 语音信号处理的发展
1.3 语音信号处理的应用
思考与练习
第2章 语音信号处理的基础知识
2.1 语音和语言
2.2 语音产生的过程及其声学特性
2.2.1 语音的发音器官
2.2.2 人类语音的产生过程
2.2.3 共振峰频率
2.3 语音信号的声学特性
2.3.1 语音信号的物理属性
2.3.2 语音信号的统计特性
2.3.3 语音信号的时间波形和频谱特性
2.4 语音信号产生的数字模型
2.4.1 激励模型
2.4.2 声道模型
2.4.3 辐射模型
2.4.4 完整的语音信号数字模型
2.5 人类的听觉功能
2.5.1 听觉器官
2.5.2 听觉感知
2.5.3 声音三要素
2.5.4 听觉掩蔽效应
思考与练习
第2篇 语音信号处理分析篇
第3章 语音信号的时域分析
3.1 语音信号的数字化和预处理
3.1.1 取样和量化
3.1.2 预处理
3.1.3 语音信号的加窗处理
3.2 短时能量分析
3.2.1 短时平均能量
3.2.2 短时平均幅度
3.3 短时过零分析
3.4 短时相关分析
3.4.1 短时自相关函数
3.4.2 修正的短时自相关函数
3.4.3 短时平均幅度差函数
3.5 基音周期估值
3.5.1 基于短时自相关法的基音周期估值
3.5.2 基于短时平均幅度差函数amdf法的基音周期估值
3.5.3 基音周期估值的后处理
思考与练习
第4章 语音信号的频域分析
4.1 短时傅里叶变换的定义
4. 2 短时傅里叶变换的两种解释
4.2.1 标准傅里叶变换的解释
4.2.2 滤波器的解释
4.3 短时傅里叶变换的取样率
4.3.1 时域取样率
4.3.2 频域取样率
4.3.3 总取样率
4.4 语音信号的短时综合
4.4.1 滤波器组求和法
4.4.2 快速傅立叶变换求和法
4.5 语谱图
思考与练习
第5章 语音信号的同态处理
5.1 卷积同态处理的基本原理
5.2 复倒谱和倒谱
5.2.1 复倒谱
5.2.2 倒谱
5.3 语音信号的复倒谱
5.3.1 声门激励信号的复倒谱
5.3.2 声道冲激响应序列的复倒谱
5.4 复倒谱的几种计算方法
5.4.1 微分法
5.4.2 *小相位信号法
5.4.3 递推法
5.5 语音的倒谱分析及应用
5.5.1 语音同态滤波系统构成
5.5.2 语音的倒谱分析原理
5.5.3 语音的倒谱应用
思考与练习
第6章 语音信号的线性预测分析
6.1 线性预测分析的基本原理
6.1.1 信号模型
6.1.2 语音信号的线性预测模型
6.2 线性预测方程的建立
6.3 线性预测分析的经典解法
6.3.1 自相关法
6.3.2 协方差法
6.3.3 自相关法和协方差法的比较
6.4 格型法
6.4.1 格型法的基本原理
6.4.2 格型法的求解
6.5 线谱对lsp分析
6.5.1 lsp的定义和特点
6.5.2 lpc参数到lsp参数的转换
6.5.3 lsp参数到lpc参数的转换
6.6 导抗谱对isp分析
6.6.1 isp的定义和特点
6.6.2 lpc与isp参数间的转换
6.7 lpc导出的其它语音参数
6.7.1 反射系数
6.7.2 对数面积比系数lar
6.7.3 lpc倒谱系数lpcc
6.8 lpc分析的频域解释
6.8.1 *小预测误差的频域解释
6.8.2 lpc谱估计
思考与练习
第7章 语音信号的矢量量化
7.1 矢量量化的基本原理
7.1.1 矢量量化的定义
7.1.2 矢量量化系统的工作过程
7.1.3 矢量量化与标量量化的比较
7.1.4 失真测度
7.2 *佳矢量量化器
7.2.1 *佳划分
7.2.2 *佳码书
7.3 矢量量化器的设计算法
7.3.1 lbg算法
7.3.2 初始码书的生成
7.3.3 空胞腔的处理
7.4 降低复杂度的矢量量化系统
7.4.1 树形搜索矢量量化器
7.4.2 多级矢量量化器
7.4.3 波形/增益矢量量化器
7.4.4 分离均值矢量量化器
7.4.5 有记忆的矢量量化器
7.5 语音参数的矢量量化
思考与练习
第8章 隐马尔可夫模型
8.1 隐马尔可夫模型的引入
8.2 隐马尔可夫模型的定义
8.3 隐马尔可夫模型的计算
8.3.1 概率pr [y/λ ]的计算
8.3.2 hmm的识别
8.4 hmm的各种结构类型
8.4.1 a矩阵参数分类
8.4.2 b矩阵参数分类
8.4.3 其他一些特殊的hmm形式
8.5 hmm的一些实际问题
8.5.1 下溢问题
8.5.2 参数的初始化问题
8.5.3 b矩阵参数的选择
思考与练习
第9章 语音信号检测分析
9.1 基音提取
9.1.1 自相关法
9.1.2 并行处理法
9.1.3 倒谱法
9.1.4 简化逆滤波法
9.2 共振峰估值
9.2.1 带通滤波器组法
9.2.2 离散傅里叶变换(dft)
9.2.3 倒谱法
9.2.4 lpc法
思考与练习
第3篇 语音信号处理应用篇
第10章 语音编码
10.1 语音信号的压缩编码原理
10.1.1 语音压缩的基本原理
10.1.2 语音通信中的语音质量
10.1.3 语音编码的分类
10.2 语音编码性能的评价指标
10.2.1 编码速率
10.2.2 编码质量
10.2.3 编解码延时
10.2.4 算法复杂度
10.3 语音信号波形编码
10.3.1 脉冲编码调制pcm
10.3.2 自适应预测编码apc
10.3.3 自适应差分脉冲编码调制adpcm
10.3.4 子带编码sbc
10.3.5 变换编码tc
10.4 语音信号参数编码
10.4.1 声码器的工作原理
10.4.2 相位声码器
10.4.3 通道声码器
10.4.4 共振峰声码器
10.4.5 同态声码器
10.4.6 线性预测声码器
10.5 语音信号混合编码
10.5.1 合成分析技术
10.5.2 感觉加权滤波器
10.5.3 激励模型的改进
10.5.4 g.728语音编码标准简介
10.6 语音信号宽带变速率编码
10.7 各种语音编码方法的比较
10.7.1 波形编码的信号压缩技术
10.7.2 波形编码和声码器的比较
10.7.3 各种声码器的比较
思考与练习
第11章 语音合成
11.1 概述
11.2 语音合成原理
11.2.1 波形合成法
11.2.2 参数合成法
11.2.3 规则合成法
11.3 语音合成系统的特性
11.3.1 合成单元
11.3.2 合成参数
11.3.3 合成音质
11.4 共振峰合成
11.4.1 共振峰合成原理
11.4.2 级联型共振峰模型
11.4.3 并联型共振峰模型
11.4.4 共振峰合成实例
11.5 线性预测合成
11.6 基音同步叠加法
11.6.1 算法原理
11.6.2 算法实现步骤
11.7 文语转换系统
11.7.1 文语转换系统的组成
11.7.2 汉语按规则合成
11.8 语音合成技术的应用
11.8.1 语音合成的典型应用
11.8.2 专用语音合成硬件及语音合成器芯片
思考与练习
第12章 语音识别
12.1 概述
12.2 语音识别原理
12.3 动态时间规整
12.4 有限状态矢量量化技术
12.4.l fsvq原理及fsvq声码器
12.4.2 fsvq语音识别器
12.5 孤立词识别系统
12.6 连续语音识别
12.6.1 识别基元的选择与切分
12.6.2 发音变化及音征提取
12.6.3 训练及新的识别方法
12.6.4 基于hmm统一框架的大词汇量非特定人连续语音识别
思考与练习
第13章 说话人识别
13.1 概述
13.2 特征选取
13.2.1 说话人识别所用特征
13.2.2 特征类型的优选准则
13.3 说话人识别系统的结构
13.4 说话人识别中的识别方法
13.4.1 模板匹配法
13.4.2 概率统计方法
13.4.3 动态时间规整方法
13.4.4 矢量量化方法
13.4.5 隐马尔可夫模型方法
13.4.6 人工神经网络方法
13.5 声纹识别应用前景
13.5.1 声纹识别特性
13.5.2 声纹识别应用
13.5.3 声纹识别未来
思考与练习
语言信号处理实用教程 作者简介
吴进西安邮电大学电子工程学院教师,主持陕西省教育厅项目1项(2013JK1075),主持研究生教改项目1项,在国内外期刊上发表论文20余篇,其中被EI核心期刊收录4篇,中文核心期刊12篇,科技核心3篇。在国内外期刊上发表论文20余篇,其中被EI核心期刊收录4篇,中文核心期刊12篇,科技核心3篇;参加过《数字信号处理》(卢光跃、邵朝、阴亚芳,北京邮电大学出版社,2004年)教材的校稿工作。