本书主要内容包括多媒体基础知识,多媒体计算机及多媒体音频/视频数据处理,多媒体的关键技术,超文本、超媒体及多媒体数据库技术等。全书共9章,包括:概论、基础知识、感知与质量、量化和编码、信号压缩方法、帧内编码、帧间编码、语音与音频编码、多媒体数据的传输与存储等。全书涵盖了图像、视频和音频压缩及表示的理论背景和多方面应用,并通过举例,使读者的理解更加深入。
目 录
章 概论 1
1.1 概念和术语 1
1.1.1 信源编码的信号表示 2
1.1.2 传输的优化 4
1.2 信号源与信号的获取 5
1.3 多媒体信号的数字表示 7
1.3.1 图像与视频信号 8
1.3.2 语音和音频信号 13
1.3.3 压缩技术的必要性 13
1.4 习题 13
第2章 基础知识 15
2.1 信号与系统 15
2.1.1 基本信号 15
2.1.2 系统运算 17
2.2 信号与傅里叶频谱 19
2.2.1 二维和多维坐标上的频谱 19
2.2.2 时空信号 21
2.3 多媒体信号的采样 23
2.3.1 可分离的二维采样 24
2.3.2 不可分离的二维采样 26
2.3.3 视频信号的采样 30
2.4 离散信号处理 34
2.4.1 线性移不变系统 34
2.4.2 离散傅里叶变换 34
2.4.3 z变换 35
2.4.4 多维线性移不变系统 37
2.5 统计分析 39
2.5.1 样点的统计特性 39
2.5.2 联合统计特性 43
2.5.3 随机信号的频谱特性 47
2.5.4 马尔可夫链模型 48
2.5.5 信息论的统计学基础 50
2.6 线性预测 54
2.6.1 自回归模型 54
2.6.2 线性预测 60
2.7 线性块变换 70
2.7.1 正交基函数 70
2.7.2 正交变换的类型 73
2.7.3 变换的效率 84
2.7.4 重叠块变换 84
2.8 滤波器组变换 86
2.8.1 抽取和插值 87
2.8.2 子带滤波器的性质 91
2.8.3 滤波器组结构的实现 96
2.8.4 小波变换 101
2.8.5 二维与多维滤波器组 106
2.8.6 金字塔分解 109
2.9 习题 112
第3章 感知与质量 118
3.1 视觉特性 118
3.1.1 眼生理学 118
3.1.2 灵敏度函数 119
3.1.3 彩色视觉 122
3.1.4 双目视觉与重现 122
3.2 听觉特性 124
3.2.1 耳生理学 124
3.2.2 灵敏度函数 124
3.3 质量测度 127
3.3.1 客观信号质量测度 128
3.3.2 主观评价 133
3.4 习题 137
第4章 量化与编码 138
4.1 标量量化与脉冲编码调制 138
4.2 编码理论 143
4.2.1 信源编码定理与率失真函数 143
4.2.2 相关信号的率失真函数 144
4.2.3 多维信号的率失真函数 147
4.3 量化器的率失真最优化 148
4.4 熵编码 152
4.4.1 变长码字的特性 152
4.4.2 哈夫曼码的设计 154
4.4.3 系统变长码 155
4.4.4 算术编码 159
4.4.5 自适应与基于上下文的熵编码 163
4.4.6 熵编码与传输误差 166
4.4.7 伦佩尔-齐夫编码 167
4.5 向量量化 169
4.5.1 向量量化的基本原理 169
4.5.2 使用均匀码书的向量量化 172
4.5.3 使用非均匀码书的向量量化 174
4.5.4 结构化码书 176
4.5.5 自适应向量量化 180
4.5.6 码率约束向量量化 182
4.6 网格编码量化 183
4.7 习题 186
第5章 信号压缩方法 188
5.1 行程编码 188
5.2 预测编码 190
5.2.1 开环和闭环预测系统 190
5.2.2 非线性移变预测 192
5.2.3 传输损耗的影响 193
5.2.4 向量预测 193
5.2.5 延迟决策预测编码 196
5.2.6 多分辨率金字塔中的预测 197
5.3 变换编码 200
5.3.1 离散变换编码的增益 201
5.3.2 变换系数的量化 203
5.3.3 变换系数的编码 206
5.3.4 有损传输下的变换编码 208
5.4 具备多重解码能力的码流 208
5.4.1 联播与转码 209
5.4.2 可伸缩编码 209
5.4.3 多描述编码 210
5.5 分布式信源编码 212
5.6 习题 213
第6章 帧内编码 215
6.1 二值图像压缩 215
6.1.1 二级图像的压缩 215
6.1.2 二值形状编码 218
6.1.3 轮廓编码 220
6.2 图像的向量量化 221
6.3 图像的预测编码 223
6.3.1 二维预测 223
6.3.2 二维块预测 224
6.3.3 预测误差的量化与编码 226
6.3.4 二维DPCM中的误差扩散 227
6.3.5 二维预测编码中边信息的编码 228
6.4 图像的变换编码 230
6.4.1 块变换编码 230
6.4.2 变换系数的量化与编码 232
6.4.3 重叠块变换编码 240
6.4.4 子带和小波变换编码 241
6.4.5 针对信号特性的变换基局部自适应 246
6.5 无损和近无损图像编码 248
6.6 基于合成的图像编码 249
6.6.1 基于区域的编码 250
6.6.2 颜色和纹理合成 252
6.6.3 照明效果的合成 254
6.7 分形图像编码 255
6.8 三维图像编码 257
6.9 重构滤波 258
6.10 静止图像编码标准 261
6.11 习题 264
第7章 帧间编码 268
7.1 帧内补偿编码 268
7.2 混合视频编码 269
7.2.1 运动补偿混合编码器 269
7.2.2 帧内预测误差信号的特性 272
7.2.3 量化误差反馈和误差扩散 274
7.2.4 运动补偿预测中的参考图像 276
7.2.5 运动补偿的精度 287
7.2.6 隔行视频信号的混合编码 292
7.2.7 混合编码器的优化 294
7.2.8 采用子带/小波变换的混合编码 296
7.3 时空变换编码 298
7.3.1 帧间变换与子带编码 298
7.3.2 运动补偿时域滤波 300
7.3.3 基于MCTF表示的量化与编码 304
7.4 边信息的编码(运动、模式、划分方式) 306
7.5 可伸缩视频编码 312
7.5.1 混合视频编码中的可伸缩性 313
7.5.2 可伸缩视频编码的标准化 319
7.6 多视图视频编码 322
7.7 基于合成的视频编码 328
7.7.1 基于区域的视频编码 329
7.7.2 超分辨率合成 331
7.7.3 动态纹理合成 331
7.8 视频编码标准 333
7.9 习题 340
第8章 语音与音频编码 342
8.1 语音信号编码 342
8.1.1 线性预测编码 342
8.1.2 参数(合成)编码 345
8.1.3 语音编码标准 346
8.2 一般音频、音乐与声音编码 347
8.2.1 音频信号的变换编码 347
8.2.2 基于合成的音频与声音信号编码 350
8.2.3 立体声与多声道音频信号的编码 352
8.2.4 音乐与声音编码标准 358
第9章 多媒体数据的传输与存储 362
9.1 数字多媒体服务 362
9.2 网络接口 363
9.3 对信道特性的适应性 366
9.3.1 码率与传输控制 367
9.3.2 错误控制 370
9.4 媒体传送、存储和再现 374
9.4.1 广播应用 375
9.4.2 通信服务 378
9.4.3 文件存储 379
9.4.4 互联网和移动流媒体 380
附录A 向量与矩阵代数 385
附录B 符号和变量 391
附录C 缩略语 395
附录D 参考文献 403
附录E 词汇表 418
卢鑫,哈尔滨工业大学电子与信息工程学院讲师,硕士研究生导师。2013年12月毕业于英国华威大学(University of Warwick)并获得计算机科学博士学位。主要研究方向包括:视频编码标准、数据压缩、图像和视频信号处理及射频/微波非线性测量理论等。