本书清晰易懂地介绍了数字音频处理和编码的基本原理和实际应用。本书解释了广泛的基本音频处理技术,强调了自动调整不同算法的新方向,并讨论了**进的DASP方法。第三版更新了音频处理的**信号处理算法。全新的章节涵盖非线性处理、用于音频应用的机器学习(ML)、失真、软/硬剪辑、过驱动、均衡器和延迟效果、采样和重建等。内容涵盖量化、滤波器、动态范围控制、房间模拟、采样率转换和音频编码的基础知识,描述了DASP技术、其理论基础和实际应用。
本书全面介绍数字音频与视频技术的基础知识和基本技能,将Adobe公司的四大应用软件整合进一本教程,内容精炼,重点突出。全书共5章: 第1章为数字媒体概述,着重介绍数字媒体的基本概念和原理; 第2~5章分别为Adobe Photoshop数字图像处理、Adobe Audition音频编辑、Adobe Premiere数字视频制作和Adobe After Effects影视后期,重点介绍各软件的核心功能及综合应用技巧。本书适合作为高等院校“信息技术”“数字媒体技术”“影视后期
本书为语音信号处理领域的指导书。作者在东南大学、南京理工大学开设的本科生课程的基础上,介绍了语音信号处理的基本原理、分析方法以及该学科领域近年来取得的一些研究成果和技术,在理论和应用之间达到了极好的平衡。全书共11章,内容包括: 绪论、语音信号处理的声学理论与模型、传统语音信号分析方法、现代语音信号处理方法、语音信号的参数估计、语音编码、语音增强、语音合成、语音识别、说话人识别、语音信号中的情感信息处理。另外,在本书的每章中都加入了复习题,供读者思考。本书可作为高等院校计算机应用
本书围绕语音识别的原理和应用讲解,理论结合实际,采用大量插图,辅以实例,力求深入浅出,让读者能较快地理解语音识别的基础理论和关键技术。为了帮助读者动手操作,提高实战技能,本书最后还结合Kaldi、ESPnet和WeNet等开源工具,介绍了具体的工程实践方法。
随着语音算法技术的不断发展与完善,如何进行工程落地成为语音商业应用中普遍面临的问题。工程落地不仅要考虑模型效果,还要考虑资源占用、模块联调且整个架构要具有可靠性、可扩展性和可维护性。
本书围绕如何从零构建一个完整的语音识别系统,深入浅出地介绍了语音识别前端算法、语音识别算法及说话人日志算法原理;基于Kaldi的模型训练;语音识别工程落地和服务搭建。
本书适合作为语音技术研究人员及对语音技术感兴趣的开发人员的参考用书。