说话人识别技术具有准确性高、识别方便、设备成本低廉和非接触识别等优势,可广泛应用于身份识别领域。模式识别作为影响说话人识别性能的重要组成部分,成为说话人识别技术的研究焦点。其中,矢量量化算法(Vector Quantization,VQ)模型设计简单、系统快速有效,被广泛的应用于快速说话人识别系统中。随着移动互联网时代的到来,要求说话人识别技术能够快速准确地识别说话人,并且易于集成在便携的小型移动设备中。而基于FPGA(Field Programmable Gate Array)的片上可编程逻辑系统(System on a Programmable Chip,SOPC)具有功耗小、成本低、速度快、易集成等优势,能够充分的利用片上资源实现相关算法。因此,说话人识别系统的SOPC设计成为重要趋势。为了实现说话人声纹特征模式识别的SOPC设计,本文通过对已有模式识别算法进行分析,在综合考虑识别性能和算法复杂度的情况下,选择适合FPGA设计实现的矢量量化算法进行研究,并针对原算法匹配识别时全搜索计算量大的问题进行改进,提出基于码本聚类优化的矢量量化算法和相应的快速匹配识别算法。然后对改进算法过程中计算量大、消耗时间长的步骤进行硬件模块的设计,并借助SOPC Builder和NIOS II IDE平台完成说话人声纹特征模式识别系统的软硬件设计,实现说话人模式识别的SOPC系统。对于说话人识别系统的芯片化设计具有重要意义。论文主要包括以下几个方面的内容:1.对说话人声纹特征的模式识别算法进行研究,选择适合进行FPGA设计实现的VQ算法进行改进,针对原始算法匹配识别全搜索计算量大的问题,提出码本聚类矢量量化算法,并设计快速匹配算法。实验表明,优化算法在不影响识别准确率的前提下,获得了57.44%的匹配次数优化率。2.分析改进算法整体流程,针对算法中计算量大、消耗时间长的关键步骤进行基于FPGA的硬件模块设计,主要包括LBG算法模块、码本间距离计算模块、代表码本计算模块、特征参数与码本间距离计算模块等,并通过仿真验证了设计模块的有效性。3.将相关加速模块封装成适合进行SOPC设计的IP(Intellectual Property)核,并配合NIOS II处理器完成SOPC系统的软硬件设计,最终通过测试验证了本文设计系统的准确性、可靠性和高效性。
暂无评论