1200字范文 > 语音信号的处理方法语音信号处理装置及存储介质与流程

语音信号的处理方法语音信号处理装置及存储介质与流程

时间：2018-06-01 03:17:03

本发明涉及语音处理领域，尤其涉及语音信号的处理方法、语音信号处理装置及计算机可读存储介质。

背景技术：

当用户处于高噪声环境中时，会导致电子设备接收到的语音信号包含噪音。例如，通过语音控制智能音箱、智能电视、智能空调等产品。或者在移动通话、汽车中hands-free(免提)通话、远距离电话会议等应用场景中，若用户及电子设备所处环境噪音较高，会导致接收到的语音信号包含噪声。当接收到的语音信号中包含噪声时，容易导致出现电子设备无法正确识别语音控制指令的缺陷。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容为现有技术。

技术实现要素：

本发明的主要目的在于提供一种语音信号的处理方法、语音信号处理装置及计算机可读存储介质，旨在达成提高电子设备识别语音指令的准确度的效果。

为实现上述目的，本发明提供一种语音信号的处理方法，所述语音信号的处理方法包括以下步骤：

获取输入信号的自相关矩阵；

根据所述自相关矩阵确定所述输入信号的加权语音自相关矩阵；

根据所述加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵；

根据所述语音增益矩阵和所述语音变换矩阵确定传递函数，并根据所述传递函数及所述输入信号生成输出信号。

可选地，所述自相关矩阵包括噪声自相关矩阵和带噪语音自相关矩阵。

可选地，所述获取输入信号的自相关矩阵的步骤包括：

对所述输入信号中每一帧的子语音信号进行语音活动检测，以获取检测结果；

在所述子语音信号为噪声信号时，根据所述噪声信号的信号特征确定噪声自相关矩阵；

在所述子语音信号为带噪语音信号时，根据所述带噪语音信号的信号特征确定所述带噪语音自相关矩阵。

可选地，所述根据所述自相关矩阵确定所述输入信号的加权语音自相关矩阵的步骤包括：

对所述噪音自相关矩阵进行奇异值分解，并根据分解结果确定加权矩阵；

根据所述带噪语音自相关矩阵确定语音自相关矩阵；

根据所述加权矩阵及所述语音自相关矩阵确定加权语音自相关矩阵。

可选地，所述根据所述加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵的步骤包括：

将所述加权语音自相关矩阵对角化，并获取所述加权语音自相关矩阵对应的对角矩阵以及所述对角矩阵对应的正交矩阵；

根据所述正交矩阵及所述加权矩阵确定所述语音变换矩阵；以及

根据所述对角矩阵确定所述语音增益矩阵。

可选地，所述根据所述对角矩阵确定所述语音增益矩阵的步骤包括：

根据所述对角矩阵确定所述输入信号的空间维数；

根据所述空间维数及所述对角矩阵确定所述语音增益矩阵。

可选地，所述获取输入信号的自相关矩阵的步骤之前，还包括：

接收语音信号，并获取所述语音信号的类型，其中所述类型包括时域信号、频域信号及其它变换域信号；

在所述语音信号的类型为时域信号时，将所述语音信号作为所述输入信号。

可选地，所述接收语音信号，并获取所述语音信号的类型的步骤之后，还包括：

在所述语音信号的类型为非时域信号时，将所述语音信号的类型转换为时域信号；

将转换后的语音信号作为所述输入信号。

此外，为实现上述目的，本发明还提供一种语音信号处理装置，所述语音信号处理装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音信号处理装置的控制程序，所述语音信号处理装置的控制程序被所述处理器执行时实现如上所述的语音信号的处理方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有语音信号处理装置的控制程序，所述语音信号处理装置的控制程序被处理器执行时实现如上所述的语音信号的处理方法的步骤。

本发明实施例提出的一种语音信号的处理方法、语音信号处理装置及计算机可读存储介质，先获取输入信号的自相关矩阵，然后根据所述自相关矩阵确定所述输入信号的加权语音自相关矩阵，并根据所述加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵，进而根据所述语音增益矩阵和所述语音变换矩阵确定传递函数，并根据所述传递函数及所述输入信号生成输出信号。由于可以通过传递函数对带噪语音进降噪和语音增强，从而使得输出的语音更为纯净，从而避免了噪声对语音识别的干扰，这样达成了提高电子设备识别语音指令的准确度的效果。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图；

图2为本发明语音信号的处理方法一实施例的流程示意图；

图3为本发明另一实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

由于当用户处于高噪声环境中时，会导致电子设备接收到的语音信号包含噪音。例如，通过语音控制智能音箱、智能电视、智能空调等产品。或者在移动通话、汽车中hands-free(免提)通话、远距离电话会议等应用场景中，若用户及电子设备所处环境噪音较高，会导致接收到的语音信号包含噪声。当接收到的语音信号中包含噪声时，容易导致出现电子设备无法正确识别语音控制指令的缺陷。

为解决上述缺陷，本发明实施例主要提供一种语音信号的处理方法，其主要解决方案是：

获取输入信号的自相关矩阵；

根据自相关矩阵确定输入信号的加权语音自相关矩阵；

根据加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵；

根据语音增益矩阵和语音变换矩阵确定传递函数，并根据传递函数及输入信号生成输出信号。

由于可以通过传递函数对带噪语音进降噪和语音增强，从而使得输出的语音更为纯净，从而避免了噪声对语音识别的干扰，这样达成了提高电子设备识别语音指令的准确度的效果。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例终端可以是智能音箱、耳机、手机、pc机、带扬声器和麦克风的智能设备等终端设备。

如图1所示，该终端可以包括：处理器1001，例如cpu，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如麦克风、键盘(keyboard)、鼠标等，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及语音信号处理装置的控制程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；处理器1001可以用于调用存储器1005中存储的语音信号处理装置的控制程序，并执行以下操作：

获取输入信号的自相关矩阵；

根据所述自相关矩阵确定输入信号的加权语音自相关矩阵；

根据加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵；

根据语音增益矩阵和语音变换矩阵确定传递函数，并根据传递函数及输入信号生成输出信号。