1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 语音信号的处理方法 语音信号处理装置及存储介质与流程

语音信号的处理方法 语音信号处理装置及存储介质与流程

时间:2018-06-01 03:17:03

相关推荐

语音信号的处理方法 语音信号处理装置及存储介质与流程

本发明涉及语音处理领域,尤其涉及语音信号的处理方法、语音信号处理装置及计算机可读存储介质。

背景技术:

当用户处于高噪声环境中时,会导致电子设备接收到的语音信号包含噪音。例如,通过语音控制智能音箱、智能电视、智能空调等产品。或者在移动通话、汽车中hands-free(免提)通话、远距离电话会议等应用场景中,若用户及电子设备所处环境噪音较高,会导致接收到的语音信号包含噪声。当接收到的语音信号中包含噪声时,容易导致出现电子设备无法正确识别语音控制指令的缺陷。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容为现有技术。

技术实现要素:

本发明的主要目的在于提供一种语音信号的处理方法、语音信号处理装置及计算机可读存储介质,旨在达成提高电子设备识别语音指令的准确度的效果。

为实现上述目的,本发明提供一种语音信号的处理方法,所述语音信号的处理方法包括以下步骤:

获取输入信号的自相关矩阵;

根据所述自相关矩阵确定所述输入信号的加权语音自相关矩阵;

根据所述加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵;

根据所述语音增益矩阵和所述语音变换矩阵确定传递函数,并根据所述传递函数及所述输入信号生成输出信号。

可选地,所述自相关矩阵包括噪声自相关矩阵和带噪语音自相关矩阵。

可选地,所述获取输入信号的自相关矩阵的步骤包括:

对所述输入信号中每一帧的子语音信号进行语音活动检测,以获取检测结果;

在所述子语音信号为噪声信号时,根据所述噪声信号的信号特征确定噪声自相关矩阵;

在所述子语音信号为带噪语音信号时,根据所述带噪语音信号的信号特征确定所述带噪语音自相关矩阵。

可选地,所述根据所述自相关矩阵确定所述输入信号的加权语音自相关矩阵的步骤包括:

对所述噪音自相关矩阵进行奇异值分解,并根据分解结果确定加权矩阵;

根据所述带噪语音自相关矩阵确定语音自相关矩阵;

根据所述加权矩阵及所述语音自相关矩阵确定加权语音自相关矩阵。

可选地,所述根据所述加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵的步骤包括:

将所述加权语音自相关矩阵对角化,并获取所述加权语音自相关矩阵对应的对角矩阵以及所述对角矩阵对应的正交矩阵;

根据所述正交矩阵及所述加权矩阵确定所述语音变换矩阵;以及

根据所述对角矩阵确定所述语音增益矩阵。

可选地,所述根据所述对角矩阵确定所述语音增益矩阵的步骤包括:

根据所述对角矩阵确定所述输入信号的空间维数;

根据所述空间维数及所述对角矩阵确定所述语音增益矩阵。

可选地,所述获取输入信号的自相关矩阵的步骤之前,还包括:

接收语音信号,并获取所述语音信号的类型,其中所述类型包括时域信号、频域信号及其它变换域信号;

在所述语音信号的类型为时域信号时,将所述语音信号作为所述输入信号。

可选地,所述接收语音信号,并获取所述语音信号的类型的步骤之后,还包括:

在所述语音信号的类型为非时域信号时,将所述语音信号的类型转换为时域信号;

将转换后的语音信号作为所述输入信号。

此外,为实现上述目的,本发明还提供一种语音信号处理装置,所述语音信号处理装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音信号处理装置的控制程序,所述语音信号处理装置的控制程序被所述处理器执行时实现如上所述的语音信号的处理方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有语音信号处理装置的控制程序,所述语音信号处理装置的控制程序被处理器执行时实现如上所述的语音信号的处理方法的步骤。

本发明实施例提出的一种语音信号的处理方法、语音信号处理装置及计算机可读存储介质,先获取输入信号的自相关矩阵,然后根据所述自相关矩阵确定所述输入信号的加权语音自相关矩阵,并根据所述加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵,进而根据所述语音增益矩阵和所述语音变换矩阵确定传递函数,并根据所述传递函数及所述输入信号生成输出信号。由于可以通过传递函数对带噪语音进降噪和语音增强,从而使得输出的语音更为纯净,从而避免了噪声对语音识别的干扰,这样达成了提高电子设备识别语音指令的准确度的效果。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;

图2为本发明语音信号的处理方法一实施例的流程示意图;

图3为本发明另一实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

由于当用户处于高噪声环境中时,会导致电子设备接收到的语音信号包含噪音。例如,通过语音控制智能音箱、智能电视、智能空调等产品。或者在移动通话、汽车中hands-free(免提)通话、远距离电话会议等应用场景中,若用户及电子设备所处环境噪音较高,会导致接收到的语音信号包含噪声。当接收到的语音信号中包含噪声时,容易导致出现电子设备无法正确识别语音控制指令的缺陷。

为解决上述缺陷,本发明实施例主要提供一种语音信号的处理方法,其主要解决方案是:

获取输入信号的自相关矩阵;

根据自相关矩阵确定输入信号的加权语音自相关矩阵;

根据加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵;

根据语音增益矩阵和语音变换矩阵确定传递函数,并根据传递函数及输入信号生成输出信号。

由于可以通过传递函数对带噪语音进降噪和语音增强,从而使得输出的语音更为纯净,从而避免了噪声对语音识别的干扰,这样达成了提高电子设备识别语音指令的准确度的效果。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例终端可以是智能音箱、耳机、手机、pc机、带扬声器和麦克风的智能设备等终端设备。

如图1所示,该终端可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如麦克风、键盘(keyboard)、鼠标等,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及语音信号处理装置的控制程序。

在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;处理器1001可以用于调用存储器1005中存储的语音信号处理装置的控制程序,并执行以下操作:

获取输入信号的自相关矩阵;

根据所述自相关矩阵确定输入信号的加权语音自相关矩阵;

根据加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵;

根据语音增益矩阵和语音变换矩阵确定传递函数,并根据传递函数及输入信号生成输出信号。

进一步地,处理器1001可以调用存储器1005中存储的语音信号处理装置的控制程序,还执行以下操作:

对输入信号中每一帧的子语音信号进行语音活动检测,以获取检测结果;

在子语音信号为噪声信号时,根据噪声信号的信号特征确定噪声自相关矩阵;

在子语音信号为带噪语音信号时,根据带噪语音信号的信号特征确定带噪语音自相关矩阵。

进一步地,处理器1001可以调用存储器1005中存储的语音信号处理装置的控制程序,还执行以下操作:

对噪音自相关矩阵进行奇异值分解,并根据分解结果确定加权矩阵;

根据带噪语音自相关矩阵确定语音自相关矩阵;

根据加权矩阵及语音自相关矩阵确定加权语音自相关矩阵。

进一步地,处理器1001可以调用存储器1005中存储的语音信号处理装置的控制程序,还执行以下操作:

将加权语音自相关矩阵对角化,并获取加权语音自相关矩阵对应的对角矩阵以及对角矩阵对应的正交矩阵;

根据正交矩阵及加权矩阵确定语音变换矩阵;以及

根据对角矩阵确定语音增益矩阵。

进一步地,处理器1001可以调用存储器1005中存储的语音信号处理装置的控制程序,还执行以下操作:

根据对角矩阵确定输入信号的空间维数;

根据空间维数及对角矩阵确定语音增益矩阵。

进一步地,处理器1001可以调用存储器1005中存储的语音信号处理装置的控制程序,还执行以下操作:

接收语音信号,并获取语音信号的类型,其中类型包括时域信号、频域信号及其它变换域信号;

在语音信号的类型为时域信号时,将语音信号作为输入信号。

进一步地,处理器1001可以调用存储器1005中存储的语音信号处理装置的控制程序,还执行以下操作:

在语音信号的类型为非时域信号时,将语音信号的类型转换为时域信号;

将转换后的语音信号作为输入信号。

参照图2,在本发明语音信号的处理方法的一实施例中,语音信号的处理方法包括以下步骤:

步骤s10、获取输入信号的自相关矩阵;

步骤s20、根据所述自相关矩阵确定所述输入信号的加权语音自相关矩阵;

步骤s30、根据所述加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵;

步骤s40、根据所述语音增益矩阵和所述语音变换矩阵确定传递函数,并根据所述传递函数及所述输入信号生成输出信号。

在本实施例中,当接收到一语音信号时,可以先通过vad(语音活动检测,voiceactivitydetection)对语音信号进行检测。可以理解的是,当语音信号为时域信号时,将语音信号作为输入信号,输入信号的当前帧可以是带噪语音信号,也可以是噪声信号。其中,带噪语音信号y可以由纯语音信号x和噪声d进行确定。因此,当vad判定当前帧为噪声信号时,可以根据vad检查结果直接确定噪声d的自相关矩阵。在判定当前帧为带噪语音信号时,可以根据当前帧信号特征确定带噪语音信号的自相关矩阵。

具体地,当接收到语音信号时,首先判断是否为时域信号,如果为时域信号,则该语音信号作为输入信号。通过vad对输入信号进行检查,以确定当前帧是否为噪声信号。当vad判定输入信号的当前帧为噪声信号时,可以进一步地获取当前帧(即噪声信号)的信号特征,并根据信号特征确定噪声信号的自相关矩阵,即噪声自相关矩阵。在获取到噪声自相关矩阵后,可以通过vad继续对下一帧信号进行检查。当判定下一帧信号为带噪语音信号后,可以获取下一帧(即带噪语音信号)信号特征,并根据带噪语音信号的信号特征确定带噪语音信号的自相关矩阵,即带噪语音自相关矩阵。其中,带噪语音信号y的带噪语音自相关矩阵噪声信号d的噪声自相关矩阵

进一步地,当获取到输入信号的自相关矩阵后,可以根据自相关矩阵确定输入信号的加权语音自相关矩阵,其中,输入信号的自相关矩阵包括噪声自相关矩阵rd和带噪语音自相关矩阵ry。

即在获取到噪声自相关矩阵rd后,可以对噪音自相关矩阵rd进行奇异值分解,并根据分解结果确定加权矩阵,并根据带噪语音自相关矩阵ry及噪音自相关矩阵rd确定语音自相关矩阵rx。进而根据加权矩阵及语音自相关rx矩阵确定加权语音自相关矩阵。

具体地,可以根据以下公式对噪音自相关矩阵rd进行奇异值分解:

其中,v为是酉矩阵;σ是半正定对角矩阵;而vt为v的转置矩阵。dp×p为p×p阶的对角矩阵,即d=diag(d1,d2,…,dp)。且v的前p个正交列向量{υi,1≤i≤p}张成rd的值域空间。v1和v2为矩阵v的元素。

进一步地,加权矩阵ws可以根据以下公式确定:

ws=v1d-1/2v1t

由于语音自相关矩阵rx=ry-rd,且根据上述公式可以确定加权矩阵ws,进而根据加权矩阵ws和语音自相关矩阵rx可以确定加权语音的自相关矩阵rx1,其中加权语音的自相关矩阵rx1可以根据以下公式确定:

其中,rx1和γ均表示加权语音的自相关矩阵,wst为加权矩阵ws的转置矩阵。

对加权语音的自相关矩阵γ进行特征值分解后可知,γ是一个实对称矩阵。因此,将加权语音自相关矩阵对角化,并获取加权语音自相关矩阵对应的对角矩阵以及对角矩阵对应的正交矩阵。

具体地,可以通过matlab(一种数学软件)等数学软件对加权语音的自相关矩阵γ进行对角化处理,进而获取使γ对角化的正交矩阵θ以及γ对角化后的对角矩阵λx,使得正交矩阵θ、加权语音的自相关矩阵γ和对角矩阵λx之间满足一下关系式:

θγθt=λx

其中,θθt=e,e为单位矩阵。

进一步地,当获取到正交矩阵后,根据正交矩阵及加权矩阵确定语音变换矩阵。其中,语音变换矩阵u=θws。

同时,还可以根据对角矩阵确定语音增益矩阵。

具体地,可以先根据对角矩阵λx确定语音信号的空间维数m,语音信号的空间维数m满足以下关系式:

其中,若λx(i)按降序排列,则可以得到如下序列:

其中,k是对角元素非零的个数,一般取m=k,如果考虑计算量,语音信号的空间维数m也可以小于k,但是必须小于或等于加权语音自相关矩阵的最大维数p。

进一步地,在确定语音信号的空间维数m后,可以生成增益矩阵g,其中,增益矩阵g的对角线上的元素可以为gkk,在本发明中,gkk可以根据以下关系式确定:

其中,μk是畸变噪声和残留噪声的折中选择,称为折中因子。

需要说明的是,如果将看作信号功率谱,则μk就是与信噪比相关的量。信噪比越大则μk越小,信噪比越小则μk越大。因此可以采用启发式方法,设:

为当前帧信号功率估计;

为当前帧噪声信号功率估计,则信噪比

其中α为平滑因子,本实施例中α=0.95。估计本帧最优因子为

其中β为常数,本实施例中β=0.8。最终的折中因子μk=argmin{μopt,μini},μini=20为人为设定的数值,最后增益矩阵g=diag(g11,g22……gmm)。

进一步地,根据语音增益矩阵和语音变换矩阵确定传递函数,并根据传递函数及输入信号生成输出信号。

具体地,当确定增益矩阵g和语音变换矩阵u后,可以根据以下公式确定传递函数hopt:

当输入信号为y时,可以根据传递函数和传递函数hopt确定输出信号y_est可以根据以下公式计算:

y_est=hopt·y。

当通过计算确定输出信号y_est后,可以播放输出信号y_est。

在本实施例公开的技术方案中,先获取输入信号的自相关矩阵,然后根据自相关矩阵确定输入信号的加权语音自相关矩阵,并根据加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵,进而根据语音增益矩阵和语音变换矩阵确定传递函数,并根据传递函数及输入信号生成输出信号。由于可以通过传递函数对带噪语音进降噪和语音增强,从而使得输出的语音更为纯净,从而避免了噪声对语音识别的干扰,这样达成了达成提高电子设备识别语音指令的准确度的效果。

参照图3,基于上述实施例,在另一实施例中,步骤s10之前,还包括:

步骤s50、接收语音信号,并获取所述语音信号的类型,其中所述类型包括时域信号、频域信号及其它变换域信号;

步骤s60、在所述语音信号的类型为时域信号时,将所述语音信号作为所述输入信号。

在本实施例中,语音信号处理装置可以设置有语音接收组件,通过语音接收组件可以接收环境声波,并根据环境声波生成语音信号。获取语音处理装置也可以接收其它终端发送的语音信号,以及读取预设的存储介质中保存的语音信号。

当语音信号处理装置获取到语音信号时,先检测语音信号对应的信号类型。其中,信号类型包括时域信号、频域信号以及其它变换域信号等。其中,其它变换域信号可以是如klt(karhunen-loèvetransform,卡洛南-洛伊变换)变换域信号等。

当语音信号的信号类型为时域信号时,可以直接将语音信号作为输入信号,并对其进行降噪增强处理。当语音信号的信号类型为非时域信号时,可以先将语音信号的信号类型转换为时域信号,然后再将转换后的信号类型为时域信号的语音信号作为输入信号。

在本实施例公开的技术方案中,在接收语音信号,并获取语音信号的类型,在语音信号的类型为时域信号时,将语音信号作为输入信号,否则将语音信号的类型转换为时域信号,并将转换后的语音信号作为输入信号,由于可以将任一信号类型为非时域信号的其它语音信号转换时域信号进行处理,从而语音信号的处理方法可以兼容任何类型的语音信号,从而达成了提高语音信号的处理方法的兼容性的效果。

此外,本发明实施例还提出一种语音信号处理装置,语音信号处理装置包括存储器、处理器及存储在存储器上并可在处理器上运行的语音信号处理装置的控制程序,语音信号处理装置的控制程序被处理器执行时实现如上各个实施例的语音信号的处理方法的步骤。

此外,本发明实施例还提出一种计算机可读存储介质,计算机可读存储介质上存储有语音信号处理装置的控制程序,语音信号处理装置的控制程序被处理器执行时实现如上各个实施例的语音信号的处理方法的步骤。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机、音箱、pc机或者车载语音通信装置等)执行本发明各个实施例的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

技术特征:

1.一种语音信号的处理方法,其特征在于,所述语音信号的处理方法包括以下步骤:

获取输入信号的自相关矩阵;

根据所述自相关矩阵确定所述输入信号的加权语音自相关矩阵;

根据所述加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵;

根据所述语音增益矩阵和所述语音变换矩阵确定传递函数,并根据所述传递函数及所述输入信号生成输出信号。

2.如权利要求1所述的语音信号的处理方法,其特征在于,所述自相关矩阵包括噪声自相关矩阵和带噪语音自相关矩阵。

3.如权利要求2所述的语音信号的处理方法,其特征在于,所述获取输入信号的自相关矩阵的步骤包括:

对所述输入信号中每一帧的子语音信号进行语音活动检测,以获取检测结果;

在所述子语音信号为噪声信号时,根据所述噪声信号的信号特征确定噪声自相关矩阵;

在所述子语音信号为带噪语音信号时,根据所述带噪语音信号的信号特征确定所述带噪语音自相关矩阵。

4.如权利要求2所述的语音信号的处理方法,其特征在于,所述根据所述自相关矩阵确定所述输入信号的加权语音自相关矩阵的步骤包括:

对所述噪音自相关矩阵进行奇异值分解,并根据分解结果确定加权矩阵;

根据所述带噪语音自相关矩阵确定语音自相关矩阵;

根据所述加权矩阵及所述语音自相关矩阵确定加权语音自相关矩阵。

5.如权利要求1所述的语音信号的处理方法,其特征在于,根据所述加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵;

所述根据所述加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵的步骤包括:

将所述加权语音自相关矩阵对角化,并获取所述加权语音自相关矩阵对应的对角矩阵以及所述对角矩阵对应的正交矩阵;

根据所述正交矩阵及所述加权矩阵确定所述语音变换矩阵;以及

根据所述对角矩阵确定所述语音增益矩阵。

6.如权利要求5所述的语音信号的处理方法,其特征在于,所述根据所述对角矩阵确定所述语音增益矩阵的步骤包括:

根据所述对角矩阵确定所述输入信号的空间维数;

根据所述空间维数及所述对角矩阵确定所述语音增益矩阵。

7.如权利要求1所述的语音信号的处理方法,其特征在于,所述获取输入信号的自相关矩阵的步骤之前,还包括:

接收语音信号,并获取所述语音信号的类型,其中所述类型包括时域信号、频域信号及其它变换域信号;

在所述语音信号的类型为时域信号时,将所述语音信号作为所述输入信号。

8.如权利要求7所述的语音信号的处理方法,其特征在于,所述接收语音信号,并获取所述语音信号的类型的步骤之后,还包括:

在所述语音信号的类型为非时域信号时,将所述语音信号的类型转换为时域信号;

将转换后的语音信号作为所述输入信号。

9.一种语音信号处理装置,其特征在于,所述语音信号处理装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音信号处理装置的控制程序,所述语音信号处理装置的控制程序被所述处理器执行时实现如权利要求1至8中任一项所述的语音信号的处理方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有语音信号处理装置的控制程序,所述语音信号处理装置的控制程序被处理器执行时实现如权利要求1至8中任一项所述的语音信号的处理方法的步骤。

技术总结

本发明公开了一种语音信号的处理方法,包括以下步骤:获取输入信号的自相关矩阵;根据所述自相关矩阵确定所述输入信号的加权语音自相关矩阵;根据所述加权语音自相关矩阵确定语音增益矩阵以及语音变换矩阵;根据所述语音增益矩阵和所述语音变换矩阵确定传递函数,并根据所述传递函数及所述输入信号生成输出信号。本发明还公开了一种语音信号处理装置及计算机可读存储介质,达成了提高电子设备识别语音指令的准确度的效果。

技术研发人员:陈国明

受保护的技术使用者:歌尔科技有限公司

技术研发日:.10.30

技术公布日:.01.17

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。