1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 语音的识别方法及装置 计算机设备 存储介质与流程

语音的识别方法及装置 计算机设备 存储介质与流程

时间:2019-12-20 03:59:36

相关推荐

语音的识别方法及装置 计算机设备 存储介质与流程

本发明涉及计算机领域,尤其涉及一种语音的识别方法及装置、计算机设备、存储介质。

背景技术:

聊天机器人是人工智能中的重要领域,通过用户向聊天机器人发出自然语言,机器人可以完成一系列的操作。

相关技术中,聊天机器人只能做一些简单的闲聊对话,很少有能够分辨出人的真实意图,并且不能连续的针对某一个素材有限的语音或者结合上下文来理解对话意图,识别率低,需要获取大量的自然语言才能提高识别率,导致语音识别的应用范围一直不高。

针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。

技术实现要素:

有鉴于此,本发明实施例提供了一种语音的识别方法及装置、计算机设备、存储介质。

一方面,本发明实施例提供了一种语音的识别方法,所述方法包括:采集自然语言;确定所述自然语言的对话语境,其中,所述对话语境用于描述当前语音交互的领域和交互对象;使用与所述对话语境对应的语料数据库识别所述自然语言。

可选的,确定所述自然语言的对话语境包括:提取所述自然语言中的关键字;通过所述关键字匹配得到对话语境,其中,所述对话语境包括以下之一:知识搜索,互联网搜索,天气查询,路线导航,对话聊天,指令控制。

可选的,确定所述自然语言的对话语境包括:查找所述自然语言之前的历史对话记录;根据所述历史对话记录确定所述对话语境。

可选的,在使用与所述对话语境对应的语料数据库识别所述自然语言之前,所述方法还包括:设置所述语料数据库,其中,所述语料数据库包括:多轮对话语料,多场景语料,通过solr搜索引擎得到的网络语料。

可选的,使用与所述对话语境对应的语料数据库识别所述自然语言包括:查询与所述对话语境对应的本地语料数据库,其中,所述本地语料数据库包括:多轮对话语料,多场景语料;使用所述本地语料数据库在本地识别所述自然语言;在使用所述本地语料数据库在本地识别所述自然语言失败时,调用所述solr搜索引擎识别所述自然语言,并在所述本地语料数据库中添加与所述自然语言对应的识别结果。

可选的,采集自然语言包括:通过麦克风采集背景噪声的语音信号;解析所述背景噪声和所述语音信号的声线特性;根据历史语音的声线特性去掉所述背景噪声,将所述语音信号转换为文字,得到所述自然语言,其中,所述历史语音为在无噪音条件下采集的样本语音。

可选的,在使用与所述对话语境对应的语料数据库识别所述自然语言之后,所述方法还包括:输出与识别结果对应的应答内容,或,生成与识别结果对应的控制指令。

另一方面,本发明实施例提供了一种语音的识别装置,所述装置包括:采集模块,用于采集自然语言;确定模块,用于确定所述自然语言的对话语境,其中,所述对话语境用于描述当前语音交互的领域和交互对象;识别模块,用于使用与所述对话语境对应的语料数据库识别所述自然语言。

可选的,所述确定模块包括:提取单元,用于提取所述自然语言中的关键字;匹配单元,用于通过所述关键字匹配得到对话语境,其中,所述对话语境包括以下之一:知识搜索,互联网搜索,天气查询,路线导航,对话聊天,指令控制。

可选的,所述确定模块包括:查找单元,用于查找所述自然语言之前的历史对话记录;确定单元,用于根据所述历史对话记录确定所述对话语境。

可选的,所述装置还包括:设置模块,用于在所述识别模块使用与所述对话语境对应的语料数据库识别所述自然语言之前,设置所述语料数据库,其中,所述语料数据库包括:多轮对话语料,多场景语料,通过solr搜索引擎得到的网络语料。

可选的,所述识别模块包括:查询单元,用于查询与所述对话语境对应的本地语料数据库,其中,所述本地语料数据库包括:多轮对话语料,多场景语料;第一识别单元,用于使用所述本地语料数据库在本地识别所述自然语言;第二识别单元,用于在使用所述本地语料数据库在本地识别所述自然语言失败时,调用所述solr搜索引擎识别所述自然语言,并在所述本地语料数据库中添加与所述自然语言对应的识别结果。

可选的,所述采集模块包括:采集单元,用于通过麦克风采集背景噪声的语音信号;解析单元,用于解析所述背景噪声和所述语音信号的声线特性;降噪单元,用于根据历史语音的声线特性去掉所述背景噪声,将所述语音信号转换为文字,得到所述自然语言,其中,所述历史语音为在无噪音条件下采集的样本语音。

可选的,所述装置还包括:处理单元,用于在所述识别模块使用与所述对话语境对应的语料数据库识别所述自然语言之后,输出与识别结果对应的应答内容,或,生成与识别结果对应的控制指令。

根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明,通过先确定对话语境和场景,进而在对应的语料数据库中识别自然语言,解决了现有技术中语音效率低的技术问题,语音识别更智能,提高了语音识别率。

【附图说明】

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。

图1是本发明实施例的一种语音的识别移动终端的硬件结构框图;

图2是根据本发明实施例的语音的识别方法的流程图;

图3是本发明实施例中识别自然语言的流程图;

图4是本发明实施例交互示意图;

图5是根据本发明实施例的语音的识别装置的结构框图。

【具体实施方式】

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例一所提供的方法实施例可以在移动终端、中控设备、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种语音的识别移动终端的硬件结构框图。如图1所示,移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的语音的识别方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种语音的识别方法,图2是根据本发明实施例的语音的识别方法的流程图,如图2所示,该流程包括如下步骤:

步骤S202,采集自然语言;

步骤S204,确定所述自然语言的对话语境,其中,所述对话语境用于描述当前语音交互的领域和交互对象;

在本实施例中,语境交互的领域为交互场景,如天气查询,路线导航,对话聊天等,交互对象为通过语音控制的目标对象,如目标对象为系统的查询引擎,通过查询引擎查询与自然语音对应的识别结果,或者是根据自然语音中的指令信息去,还包括调用引擎,通过调用引擎来调用设备的软件或硬件,以辅助识别,如调用内置的GPS模块等,还包括控制对象,如通过中控台控制电视机等与中控台网络连接的设备时,电视机为控制对象。

步骤S206,使用与所述对话语境对应的语料数据库识别所述自然语言。

通过本实施例的方案,通过先确定对话语境和场景,进而在对应的语料数据库中识别自然语言,解决了现有技术中语音效率低的技术问题,语音识别更智能,提高了语音识别率。

本实施例的执行主体可以是聊天机器人,语音控制台,语音中控设备,带有语音控制功能的电子设备等,但不限于此。

本实施例中的对话语境包括对话场景,机器交互参与的对象和设备等,确定对话语境包括多种方案。

在一个示例中,确定所述自然语言的对话语境包括:

S11,提取所述自然语言中的关键字;

本实施例中的自然语言为自然人或者设备发出的语音,在提取关键字时,先将语音转换为文字,然后使用预设的关键字列表,在文字中查找是否包括关键字列表中的任一关键字,如果包括则提取匹配的关键字。

S12,通过所述关键字匹配得到对话语境,其中,所述对话语境包括以下之一:知识搜索,互联网搜索,天气查询,路线导航,对话聊天,指令控制。

本实施例的关键字和对话语境通过预设映射表来匹配,如关键字集合{a,b,c}对应知识搜索的对话语境,关键字集合{b,c,d}对应互联网搜索的对话语境等。

在一些语境下,需要启动第三方软件(如地图,浏览器等),在一些语境下,需要用到本地知识图谱,在一些语境下,用到语料数据库。如路线导航的语境中,需要启动地图软件,如采集到的自然语言为“回家”,确定语境为路线导航,需要调用地图软件,搜索从当前位置到家的行车导航路线;或者在知识搜索的语境中,如采集到的自然语言为“张三的联系方式”,确定语境为知识搜索,在本地的通讯录中搜索出张三的联系方式等。

在另一个示例中,确定所述自然语言的对话语境包括:

S21,查找所述自然语言之前的历史对话记录;

本实施例的历史对话记录为当前自然语言之前的语音识别设备与语音识别对象之间的对话内容,该对话记录保存在语音设备的本地存储器,在查找历史对话记录时,可以根据时间作为参数,查找预设时间范围之内的对话记录,例如,用户与语音机器人进行人机对话,在1分钟之内产生了三条对话记录,分别为:A,B,C,语音机器人当前接收到的待识别的自然语音为D,则可以根据A,B,C的内容来确定D的对话场景,如果D中的内容与A,B,C有关联性,则对话语境也是相同的,这是由于一次正常的人机对话都会包括多条对话记录。

S22,根据所述历史对话记录确定所述对话语境。

在本示例的方案中,通过当前自然语言的上下文(主要是上文)来确定对话场景,匹配该场景领域的语料,进而识别:在AIML机制下,记录对话中的上下文信息,基于上下文信息,通过配置好的话题库来匹配识别某一领域类的语料对话,进而使用该领域的语料进行识别。如:接收到用户的自然语言“太暗了”,通过之前的聊天记录,确定对话场景为“电视机控制”,进而在电视机领域的语料中识别出“背景太暗了”,进而调亮背景亮度,或者确定对话场景为“灯光控制”,进而在灯光照明领域的语料中识别出“照明设备太暗了”,进而打开照明设备。

在本实施例中,在使用与所述对话语境对应的语料数据库识别所述自然语言之前,还包括:设置所述语料数据库,其中,所述语料数据库包括:多轮对话语料,多场景语料,通过solr(Search On Lucene Replication)搜索引擎得到的网络语料。本实施例中的上述三种语料库是三个维度的数据库,可以单独使用,也可以相互配合使用,其中,多轮对话语料是指包括多组对话的语料库,可用于聊天,本地查询等,如饮食、电视、电影、音乐、工作等多个主题(每个类别包括多组逻辑对话),多场景语料为在多个特定场景下的语料库,可用于聊天,本地查询,机器控制等,如在饮食相关的领域和在音乐相关的领域,对于同样的问题:“请问人气高的地方”,则应答会有所差异,反馈的是分别是餐厅和音乐厅,网络语料则是以网络查询的结果作为语料。

可选的,采用AIML模型进行配置语料数据库,AIML人工智能标记语言,AIML描述一种称为AIML对象的数据对象的类(class),并部分描述了处理他们的计算机程序的行为(behavior)。AIML对象是由所谓的主题(topics)和类型(categories)的单元组成,其中包含任何解析或未解析的数据。其中,解析数据(Parsed data)是字符解析得到的字符数据(character data)、和AIML元素(AIML elements)。AIML元素封装在包含在文档中的刺激-反应知识(stimulus-response knowledge),在这些元素中的字符数据(Character data)可以由AIML编译器(AIML interpreter)解析,也可以由响应器(Responder)解析。本实施例的Solr搜索引擎输入的是自然语言,输出对应的回答也是自然语言。在一个实施方式中,通过配置相应的问题模板来配置语料数据库,模板形式采用AIML模板形式进行编写,多组预设问题的回答语句通过网上爬取获得,如百度百科等,并根据问题的类型与相应的网址相链接。

图3是本发明实施例中识别自然语言的流程图,如图3所示,使用与所述对话语境对应的语料数据库识别所述自然语言包括:

S302,查询与所述对话语境对应的本地语料数据库,其中,所述本地语料数据库包括:多轮对话语料,多场景语料;

本实施例中的对话语境包括知识搜索,互联网搜索,天气查询,路线导航,对话聊天,指令控制等,其中,对话聊天为多轮对话语料,知识搜索,互联网搜索,天气查询,路线导航,指令控制为多场景语料,在多场景对话语料中,每一个对话语境的场景都对应一个专用的语料数据库,但是在多场景语料识别失败时,会转为多轮对话语料的语料库,进一步询问自然语言的实际含义。在一个示例中,采集到的自然语言为:“导航到前面写字楼”,确定为路线导航的对话语境,在本地语料数据库中查询“前面写字楼”没有成功,进而转到多轮对话语料,触发问题:“请问是哪一栋写字楼?”,用户回答:“A写字楼”。

S304,使用所述本地语料数据库在本地识别所述自然语言;

可选的,在使用与所述对话语境对应的语料数据库识别所述自然语言之后,还包括:输出与识别结果对应的应答内容,或,生成与识别结果对应的控制指令。

将自然语言转换为语料数据库可以识别的机器语言后,在本地语料数据库查找对应的语义,在查找失败时,使用solr搜索引擎进行搜索,识别出语义后,进一步搜索出该语义下的应答内容,或者是针对目标对象的控制指令,如采集到自然语言为“今天的天气怎样”,可以搜索出天气状况,并输出应答内容“今天天气晴,24℃,空气指数良好”,或者采集到的语言为“电视声音太大了”,匹配出用于调低电视音量的控制指令,并发送给电视的控制台。如果是在语料数据库识别出来的,则在预料数据库查找,如果是通过搜索引擎识别出来的,则通过搜索引擎查找。当然,也可以使用独立的数据库(该数据库保存了与每个语义对应的应答内容或控制指令)。图4是本发明实施例交互示意图,本地内置了互联网搜索,天气查询,路线导航三个语境的语料数据库。

S306,在使用所述本地语料数据库在本地识别所述自然语言失败时,调用所述solr搜索引擎识别所述自然语言,并在所述本地语料数据库中添加与所述自然语言对应的识别结果。

在使用solr搜索引擎也识别失败时,在采用所有语料数据库识别用户的自然语言都失败时,反馈错误,由用户来协助完成对话或操作,并进一步完善语料数据库,如将结果反馈到语料数据库,在本地语料库中修改或添加当前问答的识别内容,学习识别失败的自然语言。

在本实施例的实施方式中,采集自然语言包括:通过麦克风采集背景噪声的语音信号;解析所述背景噪声和所述语音信号的声线特性;根据历史语音的声线特性去掉所述背景噪声,将所述语音信号转换为文字,得到所述自然语言,其中,所述历史语音为在无噪音条件下采集的样本语音。

在本实施例的方案在应用在聊天机器人上时,基于国际机器人的通用语言AIML的模型进行优化,由于AIML的标签配置非常灵活,可以支持自定义场景的配置,多轮对话语料,应用于多种场景,可以让机器人拥有更智能化,更专业化的对话功能;后台增加solr搜索引擎可以对接更为丰富的语料资源,并且适应基于语义的快速搜索和对话功能;机器人具备学习功能,可以在与人的对话中学习之前不能理解的语句与对答,拥有自我成长功能。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

在本实施例中还提供了一种语音的识别装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图5是根据本发明实施例的语音的识别装置的结构框图,如图5所示,该装置包括:采集模块50,确定模块52,识别模块54,其中,

采集模块50,用于采集自然语言;

确定模块52,用于确定所述自然语言的对话语境,其中,所述对话语境用于描述当前语音交互的领域和交互对象;

识别模块54,用于使用与所述对话语境对应的语料数据库识别所述自然语言。

可选的,所述确定模块包括:提取单元,用于提取所述自然语言中的关键字;匹配单元,用于通过所述关键字匹配得到对话语境,其中,所述对话语境包括以下之一:知识搜索,互联网搜索,天气查询,路线导航,对话聊天,指令控制。

可选的,所述确定模块包括:查找单元,用于查找所述自然语言之前的历史对话记录;确定单元,用于根据所述历史对话记录确定所述对话语境。

可选的,所述装置还包括:设置模块,用于在所述识别模块使用与所述对话语境对应的语料数据库识别所述自然语言之前,设置所述语料数据库,其中,所述语料数据库包括:多轮对话语料,多场景语料,通过solr搜索引擎得到的网络语料。

可选的,所述识别模块包括:查询单元,用于查询与所述对话语境对应的本地语料数据库,其中,所述本地语料数据库包括:多轮对话语料,多场景语料;第一识别单元,用于使用所述本地语料数据库在本地识别所述自然语言;第二识别单元,用于在使用所述本地语料数据库在本地识别所述自然语言失败时,调用所述solr搜索引擎识别所述自然语言,并在所述本地语料数据库中添加与所述自然语言对应的识别结果。

可选的,所述采集模块包括:采集单元,用于通过麦克风采集背景噪声的语音信号;解析单元,用于解析所述背景噪声和所述语音信号的声线特性;降噪单元,用于根据历史语音的声线特性去掉所述背景噪声,将所述语音信号转换为文字,得到所述自然语言,其中,所述历史语音为在无噪音条件下采集的样本语音。

可选的,所述装置还包括:处理单元,用于在所述识别模块使用与所述对话语境对应的语料数据库识别所述自然语言之后,输出与识别结果对应的应答内容,或,生成与识别结果对应的控制指令。

需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

S1,采集自然语言;

S2,确定所述自然语言的对话语境,其中,所述对话语境用于描述当前语音交互的领域和交互对象;

S3,使用与所述对话语境对应的语料数据库识别所述自然语言。

可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。

可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:

S1,采集自然语言;

S2,确定所述自然语言的对话语境,其中,所述对话语境用于描述当前语音交互的领域和交互对象;

S3,使用与所述对话语境对应的语料数据库识别所述自然语言。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

技术特征:

1.一种语音的识别方法,其特征在于,所述方法包括:

采集自然语言;

确定所述自然语言的对话语境,其中,所述对话语境用于描述当前语音交互的领域和交互对象;

使用与所述对话语境对应的语料数据库识别所述自然语言。

2.根据权利要求1所述的方法,其特征在于,确定所述自然语言的对话语境包括:

提取所述自然语言中的关键字;

通过所述关键字匹配得到对话语境,其中,所述对话语境包括以下之一:知识搜索,互联网搜索,天气查询,路线导航,对话聊天,指令控制。

3.根据权利要求1所述的方法,其特征在于,确定所述自然语言的对话语境包括:

查找所述自然语言之前的历史对话记录;

根据所述历史对话记录确定所述对话语境。

4.根据权利要求1所述的方法,其特征在于,在使用与所述对话语境对应的语料数据库识别所述自然语言之前,所述方法还包括:

设置所述语料数据库,其中,所述语料数据库包括:多轮对话语料,多场景语料,通过solr搜索引擎得到的网络语料。

5.根据权利要求4所述的方法,其特征在于,使用与所述对话语境对应的语料数据库识别所述自然语言包括:

查询与所述对话语境对应的本地语料数据库,其中,所述本地语料数据库包括:多轮对话语料,多场景语料;

使用所述本地语料数据库在本地识别所述自然语言;

在使用所述本地语料数据库在本地识别所述自然语言失败时,调用所述solr搜索引擎识别所述自然语言,并在所述本地语料数据库中添加与所述自然语言对应的识别结果。

6.根据权利要求1所述的方法,其特征在于,采集自然语言包括:

通过麦克风采集背景噪声的语音信号;

解析所述背景噪声和所述语音信号的声线特性;

根据历史语音的声线特性去掉所述背景噪声,将所述语音信号转换为文字,得到所述自然语言,其中,所述历史语音为在无噪音条件下采集的样本语音。

7.根据权利要求1所述的方法,其特征在于,在使用与所述对话语境对应的语料数据库识别所述自然语言之后,所述方法还包括:

输出与识别结果对应的应答内容,或,生成与识别结果对应的控制指令。

8.一种语音的识别装置,其特征在于,所述装置包括:

采集模块,用于采集自然语言;

确定模块,用于确定所述自然语言的对话语境,其中,所述对话语境用于描述当前语音交互的领域和交互对象;

识别模块,用于使用与所述对话语境对应的语料数据库识别所述自然语言。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

技术总结

本发明实施例提供了一种语音的识别方法及装置、计算机设备、存储介质。一方面,该方法包括:采集自然语言;确定所述自然语言的对话语境,其中,所述对话语境用于描述当前语音交互的领域和交互对象;使用与所述对话语境对应的语料数据库识别所述自然语言。通过本发明,解决了现有技术中语音效率低的技术问题,语音识别更智能,提高了语音识别率。

技术研发人员:张师琲

受保护的技术使用者:平安科技(深圳)有限公司

技术研发日:.06.20

技术公布日:.09.20

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。