1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 一种数据关联方法 装置 设备及可读存储介质与流程

一种数据关联方法 装置 设备及可读存储介质与流程

时间:2021-06-22 16:24:35

相关推荐

一种数据关联方法 装置 设备及可读存储介质与流程

本申请涉及信息处理领域,更具体地说,涉及一种数据关联方法、装置、设备及可读存储介质。

背景技术:

目前,通过大数据分析可以得到一些有价值的信息,其中,多种数据进行关联是大数据分析中的一种,因此,通过对多种数据进行关联可以得到有价值的信息,进而可以为用户的决策等提供依据。

技术实现要素:

本申请提供了一种数据关联方法及装置,目的在于确定wifi数据和人脸数据间的关联关系。

为了实现上述目的,本申请提供了以下技术方案:

一种数据关联方法,包括:

获取wifi数据和人脸数据,所述wifi数据包括连接wifi网络的设备的mac地址,所述人脸数据包括人脸图像;

将所述wifi数据划分为至少两个部分,其中,所述至少两个部分的wifi数据无交集且数据量相当,位于同一楼层的所述设备的wifi数据包括在同一个部分;

以预设的多个信号强度阈值,将目标部分的wifi数据划分为多个分区,所述目标部分为任意一个部分;

通过确定各个所述分区中的wifi数据匹配的人脸数据,得到匹配数据组,任意一个所述匹配数据组中包括匹配的mac地址与人脸;

统计所述目标部分中的目标匹配数据组,在所述目标部分的所述分区中出现的总次数,所述目标匹配数据组为任意一个所述匹配数据组;

将第一数值与第二数值的运算结果,作为所述目标匹配数据组的分数,所述第一数值为所述目标匹配数据组在全部所述部分中出现的总次数,所述第二数值为包括所述目标匹配数据组的全部所述部分的总个数;

依据各个所述匹配数据组的分数,得到与所述mac地址匹配的人脸。

可选地,以预设的多个信号强度阈值,将目标部分的wifi数据划分为多个分区,包括:

获取预设的信号强度阈值序列,所述信号强度阈值序列中包括从大到小的n个所述信号强度阈值;

通过将大于目标信号强度阈值的wifi数据,划分至一个所述分区,得到n个分区。

可选地,信号强度阈值依据所述连接wifi网络的设备的信号强度的分布,和/或,所述设备与wifi接入点之间的距离确定。

可选地,将第一数值与第二数值的运算结果,作为所述目标匹配数据组的分数,包括:

将第一数值与第二数值的乘积,作为所述目标匹配数据组的分数。

可选地,确定各个所述分区中的wifi数据匹配的人脸数据,得到匹配数据组,包括:

将所述wifi数据中具有相同的mac地址的wifi数据作为一组,得到wifi数据组;

计算每个wifi数据组包含的mac地址分别与所述人脸图像中各人脸间的匹配分值,所述匹配分值的大小,与所述mac地址所属的设备和所述人脸图像所属的人脸分别指示同一个人的程度成正相关;

将目标mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小排序的、预设数量的匹配分值分别对应的人脸,作为与所述目标mac地址匹配的人脸,所述目标mac地址为任意一个mac地址。

可选地,确定任意一个wifi数据组包含的mac地址与所述人脸图像中的任意一个人脸间的匹配分值,包括:

从该人脸的人脸数据中,确定分别与该wifi数据组中的每条wifi数据间满足预设条件的人脸数据,作为与所述wifi数据关联的人脸数据组;对于任意一条wifi数据,所述预设条件包括:时刻属于预设时刻范围;所述预设时刻范围为以该条wifi数据的产生时刻为时间中点的前后预设时长构成的时刻范围;

分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值;

依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值。

可选地,计算任意一条wifi数据和关联的人脸数据组间的匹配分值,包括:

计算该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值;其中,该条wifi数据和关联的人脸数据组中的任意一条人脸数据的匹配分值与差距成负相关;所述差距为第一距离和第二距离间的差值;所述第一距离为该条wifi数据中的位置与该条wifi数据所属的路由器间的距离;所述第二距离为该条人脸数据中的位置与该条wifi数据所属的路由器间的距离;

将该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值相加得到的值,作为该条wifi数据和关联的人脸数据组间的匹配分值。

可选地,在所述分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值之后,且在所述依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值之前,还包括:

从该wifi数据组中,确定属于不同路由器的wifi数据中重叠时间段的wifi数据为一组待处理wifi数据;

将所述待处理wifi数据的时刻按照预设先后顺序进行排序,得到排序后的待处理wifi数据;

确定所述排序后的待处理wifi数据中的每条wifi数据的匹配分值的权值;任意一条wifi数据的匹配分值的权值与目标距离成负相关;所述目标距离为该条wifi数据和相邻的一条wifi数据分别所属的路由器间的距离;

分别对每组待处理wifi数据的匹配分值进行加权和,任意一组待处理wifi数据的匹配分值进行加权和得到的数值为该组待处理wifi数据的匹配分值;

将该wifi数据组中,除各组待处理wifi数据外的wifi数据的匹配分值,以及各组待处理wifi数据分别对应的匹配分值进行相加;

所述依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值,包括:

将相加得到的值作为该wifi数据组包含的mac地址与该人脸间的匹配分值。

一种数据关联装置,包括:

数据获取模块,用于获取wifi数据和人脸数据,所述wifi数据包括连接wifi网络的设备的mac地址,所述人脸数据包括人脸图像;

分部模块,用于将所述wifi数据划分为至少两个部分,其中,所述至少两个部分的wifi数据无交集且数据量相当,位于同一楼层的所述设备的wifi数据包括在同一个部分;

分区模块,用于以预设的多个信号强度阈值,将目标部分的wifi数据划分为多个分区,所述目标部分为任意一个部分;

匹配模块,用于通过确定各个所述分区中的wifi数据匹配的人脸数据,得到匹配数据组,任意一个所述匹配数据组中包括匹配的mac地址与人脸;

统计模块,用于统计所述目标部分中的目标匹配数据组,在所述目标部分的所述分区中出现的总次数,所述目标匹配数据组为任意一个所述匹配数据组;

打分模块,用于将第一数值与第二数值的运算结果,作为所述目标匹配数据组的分数,所述第一数值为所述目标匹配数据组在全部所述部分中出现的总次数,所述第二数值为包括所述目标匹配数据组的全部所述部分的总个数;

关联模块,用于依据各个所述匹配数据组的分数,得到与所述mac地址匹配的人脸。

一种数据关联设备,包括:存储器和处理器;

所述存储器,用于存储程序;

所述处理器,用于执行所述程序,实现如上所述的数据关联方法的各个步骤。

一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如上所述的数据关联方法的各个步骤。

由上述技术方案可以看出,本申请实施例提供的数据关联方法、装置、设备及可读存储介质,将获取的wifi数据依据位置划分为至少两个部分,对于任一部分即目标部分,依据信号强度划分为n个分区。对于任一分区,将获取的人脸数据与wifi数据进行匹配,通过确定各个分区中的wifi数据匹配的人脸数据,得到匹配数据组,其中,在任一分区出现的匹配数据组包括的mac地址与人脸,即为在该分区中匹配程度高的mac地址与人脸。显然,对于任一匹配数据组即目标匹配数据组,在分区中出现的次数(即第一数值)与该目标匹配数据组中mac地址与人脸的匹配程度成正比。并且,包括目标匹配数据组的全部部分的总个数(即第二数值)与该目标匹配数据组中mac地址与人脸的匹配程度也成正比。所以,将第一数值与第二数值的运算结果,作为目标匹配数据组的分数。可以理解的是,目标匹配数据组的分数与该目标匹配数据组中mac地址与人脸的匹配程度成正比。所以,依据各个匹配数据组的分数,得到的与mac地址匹配的人脸具有较高的准确性。并且,本方法对wifi数据进行部分的划分,实现不同位置(例如楼层)之间的数据打通,匹配结果可以互相验证,保证匹配结果的可靠性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种数据关联方法的应用场景示意图;

图2为本申请实施例提供的一种数据关联方法的流程图;

图3为本申请实施例提供的一种确定匹配的mac地址与人脸的方法流程图;

图4为本申请实施例提供的一种数据关联装置的结构示意图;

图5为本申请实施例提供的一种数据关联设备的结构示意图。

具体实施方式

图1为本申请实施例提供的一种数据关联方法的应用场景示意图,包括:第一设备101、第二设备102和本申请实施例提供的数据关联装置103,其中,第一设备101用于提供wifi数据,第二设备102用于提供人脸数据,数据关联装置103用于确定第一设备101提供的wifi数据和第二设备102提供的人脸数据进行关联,匹配出属于同一个人的wifi数据和人脸数据。

本申请实施例中,第一设备提供的wifi数据和第二设备提供的人脸数据指:在指定场所内的预设空间产生的wifi数据和人脸数据,其中预设空间可以以楼层划分。例如,指定场所为xx商场,指定场所内的预设空间可以分别为该商场的一层、二层、三层、以及四层,则第一设备提供的wifi数据和第二设备提供的人脸数据指的是该xx商场内一层、二层、三层、以及四层产生的wifi数据和人脸数据。

需要说明的是,图1仅为本申请实施例可选的一种应用场景,本申请实施例还可以应用于其他场景下,对此本申请实施例不做限定。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

图2为本申请实施例提供的一种数据关联方法的流程示意图,如图2所示,本方法具体可以包括:

s201、获取wifi数据和人脸数据。

具体地,wifi数据为各时刻下设备扫描到指定场所内的路由器,路由器产生的数据,其中,wifi数据具体包括:连接到wifi网络的设备的mac地址、路由器产生wifi数据的时刻、信号强度,以及位置。其中,设备可以为手机,本实施例不对设备的具体形式所限定,位置表示设备相对于扫描到的路由器的位置。例如,mac地址为a的设备扫描到商场二层中的路由器b,并且,依据该设备扫描到的信号强度可以确定出mac地址为a的设备与路由器b间的距离,由于路由器b在商场中的位置是已知的,因此,可以确定出mac地址为a的设备在商场中的位置为以路由器b为圆心以计算出的距离为半径所形成的圆边的附近区域。指定场所可以根据实际的业务场景设定,例如,设置为指定的商场。

可选地,可以通过wifi探针获取wifi数据。在本实施例中,将一个mac地址在一个时刻下的wifi数据称一条wifi数据。

人脸数据为指定场所内的各人物在各时刻下的位置,具体的,人脸数据包括:人脸图像、人脸图像的拍摄时刻和人脸图像中的人脸被拍摄到时在指定场所内的位置。

具体的,人脸数据的获取方式可以包括:通过从指定场所内安装的各个摄像头拍摄的视频流中,识别出人脸图像、以及人脸图像的拍摄时刻,并依据视频流中的图像进行三维重建,确定识别出的各人脸图像包含的人物在指定场所内的各时刻的位置,并将识别出的人脸图像、人脸图像的拍摄时刻,以及人脸图像包含的人物该拍摄时刻在指定场所内的位置组成人脸数据。

为了描述方便,在本实施例中,将一个人脸在一个时刻下的位置所构成的人脸数据称为一条人脸数据。

进一步,本申请实施例将获取的wifi数据中的位置和人脸数据中的位置,统一到预设的参考坐标系下,得到统一后的wifi数据和统一后的人脸数据。其中,位置统一的实现过程为现有技术,这里不再赘述。

s202、将wifi数据划分为至少两个部分。

其中,位于同一楼层的设备的wifi数据包括在同一个部分,每一部分的wifi数据无交集,即,每一wifi数据值只包含于一个部分。并且,划分后的每一部分包含的wifi数据的数据量相当,即不能出现不同部分中包括的数据量相差过多的现象。对此,可以预先设置数据量差值的阈值,并依据wifi数据的总数量以及每一楼层的wifi数据的数据量对wifi数据进行划分。

以划分两个部分为例,假设s202获取的wifi数据包括xx商场一层、二层、三层、以及四层的wifi数据,本步骤可以基于每条wifi数据的位置,将wifi数据划分为两个部分,即第一部分包括二层的所有wifi数据,第二部分包括一层、三层、以及四层的所有wifi数据。其中,第一部分中的数据量与第二部分中的数据量相当。

s203、以预设的多个信号强度阈值,将目标部分的wifi数据划分为多个分区。

在本步骤中,将任意一个部分的wifi数据划分为多个分布的过程相同,为了描述方便,以任意一个部分为目标部分,介绍将该目标部分的wifi数据划分为多个分区的方法,具体包括:

首先,获取预设的信号强度阈值序列。

其中,信号强度阈值序列中包括从大到小的n个信号强度阈值。目标部分的每条wifi数据包括信号强度以及位置,所以,信号强度阈值可以依据连接wifi网络的设备的信号强度的分布和/或设备与wifi接入点之间的距离确定。例如,依据连接wifi网络的设备的信号强度的分布确定信号强度阈值时,目标部分的wifi数据的信号强度分布在-75db和-45db之间,则可以确定阈值分别为-80db、-70db、-60db、-50db。由此,确定预设的信号强度阈值序列为{-80db、-70db、-60db、-50db}。

进一步,通过将大于目标信号强度阈值的wifi数据,划分至一个分区,得到n个分区。其中,目标信号强度阈值为信号强度阈值序列任意一个信号强度阈值,n为信号强度阈值的个数。例如,信号强度阈值序列为{-80db、-70db、-60db、-50db},将信号强度大于-80db的wifi数据划分为一个分区,将信号强度大于-70db的wifi数据划分为一个分区,将信号强度大于-60db的wifi数据划分为一个分区,将信号强度大于-50db的wifi数据划分为一个分区。

基于上述方法,可以基于信号强度阈值序列将任一部分划分为n个分区。

s204、通过确定各个分区中的wifi数据匹配的人脸数据,得到匹配数据组。

具体地,每一分区中包括若干条wifi数据,每条wifi数据包括连接到wifi网络的设备的mac地址,可以理解的是,同一设备(如手机)连接到wifi网络时的mac地址是相同的。并且,每条人脸数据包括人脸图像,每一人脸图像至少指示一个人脸,即同一人脸可以包含于多张人脸图像中。所以,确定每一wifi数据与每一人脸数据的关联程度,可以进一步确定每一mac地址与人脸之间的匹配程度。即包含mac地址的wifi数据与包含人脸的人脸数据的关联程度高,则该mac地址与该人脸之间的匹配程度高。

本步骤通过确定各个分区中的wifi数据与人脸数据的关联关系,确定任意mac地址匹配的人脸,并将匹配的mac地址以及人脸组成一个匹配数据组,由此得到每一分区的匹配数据组。

本实施例中,确定匹配的mac地址与人脸的方法可以包括:将wifi数据中相同的mac地址的wifi数据作为一组,得到wifi数据组,计算每个wifi数据组包含的mac地址分别与人脸图像中各人脸间的匹配分值,匹配分值的大小,与mac地址所属的设备和人脸图像所属的人脸分别指示同一个人的程度成正相关,对于每个mac地址,将该mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小顺序的预设数量的匹配分值分别对应的人脸,作为与该mac地址关联的人脸。

s205、统计目标部分中的目标匹配数据组,在目标部分的分区中出现的总次数。

其中,目标部分为任意一个部分,目标匹配数据组为任意一个匹配数据组。可以理解的是,不同分区可以得到相同的匹配数据组,例如,通过确定第一分区中的wifi数据匹配的人脸数据,得到匹配数据组z。通过确定第二分区中的wifi数据匹配的人脸数据,也得到匹配数据组z。本步骤统计目标匹配数据组(例如z),在目标部分中出现的总次数,也即,该目标部分出现该目标匹配数据组的分区的个数。

s206、将第一数值与第二数值的运算结果,作为目标匹配数据组的分数。

其中,第一数值为目标匹配数据组在全部部分中出现的总次数,第二数值为包括目标匹配数据组的全部部分的总个数。

例如,将wifi数据划分为第一部分和第二部分,其中,每一部分划分为第一分区、第二分区、第三分区、以及第四分区。对于目标匹配数据组z,第一数值为该目标匹配数据组z在第一部分中出现的次数与在第二部分中出现的次数之和。若目标匹配数据组z只出现在第一部分,或只出现在第二部分,则第二数值为1,若目标匹配数据组z在第一部分和第二部分均出现,则第二数值为2。

显然,第一数值越大,表示mac地址和人脸被确定为匹配的次数越多,即第一数值与目标匹配数据中的mac地址和人脸的匹配程度成正比。并且,第二数值越大,表示在越多的位置上mac地址和人脸被确定为匹配,即第二数值与目标匹配数据中的mac地址和人脸的匹配程度也成正比。所以,可以计算第一数值与第二数值的乘积,将乘积作为目标匹配数据组的分数。由此可以得到各个匹配数据组的分数。

s207、依据各个匹配数据组的分数,得到与所述mac地址匹配的人脸。

可以理解的是,任一匹配数据组的分数与该匹配数据组包括的mac地址和人脸的匹配程度成正比。所以,依据各个匹配数据组的分数,可以判断mac地址与人脸的匹配程度,得到匹配程度高的mac地址与人脸。

本步骤可以按照多种方式执行,下面介绍可选的两种方式,即第一方式和第二方式。

第一方式,淘汰分数小于预设分数阈值的匹配数据组,将分数大于等于预设分数阈值的匹配数据组作为最终的匹配数据组,将每一最终的匹配数据组中的mac地址与人脸确定为相匹配的mac地址与人脸。

第二方式,将包括相同mac地址的匹配数据组按照分数进行排序,取前预设个匹配数据组作为最终的匹配数据组,将每一最终的匹配数据组中的mac地址与人脸确定为相匹配的mac地址与人脸。

由上述技术方案可以看出,本申请实施例提供的数据关联方法、装置、设备及可读存储介质,将获取的wifi数据依据位置划分为至少两个部分,对于任一部分即目标部分,依据信号强度划分为n个分区。对于任一分区,将获取的人脸数据与wifi数据进行匹配,通过确定各个分区中的wifi数据匹配的人脸数据,得到匹配数据组,其中,在任一分区出现的匹配数据组包括的mac地址与人脸,即为在该分区中匹配程度高的mac地址与人脸。显然,对于任一匹配数据组即目标匹配数据组,在分区中出现的次数(即第一数值)与该目标匹配数据组中mac地址与人脸的匹配程度成正比。并且,包括目标匹配数据组的全部部分的总个数(即第二数值)与该目标匹配数据组中mac地址与人脸的匹配程度也成正比。所以,将第一数值与第二数值的运算结果,作为目标匹配数据组的分数。可以理解的是,目标匹配数据组的分数与该目标匹配数据组中mac地址与人脸的匹配程度成正比。所以,依据各个匹配数据组的分数,得到的与mac地址匹配的人脸具有较高的准确性。并且,本方法对wifi数据进行部分的划分,实现不同位置(例如楼层)之间的数据打通,匹配结果可以互相验证,保证匹配结果的可靠性。

进一步,本方法对每一部分的wifi数据进行分区的划分,不同分区中的wifi数据有交集,即wifi数据被重复包括在多个分区中,由于噪声数据的信号强度低,通常仅会被包括在一个分区,由此提高wifi数据的权重,减小噪声数据的权重。基于此,减少噪声数据的干扰。

进一步,由于获取到的wifi数据或人脸数据中存在大量的数据干扰,所以,本申请实施例对s201统一后的wifi数据以及统一后的人脸数据进行预处理,以得到预处理后的wifi数据和预处理后的人脸数据。

可选地,预处理的过程可以包括两个方面,分别为第一方面和第二方面。

其中,第一方面为:从统一后的wifi数据中去除与数据关联不相关的数据和质量较差的数据,得到去除后的wifi数据。从统一后的人脸数据中去除与数据关联不相关的数据,得到去除后的人脸数据。第二方面为:对去除后的人脸数据和去除后的wifi数据分别进行数据采样,得到预处理后的wifi数据和预处理后的人脸数据。

针对wifi数据:对统一后的wifi数据进行的第一方面的处理包括:从统一后的wifi数据中去除与数据关联不相关的数据包括:从统一后的wifi数据中去除持续时长不属于预设时长范围的wifi数据。从统一后的wifi数据中去除质量较差的数据包括:从统一后的wifi数据中去除信号强度小于预设强度阈值的wifi数据。

其中,预设时长范围由时长上限值和时长下限值构成,其中,时长上限值为用于区分指定人员和非指定人员的时长。还以指定场所为商场,顾客是与数据关联相关的人员(即指定人员)为例,由于顾客和非顾客(工作人员)在商场中的时长是不同的,因此,可以确定出一个用于区分工作人员和顾客的时长值作为时长上限值,例如,时长上限值可以为8小时。具体的,时长上限值的具体取值需要根据实际情况进行设定,本实施例不对时长上限值的具体取值作限定。

其中,时长下限值为用于区分wifi数据中mac地址所属的设备指示的人员是否为指定场所内的人员。还以指定场所为商场且顾客是指定人员为例,由于在路过商场且未进入商场的人员的设备也可能扫描到商场内的路由器,但是,路过商场且未进入商场的人员不是数据关联相关的人员(非指定人员)。并且,相对于商场内的人员,路过商场且未进入商场的人员的wifi数据持续的时长较短,因此,可以设置一个用于区分wifi数据中mac地址所属的设备指示的人员是否为商场内的人员的时长值作为时长下限值。例如,时长下限值为2分钟。

其中,信号强度小于阈值的wifi数据表示信号强度较差的wifi数据,具体的,该阈值具体取值需要根据实际情况进行设定,例如取值可以为-90db,本实施例不对该阈值的具体取值作限定。

针对人脸数据:在本步骤中,对统一后的人脸数据进行第一方面的处理包括:从人脸数据中去除预先指定人员的人脸数据外的人脸数据,其中,指定人员为实际的业务场景所需进行数据关联的人员。还以指定场所为商场为例,顾客是指定人员。

具体的,从统一后的人脸数据中去除指定人员的人脸数据外的人脸数据的过程包括:从统一后的人脸数据中识别出指定人员的人脸数据外的人脸数据,并将识别出的人脸数据进行删除。其中,从统一后的人脸数据中识别出指定人员的人脸数据外的人脸数据的过程可以包括:事先统计指定人员的人脸信息,从统一后的人脸数据中识别出已统计的人脸信息,进而得到统一后的人脸数据中除指定人员的人脸数据之外的人脸数据。当然,本实施例只是提供了一种从统一后的人脸数据中识别出除指定人员的人脸数据外的人脸数据的方式,在实际中,还可以通过其他方式,本实施例不对具体的识别方式作限定。

在得到去除后的wifi数据和去除后的人脸数据后,对去除后的wifi数据和去除后的人脸数据分别进行第二方面的处理,即分别进行数据采样,得到预处理后的人脸数据和预处理后的wifi数据。

在本实施例中,为了减少计算资源和提高计算效率,对去除后的人脸数据进行第二方面的处理,具体为对去除后的人脸数据进行采样。具体的采样过程包括:将去除后的人脸数据的起始时刻,与起始时刻的时长为第一预设时长的整数倍的时刻,以及结束时刻作为人脸采样时刻。将去除后的人脸数据中除人脸采样时刻的人脸数据外的人脸数据删除,得到预处理后的人脸数据。其中,第一预设时长的具体取值可以根据实际业务场景进行设置,本实施例不对第一预设时长的取值作限定。

对去除后的wifi数据进行第二方面的处理为对去除后的wifi数据进行数据采样。具体的,对去除后的wifi数据进行数据采样的过程包括:将去除后的wifi数据的起始时刻、与起始时刻间的时长为第二预设时长的整数倍的时刻,以及结束时刻作为wifi采样时刻,将去除后的wifi数据中除wifi采样时刻的wifi数据外的wifi数据删除,得到预处理后的wifi数据。其中,第二预设时长的具体取值需要根据具体的业务场景设定,本实施例不对第二预设时长的具体取值作限定。

在实际中,wifi数据的产生时刻与扫描到时刻(扫描产生wifi数据的路由器的时刻)间存在一定的延时,在本实施例中,基于延时设定一个延时时长,例如,延时时长为5s,当然,在实际中,预设延时时长还可以为其他取值,本实施例不对预设延时时长的具体取值作限定。在本实施例中,当第一预设时长与第二预设时长相同,并且,等于预设延时时长的情况下,基于预处理后的wifi数据和预处理后的人脸数据进行后续步骤,最终所得到的wifi数据和人脸数据的关联结果的准确性会得到提高。

由上述预处理方法可以看出,分别对wifi数据和人脸数据进行第一方面的处理,使得去除后的wifi数据和去除后的人脸数据对于数据关联来说,数据质量得到提高,使得最终得到的与wifi数据中各mac地址关联的人脸的结果的准确性具有一定的保证。同时,对去除后的wifi数据和去除后的人脸数据进行第二方面的处理后,可以大幅度降低去除后的wifi数据和去除后的人脸数据中的冗余数据,得到预处理后的wifi数据和预处理后的人脸数据,使得后续基于预处理后的wifi数据和预处理后的人脸数据计算得到最终的关联结果的过程,可以节省较多的计算资源,以及提高计算效率。

图3为本申请实施例提供的一种确定匹配的mac地址与人脸的方法,其中确定任一部分中的任一分区的wifi数据匹配的人脸数据的方法是相同的,本申请实施例以其中任一个分区为例,对s204中的确定匹配的mac地址与人脸的方法进行进一步的介绍,具体可以包括:

s301、将wifi数据中具有相同的mac地址的wifi数据作为一组,得到wifi数据组。

其中,wifi数据为任意一个分区中的wifi数据,该wifi数据可以是预处理后的wifi数据,也可以是统一后的wifi数据。

s302、计算每个wifi数据组包含的mac地址分别与人脸图像中各人脸间的匹配分值。

可以理解的是,匹配分值的大小与mac地址所属的设备和人脸图像所属的人脸分别指示同一个人的程度成正相关。即,mac地址与人脸图像中人脸的匹配分值越大,则该mac地址与该人脸指示同一个人的程度越大。

在本步骤中,确定与每组wifi数据组包含的mac地址分别与人脸数据中各人脸间的匹配分值的过程是相同的,为了描述方便,以任意一个wifi数据组和任意一个人脸为例,介绍确定该wifi数据组包含的mac地址与该人脸间的匹配分值的过程。具体包括步骤a1~步骤a5:

a1、确定与该wifi数据组中的每条wifi数据相匹配的人脸数据组。

在本步骤中,确定与每条wifi数据相关联的人脸数据组的过程是相同的,为了描述方便,以任意一条wifi数据为例,介绍从该人脸的人脸数据中确定与该条wifi数据关联的人脸数据组。

具体地,从该人脸的人脸数据中确定满足预设条件的人脸数据为该条wifi关联的人脸数据组,其中,预设条件包括:产生时刻属于预设时刻范围。其中,预设时刻范围包括上限值和下限值,其中,上限值是以该条wifi数据的产生时刻为时间中点之前预设时长的时刻,下限值以该条wifi数据的产生时刻为时间中点之后预设时长的时刻。

针对任意一条wifi数据,通过本步骤确定出该人脸的人脸数据中满足预设条件的人脸数据组为该条wifi数据关联的人脸数据组。在本实施例中,需要判断该条wifi数据包含的mac地址所属的设备和确定出的人脸数据组包含的人脸是否分别指示同一个人。在实际中,有时该条wifi数据包含的mac地址所属的设备和关联的人脸数据组包含的人脸图像指示的人脸明显不是指示同一个人,如果按照以下步骤确定匹配分值是无意义的。例如,商场三层的路由器产生的一条wifi数据和满足预设条件的人脸数据为商场一层的一组人脸数据。

因此,在本步骤中,为了提高本实施例的计算效率,预设条件还包括:位置属于预设位置范围,具体的,预设位置范围包括:以该条wifi数据所属的路由器为中心,以预设距离为半径所形成的圆形区域,其中,所述预设距离为所述路由器的信号可以覆盖的直线长度。

如果该人脸的人脸数据中不存在满足预设条件的人脸数据组,则将该条wifi数据与该人脸间的匹配分值设为0,无需按照以下步骤a2的动作执行,当然,也可以继续执行步骤a2的动作。

a2、计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值。

在本步骤中,对任意一条wifi数据和关联的人脸数据组的匹配分值的计算过程相同,为了描述方便,以任意一条wifi数据和关联的人脸数据组为例,介绍该条wifi数据和关联的人脸数据组间的匹配分值的计算过程,具体包括:

分别计算该条wifi数据和关联的人脸数据组中的各条人脸数据间的匹配分值,并将所计算出的各匹配分值相加,如果相加所得到的值不大于预设匹配分数阈值,则将相加所得到的值作为该条wifi数据和关联的人脸数据组间的匹配分值,如果相加得到的值大于预设匹配分值阈值的情况下,将预设匹配分值阈值作为该条wifi数据和关联的人脸数据组间的匹配分值。为了描述方便,将该条wifi数据和关联的人脸数据组间的匹配分值,称为该条wifi数据的匹配分值。

其中,计算该条wifi数据和关联的人脸数据组中任意一条人脸数据间的匹配分值的过程包括:

首先,根据该条wifi数据中的信号强度以及信号强度和距离间的预设关系,计算出该条wifi数据包含的mac地址所属的设备距离该条wifi数据所属的路由器的距离为第一距离。其次,确定该条人脸数据包含的人脸与该条wifi数据所属的路由器间的距离为第二距离。最后,依据第一距离与第二距离间的差距,确定该条wifi数据和该条人脸数据间的匹配分值,其中,第一距离与第二距离间的差距与该条wifi数据和该条人脸数据间的匹配分值成负相关,即第一距离与第二距离的差距越小,则该条wifi数据和该条人脸数据间的匹配分值越高,相反,该条wifi数据和该条人脸数据间的匹配分值越低。

通过本步骤可以得到该wifi数据组中每条wifi数据的匹配分值。

a3、依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址和该人脸间的匹配分值。

在本步骤中,可以通过两种方式进行计算,分别为第一种方式和第二种方式。

其中,第一种方式包括:将该wifi数据组中每条wifi数据的匹配分值相加,所得到的值作为该wifi数据组包含的mac地址和该人脸间的匹配分值。

在实际中,由于该wifi数据组中存在属于不同路由器的wifi数据,并且属于不同路由器的wifi数据中存在时间段重叠的wifi数据,即该wifi数据组中存在噪声数据,导致按照第一种方式确定出的该wifi数据组与该人脸间的匹配分值的准确性不能达到很好的效果。例如,该wifi数据组中存在属于路由器a的wifi数据,时间段为9点00分~9点30分,同时,该wifi数据组中存在属于路由器b的wifi数据,时间段为9点20分~9点40分,其中,9点20分~9点30分为重叠时间段。

为了进一步提高该wifi数据组包含的mac地址和该人脸间的匹配分值的准确性,本步骤提供了第二种方式。具体的,通过第二种方式计算该wifi数据组包含的mac地址与该人脸间的匹配分值的过程包括步骤b1~步骤b3:

b1、将该wifi数据组中属于不同路由器的wifi数据中时间段重叠的wifi数据作为一组待处理wifi数据。

还以9点20分~9点30分为重叠时间段为例,在本步骤中,则将该wifi数据组中存在属于路由器a的wifi数据中时刻属于9点20分~9点30分的wifi数据,以及该wifi数据组中存在属于路由器b的wifi数据中时刻属于9点20分~9点30分的wifi数据作为一组待处理的wifi数据。

b2、对于每组待处理wifi数据中各条待处理wifi数据的匹配分值的权值。

具体的,以任意一组wifi数据为例,将该组待处理wifi数据组中的wifi数据的时刻按照预设先后顺序进行排序,得到排序后的待处理wifi数据。确定排序后的待处理wifi数据中的每条wifi数据的匹配分值的权值,其中,任意一条wifi数据的匹配分值的权值与目标距离成负相关,其中,目标距离为该条wifi数据和相邻的一条wifi数据分别所属的路由器间的距离。

其中,相邻可以为前一条或者后一条,但是,对于计算一组待处理wifi数据的匹配分值的过程中,对于每条待处理wifi数据,相邻的一条wifi数据都为“前一条wifi数据”,或者,相邻的一条wifi数据都为“后一条wifi数据”,具体为“前一条wifi数据”还是“后一条wifi数据”本实施例不作限定,只要同一组待处理wifi数据统一即可。

具体的,如果分别所属的路由器间的距离大于预设距离阈值,可以将该权值设置为大于1的一个数值,并且,距离越大权值越大。如果分别所属的路由器间的距离小于预设距离阈值,则将该权值设置为小于1的一个数值,并且,距离越小权值越小。对于任一组待处理wifi数据从时间上进行排序后中的第一条wifi数据(以前一条wifi数据进行比较的情况),权值可以设定为1。对于该组待处理wifi数据从时间上进行排序后中的最后一条wifi数据(以后一条wifi数据进行比较的情况),权值可以设定为1。

b3、将该wifi数据组中,除各组待处理wifi数据外的wifi数据的匹配分值,以及各组待处理wifi数据分别对应的匹配分值进行相加,并将相加得到的值作为该wifi数据组包含的mac地址与该人脸间的匹配分值。

s303、将目标mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小排序的、预设数量的匹配分值分别对应的人脸,作为与所述目标mac地址匹配的人脸。

其中,目标mac地址为任意一个wifi数据组包含的mac地址,以任意一个wifi数据组为例进行介绍。具体的,将该wifi数据组包含的mac地址分别与各人脸间的匹配分值按照从高到低的顺序,确定出前预设数量的匹配分值对应的人脸,作为与该wifi数据组包含的mac地址匹配的人脸。

基于此,得到的匹配数据组可以包括:任一wifi数据组包含的mac地址、以及与该wifi数据组匹配的任一人脸。

在本步骤中,预设数量的取值可以根据实际的业务场景确定,本实施例不对预设数量的取值作限定。在本实施例中,预设数量的取值可以为5。

例如,该wifi数据组包含的mac地址为a,与该wifi数据组匹配的人脸数据包含的人脸包括:人脸a、人脸b、人脸c和人脸d,其中,a与人脸a间的匹配分值为80分,a与人脸b间的匹配分值为90分,a与人脸c间的匹配分值为90分和a与人脸d间的匹配分值为100分,预设数量的取值为3,则本步骤中,将人脸d、人脸c和人脸b作为与mac地址a匹配的人脸。则得到的匹配数据组可以为:匹配数据组z1{mac地址a,人脸d}、匹配数据组z2{mac地址a,人脸c}、匹配数据组z3{mac地址a,人脸b}。

需要说明的是,存在以下情况:在不同预设时间段内的与各个mac地址分别匹配的人脸中存在相同mac地址,为了提高匹配数据组的准确性,可以进一步执行下述s304,如下:

s304、在不同预设时间段内的与各个mac地址分别匹配的人脸中存在相同mac地址的情况下,确定与相同mac地址匹配的人脸中重复出现的人脸,作为该不同预设时间段内与相同mac地址匹配的人脸。

在本步骤中,不同预设时间段可以为不同天,例如,6月20日和6月21日是两个不同的预设时间段。

在本实施例中,可以从每个预设时间内的wifi数据和人脸数据中,确定出与wifi数据包含的各个mac地址分别匹配的人脸。在本步骤中,在不同预设时间段内与各个mac地址分别匹配的人脸中存在相同mac地址的情况下,将不同预设时间段内相同的mac地址分别匹配的人脸中重复出现的人脸,作为与该相同的mac地址匹配的人脸。

例如,在6月20日、6月21日、6月22日和6月23日中的每天,都得到与wifi数据组包含的mac地址匹配的人脸。在本步骤中,从与wifi数据组包含的mac地址匹配的人脸中,确定重复出现的人脸。将所确定出的重复出现的人脸作为与wifi数据组包含的mac地址匹配的人脸,此时得到的匹配结果具有较高的准确性。

例如,小红在6月20日与朋友a、朋友b一起在x商场,可能得到与小红设备的mac地址匹配的人脸有小红、朋友a和朋友b。小红在6月21日与朋友c、朋友d一起在x商场,可能得到与小红设备的mac地址匹配的人脸有小红、朋友c和朋友d。假设,小红在6月20日和6月21日在x商场所携带的设备是同一个设备,则可以得到6月20日和6月21日,与小红设备的mac地址匹配的人脸中重复出现的人脸是小红,则可以确定出与小红设备的mac地址匹配的人脸是小红,这一结果与实际情况相符合,所以,将与mac地址匹配的人脸中重复出现的人脸作为该mac地址匹配的人脸这一匹配结果具有较高的准确性。

由上述技术方案可以看出,本申请实施例将同一分区中的wifi数据中相同的mac地址的wifi数据作为一组,得到多个wifi数据组,计算每个wifi数据组包含的mac地址分别与人脸数据中各人脸间的匹配分值,得到每个mac地址分别与各人脸间的匹配分值,对于每个mac地址,将该mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小顺序的预设数量的匹配分值分别对应的人脸,作为与该mac地址匹配的人脸。

由于匹配分值的大小与mac地址所属的设备与人脸分别指示同一个人的程度成正匹配,因此,确定出的与mac地址匹配的人脸具有一定的准确性,基于此,得到的匹配数据组中的mac地址以及人脸的匹配程度高。

本申请实施例还提供了一种数据关联装置,下面对本申请实施例提供的数据关联装置进行描述,下文描述的数据关联装置与上文描述的数据关联方法可相互对应参照。

请参阅图4,示出了本申请实施例提供的一种数据关联装置的结构示意图,如图4所示,该装置可以包括:

数据获取模块401,用于获取wifi数据和人脸数据,所述wifi数据包括连接wifi网络的设备的mac地址,所述人脸数据包括人脸图像;

分部模块402,用于将所述wifi数据划分为至少两个部分,其中,所述至少两个部分的wifi数据无交集且数据量相当,位于同一楼层的所述设备的wifi数据包括在同一个部分;

分区模块403,用于以预设的多个信号强度阈值,将目标部分的wifi数据划分为多个分区,所述目标部分为任意一个部分;

匹配模块404,用于通过确定各个所述分区中的wifi数据匹配的人脸数据,得到匹配数据组,任意一个所述匹配数据组中包括匹配的mac地址与人脸;

统计模块405,用于统计所述目标部分中的目标匹配数据组,在所述目标部分的所述分区中出现的总次数,所述目标匹配数据组为任意一个所述匹配数据组;

打分模块406,用于将第一数值与第二数值的运算结果,作为所述目标匹配数据组的分数,所述第一数值为所述目标匹配数据组在全部所述部分中出现的总次数,所述第二数值为包括所述目标匹配数据组的全部所述部分的总个数;

关联模块407,用于依据各个所述匹配数据组的分数,得到与所述mac地址匹配的人脸。

可选地,分区模块用于以预设的多个信号强度阈值,将目标部分的wifi数据划分为多个分区,包括:所述分区模块具体用于:

获取预设的信号强度阈值序列,所述信号强度阈值序列中包括从大到小的n个所述信号强度阈值;

通过将大于目标信号强度阈值的wifi数据,划分至一个所述分区,得到n个分区。

可选地,信号强度阈值依据所述连接wifi网络的设备的信号强度的分布,和/或,所述设备与wifi接入点之间的距离确定。

可选地,打分模块用于将第一数值与第二数值的运算结果,作为所述目标匹配数据组的分数,包括:所述打分模块具体用于:

将第一数值与第二数值的乘积,作为所述目标匹配数据组的分数。

可选地,匹配模块用于通过确定各个所述分区中的wifi数据匹配的人脸数据,得到匹配数据组,包括:

数据组获取单元,用于将所述wifi数据中具有相同的mac地址的wifi数据作为一组,得到wifi数据组;

匹配分值计算单元,用于计算每个wifi数据组包含的mac地址分别与所述人脸图像中各人脸间的匹配分值,所述匹配分值的大小,与所述mac地址所属的设备和所述人脸图像所属的人脸分别指示同一个人的程度成正相关;

人脸匹配单元,用于将目标mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小排序的、预设数量的匹配分值分别对应的人脸,作为与所述目标mac地址匹配的人脸,所述目标mac地址为任意一个mac地址。

可选地,匹配分值计算单元用于确定任意一个wifi数据组包含的mac地址与所述人脸图像中的任意一个人脸间的匹配分值,包括:所述匹配分值计算单元具体用于:

从该人脸的人脸数据中,确定分别与该wifi数据组中的每条wifi数据间满足预设条件的人脸数据,作为与所述wifi数据关联的人脸数据组;对于任意一条wifi数据,所述预设条件包括:时刻属于预设时刻范围;所述预设时刻范围为以该条wifi数据的产生时刻为时间中点的前后预设时长构成的时刻范围;

分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值;

依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值。

可选地,匹配分值计算单元用于计算任意一条wifi数据和关联的人脸数据组间的匹配分值,包括:所述匹配分值计算单元具体用于:

计算该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值;其中,该条wifi数据和关联的人脸数据组中的任意一条人脸数据的匹配分值与差距成负相关;所述差距为第一距离和第二距离间的差值;所述第一距离为该条wifi数据中的位置与该条wifi数据所属的路由器间的距离;所述第二距离为该条人脸数据中的位置与该条wifi数据所属的路由器间的距离;

将该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值相加得到的值,作为该条wifi数据和关联的人脸数据组间的匹配分值。

可选地,所述匹配分值计算单元具体还用于:在所述分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值之后,且在所述依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值之前:

从该wifi数据组中,确定属于不同路由器的wifi数据中重叠时间段的wifi数据为一组待处理wifi数据;

将所述待处理wifi数据的时刻按照预设先后顺序进行排序,得到排序后的待处理wifi数据;

确定所述排序后的待处理wifi数据中的每条wifi数据的匹配分值的权值;任意一条wifi数据的匹配分值的权值与目标距离成负相关;所述目标距离为该条wifi数据和相邻的一条wifi数据分别所属的路由器间的距离;

分别对每组待处理wifi数据的匹配分值进行加权和,任意一组待处理wifi数据的匹配分值进行加权和得到的数值为该组待处理wifi数据的匹配分值;

将该wifi数据组中,除各组待处理wifi数据外的wifi数据的匹配分值,以及各组待处理wifi数据分别对应的匹配分值进行相加;

可选地,所述匹配分值计算单元具体用于:

将相加得到的值作为该wifi数据组包含的mac地址与该人脸间的匹配分值。

本申请实施例还提供了一种数据关联设备,请参阅图5,示出了该数据关联设备的结构示意图,该设备可以包括:至少一个处理器501,至少一个通信接口502,至少一个存储器503和至少一个通信总线504;

在本申请实施例中,处理器501、通信接口502、存储器503、通信总线504的数量为至少一个,且处理器501、通信接口502、存储器503通过通信总线504完成相互间的通信;

处理器501可能是一个中央处理器cpu,或者是特定集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;

存储器503可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;

其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:

获取wifi数据和人脸数据,所述wifi数据包括连接wifi网络的设备的mac地址,所述人脸数据包括人脸图像;

将所述wifi数据划分为至少两个部分,其中,所述至少两个部分的wifi数据无交集且数据量相当,位于同一楼层的所述设备的wifi数据包括在同一个部分;

以预设的多个信号强度阈值,将目标部分的wifi数据划分为多个分区,所述目标部分为任意一个部分;

通过确定各个所述分区中的wifi数据匹配的人脸数据,得到匹配数据组,任意一个所述匹配数据组中包括匹配的mac地址与人脸;

统计所述目标部分中的目标匹配数据组,在所述目标部分的所述分区中出现的总次数,所述目标匹配数据组为任意一个所述匹配数据组;

将第一数值与第二数值的运算结果,作为所述目标匹配数据组的分数,所述第一数值为所述目标匹配数据组在全部所述部分中出现的总次数,所述第二数值为包括所述目标匹配数据组的全部所述部分的总个数;

依据各个所述匹配数据组的分数,得到与所述mac地址匹配的人脸。

可选的,所述程序的细化功能和扩展功能可参照上文描述。

本申请实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的程序,所述程序用于:

获取wifi数据和人脸数据,所述wifi数据包括连接wifi网络的设备的mac地址,所述人脸数据包括人脸图像;

将所述wifi数据划分为至少两个部分,其中,所述至少两个部分的wifi数据无交集且数据量相当,位于同一楼层的所述设备的wifi数据包括在同一个部分;

以预设的多个信号强度阈值,将目标部分的wifi数据划分为多个分区,所述目标部分为任意一个部分;

通过确定各个所述分区中的wifi数据匹配的人脸数据,得到匹配数据组,任意一个所述匹配数据组中包括匹配的mac地址与人脸;

统计所述目标部分中的目标匹配数据组,在所述目标部分的所述分区中出现的总次数,所述目标匹配数据组为任意一个所述匹配数据组;

将第一数值与第二数值的运算结果,作为所述目标匹配数据组的分数,所述第一数值为所述目标匹配数据组在全部所述部分中出现的总次数,所述第二数值为包括所述目标匹配数据组的全部所述部分的总个数;

依据各个所述匹配数据组的分数,得到与所述mac地址匹配的人脸。

可选的,所述程序的细化功能和扩展功能可参照上文描述。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征:

1.一种数据关联方法,其特征在于,包括:

获取wifi数据和人脸数据,所述wifi数据包括连接wifi网络的设备的mac地址,所述人脸数据包括人脸图像;

将所述wifi数据划分为至少两个部分,其中,所述至少两个部分的wifi数据无交集且数据量相当,位于同一楼层的所述设备的wifi数据包括在同一个部分;

以预设的多个信号强度阈值,将目标部分的wifi数据划分为多个分区,所述目标部分为任意一个部分;

通过确定各个所述分区中的wifi数据匹配的人脸数据,得到匹配数据组,任意一个所述匹配数据组中包括wifi匹配的mac地址与人脸;

统计所述目标部分中的目标匹配数据组,在所述目标部分的所述分区中出现的总次数,所述目标匹配数据组为任意一个所述匹配数据组;

将第一数值与第二数值的运算结果,作为所述目标匹配数据组的分数,所述第一数值为所述目标匹配数据组在全部所述部分中出现的总次数,所述第二数值为包括所述目标匹配数据组的全部所述部分的总个数;

依据各个所述匹配数据组的分数,得到与所述mac地址wifi匹配的人脸。

2.根据权利要求1所述的方法,其特征在于,所述以预设的多个信号强度阈值,将目标部分的wifi数据划分为多个分区,包括:

获取预设的信号强度阈值序列,所述信号强度阈值序列中包括从大到小的n个所述信号强度阈值;

通过将大于目标信号强度阈值的wifi数据,划分至一个所述分区,得到n个分区。

3.根据权利要求2所述的方法,其特征在于,所述信号强度阈值依据所述连接wifi网络的设备的信号强度的分布,和/或,所述设备与wifi接入点之间的距离确定。

4.根据权利要求1所述的方法,其特征在于,所述将第一数值与第二数值的运算结果,作为所述目标匹配数据组的分数,包括:

将第一数值与第二数值的乘积,作为所述目标匹配数据组的分数。

5.根据权利要求1-4任一项所述的方法,其特征在于,所述确定各个所述分区中的wifi数据匹配的人脸数据,得到匹配数据组,包括:

将所述wifi数据中具有相同的mac地址的wifi数据作为一组,得到wifi数据组;

计算每个wifi数据组包含的mac地址分别与所述人脸图像中各人脸间的匹配分值,所述匹配分值的大小,与所述mac地址所属的设备和所述人脸图像所属的人脸分别指示同一个人的程度成正相关;

将目标mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小排序的、预设数量的匹配分值分别对应的人脸,作为与所述目标mac地址匹配的人脸,所述目标mac地址为任意一个mac地址。

6.根据权利要求2所述的方法,其特征在于,确定任意一个wifi数据组包含的mac地址与所述人脸图像中的任意一个人脸间的匹配分值,包括:

从该人脸的人脸数据中,确定分别与该wifi数据组中的每条wifi数据间满足预设条件的人脸数据,作为与所述wifi数据关联的人脸数据组;对于任意一条wifi数据,所述预设条件包括:时刻属于预设时刻范围;所述预设时刻范围为以该条wifi数据的产生时刻为时间中点的前后预设时长构成的时刻范围;

分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值;

依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值。

7.根据权利要求6所述的方法,其特征在于,计算任意一条wifi数据和关联的人脸数据组间的匹配分值,包括:

计算该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值;其中,该条wifi数据和关联的人脸数据组中的任意一条人脸数据的匹配分值与差距成负相关;所述差距为第一距离和第二距离间的差值;所述第一距离为该条wifi数据中的位置与该条wifi数据所属的路由器间的距离;所述第二距离为该条人脸数据中的位置与该条wifi数据所属的路由器间的距离;

将该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值相加得到的值,作为该条wifi数据和关联的人脸数据组间的匹配分值。

8.根据权利要求6所述的方法,其特征在于,在所述分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值之后,且在所述依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值之前,还包括:

从该wifi数据组中,确定属于不同路由器的wifi数据中重叠时间段的wifi数据为一组待处理wifi数据;

将所述待处理wifi数据的时刻按照预设先后顺序进行排序,得到排序后的待处理wifi数据;

确定所述排序后的待处理wifi数据中的每条wifi数据的匹配分值的权值;任意一条wifi数据的匹配分值的权值与目标距离成负相关;所述目标距离为该条wifi数据和相邻的一条wifi数据分别所属的路由器间的距离;

分别对每组待处理wifi数据的匹配分值进行加权和,任意一组待处理wifi数据的匹配分值进行加权和得到的数值为该组待处理wifi数据的匹配分值;

将该wifi数据组中,除各组待处理wifi数据外的wifi数据的匹配分值,以及各组待处理wifi数据分别对应的匹配分值进行相加;

所述依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值,包括:

将相加得到的值作为该wifi数据组包含的mac地址与该人脸间的匹配分值。

9.一种数据关联装置,其特征在于,包括:

数据获取模块,用于获取wifi数据和人脸数据,所述wifi数据包括连接wifi网络的设备的mac地址,所述人脸数据包括人脸图像;

分部模块,用于将所述wifi数据划分为至少两个部分,其中,所述至少两个部分的wifi数据无交集且数据量相当,位于同一楼层的所述设备的wifi数据包括在同一个部分;

分区模块,用于以预设的多个信号强度阈值,将目标部分的wifi数据划分为多个分区,所述目标部分为任意一个部分;

匹配模块,用于通过确定各个所述分区中的wifi数据匹配的人脸数据,得到匹配数据组,任意一个所述匹配数据组中包括匹配的mac地址与人脸;

统计模块,用于统计所述目标部分中的目标匹配数据组,在所述目标部分的所述分区中出现的总次数,所述目标匹配数据组为任意一个所述匹配数据组;

打分模块,用于将第一数值与第二数值的运算结果,作为所述目标匹配数据组的分数,所述第一数值为所述目标匹配数据组在全部所述部分中出现的总次数,所述第二数值为包括所述目标匹配数据组的全部所述部分的总个数;

关联模块,用于依据各个所述匹配数据组的分数,得到与所述mac地址匹配的人脸。

10.一种数据关联设备,其特征在于,包括:存储器和处理器;

所述存储器,用于存储程序;

所述处理器,用于执行所述程序,实现如权利要求1~8中任一项所述的数据关联方法的各个步骤。

11.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~8中任一项所述的数据关联方法的各个步骤。

技术总结

本申请提供了一种数据关联方法、装置、设备及可读存储介质,获取WiFi数据和人脸数据,WiFi数据包括连接WiFi网络的设备的MAC地址,人脸数据包括人脸图像。将WiFi数据划分为至少两个部分,将目标部分的WiFi数据划分为多个分区。通过确定各个分区中的WiFi数据匹配的人脸数据,得到匹配数据组,任意一个匹配数据组中包括匹配的MAC地址与人脸。进一步,将第一数值(即目标匹配数据组在全部部分中出现的总次数)、与第二数值(即包括目标匹配数据组的全部部分的总个数)的运算结果,作为目标匹配数据组的分数。由于,第一数值与第二数值分别与目标匹配数据组中的MAC地址和人脸的匹配程度成正比,所以依据各个匹配数据组的分数,得到与MAC地址匹配的人脸。

技术研发人员:熊一鸣;杨森

受保护的技术使用者:北京爱笔科技有限公司

技术研发日:.11.07

技术公布日:.02.28

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。