推荐类型确定方法及装置与流程

本站提供的推荐类型确定方法及装置与流程,今天的小编就来为大家介绍一下 本说明书实施例涉及数据处理技术领域:,特别涉及一种类型确定方法。本说明书一个或者多个实施例同时涉及一种类型确定装置,一种计算设备,以

本站提供的推荐类型确定方法及装置与流程,今天的小编就来为大家介绍一下


本说明书实施例涉及数据处理
技术领域
,特别涉及一种类型确定方法。本说明书一个或者多个实施例同时涉及一种类型确定装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
:随着互联网金融的兴起,越来越多的非法用户利用互联网金融的可操作的多样性进行一些风险行为,而对于进行上述风险行为的用户群体的类型的不同,相适配的处罚也是不同的。基于此,需要提供一种更为有效的用户群体的类型确定方案。技术实现要素:有鉴于此,本说明书施例提供了一种类型确定方法。本说明书一个或者多个实施例同时涉及一种类型确定装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了一种类型确定方法,包括:获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合;计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例;基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例;将所述第一应用程序的所述第一分布比例和所述第二分布比例通过预设算法进行计算,得到所述第一应用程序的差异值;基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型,其中,所述预设类型映射表包括应用程序的名称以及对应的类型。根据本说明书实施例的第二方面,提供了一种类型确定装置,包括:应用程序获取装置,被配置为获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合;计算装置,被配置为计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例;分布比例确定装置,被配置为基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例;差异值获得装置,被配置为将所述第一应用程序的所述第一分布比例和所述第二分布比例通过预设算法进行计算,得到所述第一应用程序的差异值;类型确定装置,被配置为基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型,其中,所述预设类型映射表包括应用程序的名称以及对应的类型。根据本说明书实施例的第三方面,提供了一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合;计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例;基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例;将所述第一应用程序的所述第一分布比例和所述第二分布比例通过预设算法进行计算,得到所述第一应用程序的差异值;基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型,其中,所述预设类型映射表包括应用程序的名称以及对应的类型。根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述类型确定方法的步骤。本说明书一个实施例实现了一种类型确定方法及装置,其中,所述方法包括获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合;计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例;基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例;将所述第一应用程序的所述第一分布比例和所述第二分布比例通过预设算法进行计算,得到所述第一应用程序的差异值;基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型;所述类型确定方法利用获取的应用程序在不同用户群组的分布差异性,以及通过预设类型映射表中应用程序与类型的映射关系可以方便、准确的确定出第一用户群组的类型。附图说明图1是本说明书一个实施例提供的一种类型确定方法的流程图;图2是本说明书一个实施例提供的一种类型确定方法中第一应用程序在第一用户群组的第一分布比例以及在第二用户群组的第二分布比例;图3是本说明书一个实施例提供的一种类型确定方法中另一个第一应用程序在第一用户群组的第一分布比例以及在第二用户群组的第二分布比例;图4是本说明书一个实施例提供的一种类型确定装置的结构示意图;图5是本说明书一个实施例提供的一种计算设备的结构框图。具体实施方式在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。首先,对本说明书一个或多个实施例涉及的名词术语进行解释。应用程序:手机应用程序,即app。分布:概率分布的简称,是指用于表述随机变量取值的概率规律,通常用频率近似概率。交叉熵:是信息论中一个重要概念,主要用于度量两个概率分布间的差异性信息。在本说明书中,提供了一种类型确定方法。本说明书一个或者多个实施例同时涉及一种类型确定装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。参见图1,图1示出了根据本说明书一个实施例提供的一种类型确定方法的流程图,包括步骤102至步骤110。步骤102:获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合。其中,第一用户群组由多个具有相同特征的用户组成,例如第一用户群组由多个具有频繁转账、资金流转行为的用户组成;第二用户群组由多个具有相同特征的用户组成,且第二用户群组中的用户特征与第一用户群组中的用户特征不同,例如第二用户群组由从近30天内多个未命中任何风险策略的账户中随机抽取的用户组成。而第一应用程序集合中包括但不限于至少两个或三个以上的第一应用程序,第二应用程序集合中包括但不限于至少两个或三个以上的第二应用程序;例如第一应用程序集合中包括95个应用程序1,23个应用程序2,50个应用程序3;第二个应用程序集合中包括89个应用程序1,35个应用程序2。具体的,所述第一用户群组为待确定类型的用户群组,所述第二用户群组为类型确定的用户群组;相应的,所述获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合包括:获取待确定类型的用户群组的包括第一应用程序的第一应用程序集合以及类型确定的用户群组的包括第二应用程序的第二应用程序集合。实际应用中,待确定类型的用户群组可看作具有一定安全风险的用户群组,而类型确定的用户群组则可以看作通过一些风险确认策略确认不具有任何风险的、安全的用户群组。其中,第一应用程序集合由多个第一应用程序组成,而多个第一应用程序则是基于待确定类型的用户群组中每个用户的授权,从每个用户的客户端获取得到,例如待确定类型的用户群组中每个用户会将其客户端安装的应用程序上报至安全日志系统,而此时获取待确定类型的用户群组的第一应用程序集合,则是从安全日志系统中抽取最近一次上报的待确定类型的用户群组中每个用户上报的在其客户端安装的应用程序的集合;例如游戏类型的应用程序、金融类型的应用程序、购物类型的应用程序等。第二应用程序集合也是由多个第二应用程序组成,而多个第二应用程序则是基于类型确定的用户群组中每个用户的授权,从每个用户的客户端获取得到,例如类型确定的用户群组中每个用户会将其客户端安装的应用程序上报至安全日志系统,而此时获取类型确定的用户群组的第二应用程序集合,则是从安全日志系统中抽取最近一次上报的类型确定的用户群组中每个用户上报的在其客户端安装的应用程序的集合;例如游戏类型的应用程序、金融类型的应用程序、购物类型的应用程序等。具体实施时,获取第一用户群组的包括第一应用程序的第一应用程序集合时,也会同时获取第一应用程序集合中每个第一应用程序的名称;且第二用户群组的包括第二应用程序的第二应用程序集合时,也会同时获取第二应用程序集合中每个第二应用程序的名称。具体的,第一应用程序集合中的第一应用程序与第二应用程序集合中的第二应用程序会存在重叠现象,即第一应用程序可以与第二应用程序相同,由于每个应用程序具有一个唯一的名称,具体的第一应用程序是否与第二应用程序相同,则可以根据应用程序的名称确定。步骤104:计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例。具体的,所述第一分布比例和所述第二分布比例均包括安装比例和未安装比例;相应的,所述计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例包括:计算所述第一应用程序在所述第一用户群组的第一安装比例、未安装比例,以及所述第二应用程序在所述第二用户群组的第二安装比例、未安装比例。实际应用中,计算所述第一应用程序在所述第一用户群组的第一安装比例、未安装比例,以及所述第二应用程序在所述第二用户群组的第二安装比例、未安装比例,则可以理解为,计算第一应用程序集合中每个第一应用程序在所述第一用户群组的第一安装比例、未安装比例,以及计算第二应用程序集合中每个第二应用程序在所述第二用户群组的第二安装比例、未安装比例。举例说明,第一用户群组a中包括用户a1、用户a2…用户a100等100个用户,第二用户群组b中包括用户b1、用户b2…用户b100等100个用户,第一应用程序集合中包括95个应用程序1,23个应用程序2,50个应用程序3,第二个应用程序集合中包括89个应用程序1,35个应用程序2,78个应用程序4;此时,计算得到的第一应用程序集合中每个第一应用程序在第一用户群组的第一安装比例则为:应用程序1在第一用户群组a的第一安装比例为95%,应用程序1在第一用户群组a的第一未安装比例为5%;应用程序2在第一用户群组a的第一安装比例为23%,应用程序2在第一用户群组a的第一未安装比例为77%;应用程序3在第一用户群组a的第一安装比例为50%,应用程序3在第一用户群组a的第一未安装比例50%;计算得到的所述第二应用程序集合中每个第二应用程序在所述第二用户群组的第二安装比例、未安装比例则为:应用程序1在第二用户群组b的第二安装比例为89%,应用程序1在第二用户群组b的第二未安装比例为11%;应用程序2在第二用户群组b的第二安装比例为35%,应用程序2在第二用户群组b的第二未安装比例为65%,应用程序4在第二用户群组b的第二安装比例为78%,应用程序2在第二用户群组b的第二未安装比例为22%。步骤106:基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例。具体的,所述基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例之前,还包括:获取所述第一应用程序的名称以及所述第二应用程序的名称;将所述第一应用程序的名称与所述第二应用程序的名称进行比较,以确定所述第一应用程序与所述第二应用程序的关联关系,其中,所述关联关系包括所述第一应用程序与所述第二应用程序相同、所述第一应用程序与所述第二应用程序不同。以上述为例,在获取第一用户群组的包括第一应用程序的第一应用集合时就可以获取每个第一应用程序的名称,以及获取第二用户群组的包括第二应用程序的第二应用程序集合时就可以获取每个第二应用程序的名称;由于每个应用程序的名称是唯一的,因此可以基于第一应用程序的名称以及第二应用程序的名称确定第一应用程序与第二应用程序是相同的还是不同的。例如第一应用程序为3个,分别为应用程序1、应用程序2以及应用程序3;第二应用程序为3个,分别为应用程序1、应用程序2以及应用程序4,此时,则可以确定第一应用程序的应用程序1与第二应用程序的应用程序1为同一个应用程序,第一应用程序的应用程序2与第二应用程序的应用程序2为同一个应用程序,第一应用程序的应用程序3以及第二应用程序的应用程序4分别为不相同的应用程序。而具体实施时,所述基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例包括:在所述第一应用程序与所述第二应用程序相同的情况下,将所述第二应用程序在所述第二用户群组的第二分布比例作为对应的所述第一应用程序在所述第二用户群组的第二分布比例;在所述第一应用程序与所述第二应用程序不同的情况下,将所述第一应用程序在所述第二用户群组的第二分布比例设置为零。具体的,若第一应用程序与第二应用程序为相同的应用程序,则第二应用程序在第二用户群组的第二分布比例可以作为对应的第一应用程序在第二用户群组的第二分布比例,即将第二应用程序在第二用户群组的第二安装比例、未安装比例作为对应的第一应用程序在第二用户群组的第二安装比例、未安装比例;若第一应用程序在第二应用程序集合中没有相同的第二应用程序,即与第二应用程序均不相同的情况下,则将第一应用程序在第二用户群组的第二分布比例设置为零,即将第一应用程序在第二用户群组的第二安装比例、未安装比例均设置为零。以上述第一应用程序集合中包括95个应用程序1,23个应用程序2,50个应用程序3,第二个应用程序集合中包括89个应用程序1,35个应用程序2,78个应用程序4为例。由于第一应用程序的应用程序1与第二应用程序的应用程序1相同,则可以认为第一应用程序:应用程序1在第一用户群组a的第一安装比例为95%,应用程序1在第一用户群组a的第一未安装比例为5%;而第一应用程序:应用程序1在第二用户群组b的第二安装比例为89%,应用程序1在第二用户群组b的第二未安装比例为11%;由于第一应用程序的应用程序2与第二应用程序的应用程序2相同,则可以认为第一应用程序:应用程序2在第一用户群组a的第一安装比例为23%,应用程序2在第一用户群组a的第一未安装比例为77%;而第一应用程序:应用程序2在第二用户群组b的第二安装比例为35%,应用程序2在第二用户群组b的第二未安装比例为65%;此外,第一应用程序的应用程序3由于不存在与第二应用程序集合中相同的第二应用程序,则可以认为:应用程序3在第一用户群组a的第一安装比例为50%,应用程序3在第一用户群组a的第一未安装比例50%;而应用程序3在第二用户群组b的第二安装比例为0,应用程序3在第二用户群组b的第二未安装比例0;例如第一用户群组a安装了游戏应用程序,第二用户群组b没有安装该游戏应用程序,这种情况下枚举的只有1/0,采用下述的预设算法公式也可以计算出该游戏应用程序的差异值,相当于该差异值无穷大,该游戏应用程序最特异。步骤108:将所述第一应用程序的所述第一分布比例和所述第二分布比例通过预设算法进行计算,得到所述第一应用程序的差异值。具体的,在确定了每个第一应用程序在第一用户群组以及第二用户群组中的分布比例之后,就可以基于每个第一应用程序在第一用户群组的第一分布比例,以及每个第一应用程序在第二用户群组的第二分布比例计算出每个第一应用程序的差异值。具体实施时,预设算法如下:其中,h(p,q)表示差异值,i表示离散型分布的分段,p(i)和q(i)分别为第i段上的分布概率值,实际应用中,i表示安装或未安装,p(i)可以理解为第一应用程序在第一用户群组的第一分布比例,q(i)可以理解为第一应用程序在第二用户群组的第二分布比例。参见图2、图3,图2和图3分别示出了两个第一应用程序分别在第一用户群组的第一分布比例以及在第二用户群组的第二分布比例。图2中,第一应用程序:应用程序1在第一用户群组中的安装比例为95%,未安装比例为5%,应用程序1在第二用户群组中的安装比例未89%,未安装比例为11%。图3中,第一应用程序:应用程序2在第一用户群组中的安装比例为99%,未安装比例为1%,应用程序2在第二用户群组中的安装比例未17%,未安装比例为83%。基于图2中应用程序1在第一用户群组以及第二用户群组的分布比例,通过上述预设算法可以得到应用程序1的差异值h,具体计算过程如下:i=安装,h1=0.95*log10(1/0.89)=0.048079494,i=未安装,h2=0.05*log10(1/0.11)=0.047930366,h=h1+h2=0.096。具体实施时,将每个第一应用程序的第一分布比例和第二分布比例均参照上述计算过程进行计算,得到每个第一应用程序的差异值,即交叉熵。步骤110:基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型。其中,所述预设类型映射表包括应用程序的名称以及对应的类型。参见表1,表1为预设类型映射表,包括预设的应用程序的名称以及对应的类型。表1应用程序类型应用程序a类型1应用程序b类型2应用程序c类型2……应用程序n类型n实际应用中,由于该类型确定方法可以应用于对风险人群的类型确定中,那么该预设类型映射表中的应用程序对应的类型则可以为具体的风险类型,例如虚拟币类型、跑分洗钱类型等。具体的,所述得到所述第一应用程序的差异值之后,还包括:按照降序排列所述第一应用程序的差异值,并确定差异值大于等于预设差异阈值的第一应用程序。通过此种方式将第一用户群组与第二用户群组应用程序安装的差异抽象为分布差异度量问题,提取出特异性的应用程序,以方便后续可以基于该特异性的应用程序对第一用户群组进行更为准确的类型确定。其中,预设差异阈值可以根据实际需求进行设置,例如设置为0.3。例如第一应用程序包括应用程序a、应用程序b以及应用程序c,计算得到的应用程序a的交叉熵为0.763,应用程序b的交叉熵为0.865,应用程序c的交叉熵为0.901;此时,按照交叉熵的值对应用程序a、应用程序b以及应用程序c进行降序排列,并保留交叉熵的值大于等于0.3的第一应用程序,此时交叉熵的值大于等于0.3的第一应用程序:应用程序a、应用程序b以及应用程序c即为特异应用程序。具体实施时,所述基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型包括:基于预设类型映射表确定所述差异值大于等于预设差异阈值的第一应用程序对应的类型;将相同类型的第一应用程序的差异值进行相加,且以差异值总和最大的第一应用程序对应的类型作为第一用户群组的类型。具体的,首先基于第一应用程序的名称通过预设类型映射表查找出每个第一应用程序对应的类型,以上述为例,即应用程序a对应类型1、应用程序b对应类型2、应用程序c对应类型2。然后将类型相同的应用程序b和应用程序c的交叉熵相加,得到类型2对应的交叉熵总和为0.865+0.901=1.766,而应用程序a由于没有类型相同的其他第一应用程序,因此应用程序a对应的类型1的交叉熵的总和为0.763,因此可以确定类型2对应的交叉熵总和最大,那么则以类型2作为第一用户群组的类型。实际应用中,对于常规的应用程序,在风险人群和随机人群中分布差异较小,而对于风险的应用程序,随机人群安装该应用程序的比例较小,就会使得存在风险的应用程序在风险人群和随机人群中分布差异较大,因此本说明书实施例提供的所述类型确定方法利用风险人群以及正常人群客户端安装的应用程序对风险人群的类型进行定性,利用风险人群与正常人群安装的应用程序的分布差异性,锁定其特异的应用程序,再基于预设类型映射表中应用程序与类型的关联关系可以准确、方便的确定风险人群的风险类型;并且用户的应用程序安装信息不易隐藏篡改,更有利于风险人群的风险类型的识别。与上述方法实施例相对应,本说明书还提供了类型确定装置实施例,图4示出了本说明书一个实施例提供的一种类型确定装置的结构示意图。如图4所示,该装置包括:应用程序获取装置402,被配置为获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合;计算装置404,被配置为计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例;分布比例确定装置406,被配置为基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例;差异值获得装置408,被配置为将所述第一应用程序的所述第一分布比例和所述第二分布比例通过预设算法进行计算,得到所述第一应用程序的差异值;类型确定装置410,被配置为基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型,其中,所述预设类型映射表包括应用程序的名称以及对应的类型。可选的,所述装置,还包括:名称获取装置,被配置为获取所述第一应用程序的名称以及所述第二应用程序的名称;关系确定装置,被配置为将所述第一应用程序的名称与所述第二应用程序的名称进行比较,以确定所述第一应用程序与所述第二应用程序的关联关系,其中,所述关联关系包括所述第一应用程序与所述第二应用程序相同、所述第一应用程序与所述第二应用程序不同。可选的,所述分布比例确定装置406,进一步被配置为:在所述第一应用程序与所述第二应用程序相同的情况下,将所述第二应用程序在所述第二用户群组的第二分布比例作为对应的所述第一应用程序在所述第二用户群组的第二分布比例;在所述第一应用程序与所述第二应用程序不同的情况下,将所述第一应用程序在所述第二用户群组的第二分布比例设置为零。可选的,所述第一分布比例和所述第二分布比例均包括安装比例和未安装比例;相应的,所述计算装置404,进一步被配置为:计算所述第一应用程序在所述第一用户群组的第一安装比例、未安装比例,以及所述第二应用程序在所述第二用户群组的第二安装比例、未安装比例。可选的,所述分布比例确定装置406,进一步被配置为:将所述第二应用程序在所述第二用户群组的第二安装比例、未安装比例作为对应的所述第一应用程序在所述第二用户群组的第二安装比例、未安装比例。可选的,所述分布比例确定装置406,进一步被配置为:将所述第一应用程序在所述第二用户群组的第二安装比例、未安装比例均设置为零。可选的,所述预设算法如下:其中,i表示离散型分布的分段,p(i)和q(i)分别为第i段上的分布概率值。可选的,所述装置,还包括:特异应用程序确定模块,被配置为按照降序排列所述第一应用程序的差异值,并确定差异值大于等于预设差异阈值的第一应用程序。可选的,所述类型确定装置410,进一步被配置为:基于预设类型映射表确定所述差异值大于等于预设差异阈值的第一应用程序对应的类型;将相同类型的第一应用程序的差异值进行相加,且以差异值总和最大的第一应用程序对应的类型作为第一用户群组的类型。可选的,所述第一用户群组为待确定类型的用户群组,所述第二用户群组为类型确定的用户群组;相应的,所述应用程序获取装置402,进一步被配置为:获取待确定类型的用户群组的包括第一应用程序的第一应用程序集合以及类型确定的用户群组的包含第二应用程序的第二应用程序集合。上述为本实施例的一种类型确定装置的示意性方案。需要说明的是,该类型确定装置的技术方案与上述的类型确定方法的技术方案属于同一构思,类型确定装置的技术方案未详细描述的细节内容,均可以参见上述类型确定方法的技术方案的描述。图5示出了根据本说明书一个实施例提供的一种计算设备500的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接,数据库550用于保存数据。计算设备500还包括接入设备540,接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(pstn)、局域网(lan)、广域网(wan)、个域网(pan)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic))中的一个或多个,诸如ieee802.11无线局域网(wlan)无线接口、全球微波互联接入(wi-max)接口、以太网接口、通用串行总线(usb)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc)接口,等等。在本说明书的一个实施例中,计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图5所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。计算设备500可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或pc的静止计算设备。计算设备500还可以是移动式或静止式的服务器。其中,处理器520用于执行如下计算机可执行指令:获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合;计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例;基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例;将所述第一应用程序的所述第一分布比例和所述第二分布比例通过预设算法进行计算,得到所述第一应用程序的差异值;基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型,其中,所述预设类型映射表包括应用程序的名称以及对应的类型。上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的类型确定方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述类型确定方法的技术方案的描述。本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述类型确定方法的步骤。上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的类型确定方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述类型确定方法的技术方案的描述。上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属
技术领域
技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。当前第1页1 2 3 
技术特征:

1.一种类型确定方法,包括:

获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合;

计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例;

基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例;

将所述第一应用程序的所述第一分布比例和所述第二分布比例通过预设算法进行计算,得到所述第一应用程序的差异值;

基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型,其中,所述预设类型映射表包括应用程序的名称以及对应的类型。

2.根据权利要求1所述的类型确定方法,所述基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例之前,还包括:

获取所述第一应用程序的名称以及所述第二应用程序的名称;

将所述第一应用程序的名称与所述第二应用程序的名称进行比较,以确定所述第一应用程序与所述第二应用程序的关联关系,其中,所述关联关系包括所述第一应用程序与所述第二应用程序相同、所述第一应用程序与所述第二应用程序不同。

3.根据权利要求2所述的类型确定方法,所述基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例包括:

在所述第一应用程序与所述第二应用程序相同的情况下,将所述第二应用程序在所述第二用户群组的第二分布比例作为对应的所述第一应用程序在所述第二用户群组的第二分布比例;

在所述第一应用程序与所述第二应用程序不同的情况下,将所述第一应用程序在所述第二用户群组的第二分布比例设置为零。

4.根据权利要求1或3所述的类型确定方法,所述第一分布比例和所述第二分布比例均包括安装比例和未安装比例;

相应的,所述计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例包括:

计算所述第一应用程序在所述第一用户群组的第一安装比例、未安装比例,以及所述第二应用程序在所述第二用户群组的第二安装比例、未安装比例。

5.根据权利要求4所述的类型确定方法,所述将所述第二应用程序在所述第二用户群组的第二分布比例作为对应的所述第一应用程序在所述第二用户群组的第二分布比例包括:

将所述第二应用程序在所述第二用户群组的第二安装比例、未安装比例作为对应的所述第一应用程序在所述第二用户群组的第二安装比例、未安装比例。

6.根据权利要求5所述的类型确定方法,所述将所述第一应用程序在所述第二用户群组的第二分布比例设置为零包括:

将所述第一应用程序在所述第二用户群组的第二安装比例、未安装比例均设置为零。

7.根据权利要求1所述的类型确定方法,所述预设算法如下:

其中,i表示离散型分布的分段,p(i)和q(i)分别为第i段上的分布概率值。

8.根据权利要求1所述的类型确定方法,所述得到所述第一应用程序的差异值之后,还包括:

按照降序排列所述第一应用程序的差异值,并确定差异值大于等于预设差异阈值的第一应用程序。

9.根据权利要求8所述的类型确定方法,所述基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型包括:

基于预设类型映射表确定所述差异值大于等于预设差异阈值的第一应用程序对应的类型;

将相同类型的第一应用程序的差异值进行相加,且以差异值总和最大的第一应用程序对应的类型作为第一用户群组的类型。

10.根据权利要求1所述的类型确定方法,所述第一用户群组为待确定类型的用户群组,所述第二用户群组为类型确定的用户群组;

相应的,所述获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包含第二应用程序的第二应用程序集合包括:

获取待确定类型的用户群组的包括第一应用程序的第一应用程序集合以及类型确定的用户群组的包含第二应用程序的第二应用程序集合。

11.一种类型确定装置,包括:

应用程序获取装置,被配置为获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合;

计算装置,被配置为计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例;

分布比例确定装置,被配置为基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例;

差异值获得装置,被配置为将所述第一应用程序的所述第一分布比例和所述第二分布比例通过预设算法进行计算,得到所述第一应用程序的差异值;

类型确定装置,被配置为基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型,其中,所述预设类型映射表包括应用程序的名称以及对应的类型。

12.根据权利要求11所述的类型确定装置,还包括:

名称获取装置,被配置为获取所述第一应用程序的名称以及所述第二应用程序的名称;

关系确定装置,被配置为将所述第一应用程序的名称与所述第二应用程序的名称进行比较,以确定所述第一应用程序与所述第二应用程序的关联关系,其中,所述关联关系包括所述第一应用程序与所述第二应用程序相同、所述第一应用程序与所述第二应用程序不同。

13.根据权利要求12所述的类型确定装置,所述分布比例确定装置,进一步被配置为:

在所述第一应用程序与所述第二应用程序相同的情况下,将所述第二应用程序在所述第二用户群组的第二分布比例作为对应的所述第一应用程序在所述第二用户群组的第二分布比例;

在所述第一应用程序与所述第二应用程序不同的情况下,将所述第一应用程序在所述第二用户群组的第二分布比例设置为零。

14.一种计算设备,包括:

存储器和处理器;

所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:

获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合;

计算所述第一应用程序在所述第一用户群组的第一分布比例以及所述第二应用程序在所述第二用户群组的第二分布比例;

基于所述第二应用程序在所述第二用户群组的第二分布比例、以及所述第一应用程序与所述第二应用程序的关联关系,确定所述第一应用程序在所述第二用户群组的第二分布比例;

将所述第一应用程序的所述第一分布比例和所述第二分布比例通过预设算法进行计算,得到所述第一应用程序的差异值;

基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型,其中,所述预设类型映射表包括应用程序的名称以及对应的类型。

15.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求1至10任意一项所述类型确定方法的步骤。

技术总结
本说明书实施例提供了类型确定方法及装置,所述方法包括获取第一用户群组的包括第一应用程序的第一应用程序集合以及第二用户群组的包括第二应用程序的第二应用程序集合;确定所述第一应用程序在所述第一用户群组的第一分布比例以及所述第一应用程序在所述第二用户群组的第二分布比例;将所述第一应用程序的所述第一分布比例和所述第二分布比例通过预设算法进行计算,得到所述第一应用程序的差异值;基于所述第一应用程序的差异值以及预设类型映射表确定所述第一用户群组的类型;利用获取的应用程序在不同用户群组的分布差异性,以及通预设类型映射表中应用程序与类型的映射关系可以方便、准确的确定出第一用户群组的类型。

技术研发人员:付子圣;巩金慧
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:2020.02.20
技术公布日:2020.06.26

推荐类型确定方法及装置与流程的相关内容如下:

标题:推荐类型确定方法及装置与流程|http://www.wc10086.cn/327029.html

本文来自网络,不代表本站立场,转载请注明出处!