回归模型的构建方法及装置、程序产品、存储介质与流程

专利2025-05-01  21


本技术实施例涉及计算机领域,具体而言,涉及一种回归模型的构建方法及装置、程序产品、存储介质。


背景技术:

1、随着机器学习时代的到来,各个行业在这一时代背景下均呈现出飞速发展状态。

2、现如今在各种服务行业中,用户的行为逐渐通过数据来反映,这类数据是商家十分关注的。操作人员在构建用户特征的时候,希望能够同时满足“可以调整特征的概率密度的形状、曲率”、“特征消极与积极的用户的相对占比能够随场景变动”这两大需求,但是相关技术中的传统逻辑回归面对y=0(用户未发生恶性行为)和y=1(用户发生恶性行为)的样本点都保持相同的注意力,导致逻辑回归面对极度不均衡的数据时,容易忽略y=1的样本点,从而出现低估事件发生(y=1)的概率,无法构建出精准的回归模型。


技术实现思路

1、本技术实施例提供了一种回归模型的构建方法及装置,以至少解决相关技术中无法构建出精准的回归模型的问题。

2、根据本技术的一个实施例,提供了一种回归模型的构建方法,包括:基于n个对象的n个第一目标特征确定第一尺度参数和第一中性参数,其中,每一个上述第一目标特征均是基于m个目标参数的加权值确定的特征,上述目标参数中包括对象的对象信息,上述第一尺度参数用于调整对象的第一目标特征的概率密度的形状和曲率,上述第一中性参数用于调整上述第一目标特征为异常特征的占比,上述n和m均是正整数;基于上述第一尺度参数和上述第一中性参数调整第一分布函数,得到目标分布函数,其中,上述第一分布函数用于拟合以非对称的形式分布的对象,上述第一分布函数是互补双对数极值分布函数;计算第二分布函数与第三分布函数之间的第一kl散度,以及上述第二分布函数与上述目标分布函数之间的第二kl散度,其中,上述第二分布函数用于表示n个上述对象的分布情况,上述第三分布函数用于表示n个上述对象发生预设异常行为的概率分布,上述第一kl散度用于表示上述第二分布函数和上述第三分布函数之间的差异程度,上述第二kl散度用于表示上述第二分布函数和上述目标分布函数之间的差异程度;基于上述第一kl散度和上述第二kl散度之间的比较结果,构建目标回归模型,其中,上述目标回归模型用于输出目标对象发生上述预设异常行为的概率。

3、在一个示例性实施例中,基于n个对象的n个第一目标特征确定第一尺度参数和第一中性参数,包括:计算第一对象的第一占比,其中,上述第一对象是n个上述对象中特征值小于或者等于0的对象中的任一对象;确定上述第一占比与第四分布函数之间的关系,其中,上述第四分布函数为,上述用于表示上述第一对象的中性参数,上述;按照上述第一占比和上述第四分布函数之间的关系确定上述第一中性参数;利用上述第一中性参数确定上述第一尺度参数。

4、在一个示例性实施例中,利用上述第一中性参数确定上述第一尺度参数,包括:计算第二对象的第二占比,其中,上述第二对象是n个上述对象中特征值等于0的对象;确定第五分布函数与上述第二占比之间的关系,其中,上述第五分布函数为,上述用于表示上述第一尺度参数,上述用于表示上述第二占比;基于上述第五分布函数与上述第二占比之间的关系、以及上述第一中性参数确定上述第一尺度参数,其中,上述第一尺度参数为。

5、在一个示例性实施例中,计算第二分布函数与第三分布函数之间的第一kl散度,以及上述第二分布函数与上述目标分布函数之间的第二kl散度之前,上述方法还包括:构建第一对数似然函数;对上述第一对数似然函数进行最大似然操作,以计算得到上述对象的目标参数的权重向量;基于上述对象的目标参数的权重向量构建上述第三分布函数。

6、在一个示例性实施例中,计算第二分布函数与第三分布函数之间的第一kl散度,以及上述第二分布函数与上述目标分布函数之间的第二kl散度,包括:利用n个上述对象的目标参数的权重向量确定第二目标特征;利用上述第二目标特征确定上述第二分布函数;计算上述第二分布函数与上述第三分布函数之间的第一kl散度,以及上述第二分布函数与上述目标分布函数之间的第二kl散度。

7、在一个示例性实施例中,计算上述第二分布函数与上述第三分布函数之间的第一kl散度,以及上述第二分布函数与上述目标分布函数之间的第二kl散度,包括:通过第一公式计算上述第二分布函数与上述第三分布函数之间的第一kl散度,其中,上述第一公式为,上述用于表示上述第二分布函数,上述用于表示上述第三分布函数;通过第二公式计算上述第二分布函数与上述目标分布函数之间的第二kl散度,其中,上述第二公式为,上述用于表示上述目标分布函数。

8、在一个示例性实施例中,基于上述第一kl散度和上述第二kl散度之间的比较结果,构建目标回归模型,包括:比较上述第一kl散度和上述第二kl散度;在上述第一kl散度小于或等于上述第二kl散度的情况下,基于上述第三分布函数构建上述目标回归模型;或者,在上述第一kl散度大于上述第二kl散度的情况下,基于上述目标分布函数构建上述目标回归模型。

9、在一个示例性实施例中,在上述第一kl散度大于上述第二kl散度的情况下,基于上述目标分布函数构建目标回归模型,包括:计算第六分布函数与第七分布函数之间的第三kl散度,其中,上述第六分布函数用于表示n个上述对象发生预设异常行为的概率分布,上述第七分布函数用于表示n个上述对象的分布情况;计算上述第七分布函数与第八分布函数之间的第四kl散度,其中,上述第八分布函数用于拟合以非对称的形式分布的对象;基于上述第三kl散度和上述第四kl散度之间的比较结果,构建上述目标回归模型。

10、在一个示例性实施例中,计算第六分布函数与第七分布函数之间的第三kl散度,包括:构造第三公式的第二对数似然函数,其中,上述第三公式为,上述用于表示上述第一中性参数,上述用于表示上述第一尺度参数;对上述第二对数似然函数进行最大似然操作,得到,其中,上述用于表示上述对象的目标参数的权重向量;基于上述第三公式和上述,构建第七分布函数。

11、在一个示例性实施例中,计算上述第七分布函数与第八分布函数之间的第四kl散度之前,上述方法还包括:基于上述确定第三目标特征;利用上述第三目标特征计算第三对象的第三占比,其中,第四公式为,上述用于表示第i个对象的特征;确定第四分布函数与上述第三占比之间的关系;利用上述第四分布函数与上述第三占比之间的关系确定第二中性参数;利用上述第二中性参数计算得到第二尺度参数;基于上述第二中性参数和上述第二尺度参数构建上述第八分布函数。

12、在一个示例性实施例中,基于上述第三kl散度和上述第四kl散度之间的比较结果,构建目标回归模型,包括:比较上述第三kl散度和上述第四kl散度;在上述第三kl散度小于或等于上述第四kl散度的情况下,基于上述和上述构建上述目标回归模型;或者,在上述第三kl散度大于上述第四kl散度的情况下,重新计算上述第三kl散度和上述第四kl散度,重新构建上述目标回归模型,其中,重新构建的上述目标回归模型对应于上述第六分布函数。

13、在一个示例性实施例中,在上述第三kl散度大于上述第四kl散度的情况下,重新构建上述目标回归模型,重新计算上述第三kl散度和上述第四kl散度,包括:迭代计算上述第三kl散度和上述第四kl散度,重新构建上述目标回归模型;其中,迭代计算上述第三kl散度和上述第四kl散度,包括:在第i轮迭代中,基于上述和上述重新确定上述第三kl散度和上述第四kl散度,其中,上述第i轮迭代中的上述对应第i-1轮迭代中的,上述第i轮迭代中的上述对应上述第i-1轮迭代中的,上述是上述第i-1轮迭代中得到的中性参数,上述是上述第i-1轮迭代中得到的尺度参数。

14、在一个示例性实施例中,基于第一kl散度和上述第二kl散度之间的比较结果,构建目标回归模型之后,还包括:获取目标对象的对象信息;基于上述目标对象的对象信息,利用上述目标回归模型确定第一概率,其中,上述第一概率是上述目标对象发生上述预设异常行为的概率;基于上述第一概率确定管理策略,其中,上述管理策略包括激进、保守、稳健三类管理策略。

15、根据本技术的另一个实施例,提供了一种回归模型的构建装置,包括:第一确定模块,用于基于n个对象的n个第一目标特征确定第一尺度参数和第一中性参数,其中,每一个上述第一目标特征均是基于m个目标参数的加权值确定的特征,上述目标参数中包括上述对象的对象信息,上述第一尺度参数用于调整上述对象的第一目标特征的概率密度的形状和曲率,上述第一中性参数用于调整上述第一目标特征为异常特征的占比,上述n和m均是正整数;第一调整模块,用于基于上述第一尺度参数和上述第一中性参数调整第一分布函数,得到目标分布函数,其中,上述第一分布函数用于拟合以非对称的形式分布的对象,上述第一分布函数是互补双对数极值分布函数;第一计算模块,用于计算第二分布函数与第三分布函数之间的第一kl散度,以及上述第二分布函数与上述目标分布函数之间的第二kl散度,其中,上述第二分布函数用于表示n个上述对象的分布情况,上述第三分布函数用于表示n个上述对象发生预设异常行为的概率分布,上述第一kl散度用于表示上述第二分布函数和上述第三分布函数之间的差异程度,上述第二kl散度用于表示上述第二分布函数和上述目标分布函数之间的差异程度;第一构建模块,用于基于上述第一kl散度和上述第二kl散度之间的比较结果,构建目标回归模型,其中,上述目标回归模型用于输出目标对象发生上述预设异常行为的概率。

16、根据本技术的又一个实施例,还提供了一种计算机程序产品,包括计算机程序,上述计算机程序被处理器执行时实现上述任一项方法实施例中的步骤。

17、根据本技术的又一个实施例,还提供了一种计算机可读存储介质,上述计算机可读存储介质中存储有计算机程序,其中,上述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

18、根据本技术的又一个实施例,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为运行上述计算机程序以执行上述任一项方法实施例中的步骤。

19、通过本技术,基于对象的目标特征小于或等于0的占比和的关系计算得到第一中性参数,并根据第一中性参数计算得到第一尺度参数,之后基于第一尺度参数和第一中性参数调整用于拟合以非对称的形式分布的对象的第一分布函数,得到目标分布函数,通过计算用于表示n个对象的分布情况的第二分布函数与用于表示n个对象发生预设异常行为的概率分布的第三分布函数之间的第一kl散度,计算第二分布函数和目标分布函数之间的第二kl散度,最后基于第一kl散度和第二kl散度之间的比较结果,构建目标回归模型。因此,通过引入第一尺度参数和第一中性参数使得可以及时调整目标分布函数,进而解决相关技术中无法构建出精准的回归模型的问题,达到构造的回归模型更加精准的效果。


技术特征:

1.一种回归模型的构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,基于n个对象的n个第一目标特征确定第一尺度参数和第一中性参数,包括:

3.根据权利要求2所述的方法,其特征在于,利用所述第一中性参数确定所述第一尺度参数,包括:

4.根据权利要求1所述的方法,其特征在于,计算第二分布函数与第三分布函数之间的第一kl散度,以及所述第二分布函数与所述目标分布函数之间的第二kl散度之前,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,计算第二分布函数与第三分布函数之间的第一kl散度,以及所述第二分布函数与所述目标分布函数之间的第二kl散度,包括:

6.根据权利要求5所述的方法,其特征在于,计算所述第二分布函数与所述第三分布函数之间的第一kl散度,以及所述第二分布函数与所述目标分布函数之间的第二kl散度,包括:

7.根据权利要求1所述的方法,其特征在于,基于所述第一kl散度和所述第二kl散度之间的比较结果,构建目标回归模型,包括:

8.根据权利要求7所述的方法,其特征在于,在所述第一kl散度大于所述第二kl散度的情况下,基于所述目标分布函数构建目标回归模型,包括:

9.根据权利要求8所述的方法,其特征在于,计算第六分布函数与第七分布函数之间的第三kl散度,包括:

10.根据权利要求8所述的方法,其特征在于,计算所述第七分布函数与第八分布函数之间的第四kl散度之前,所述方法还包括:

11.根据权利要求8所述的方法,其特征在于,基于所述第三kl散度和所述第四kl散度之间的比较结果,构建目标回归模型,包括:

12.根据权利要求11所述的方法,其特征在于,在所述第三kl散度大于所述第四kl散度的情况下,重新构建所述目标回归模型,重新计算所述第三kl散度和所述第四kl散度,包括:

13.根据权利要求7所述的方法,其特征在于,基于所述第一kl散度和所述第二kl散度之间的比较结果,构建目标回归模型之后,所述方法还包括:

14.一种回归模型的构建装置,其特征在于,包括:

15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13任一项中所述的方法的步骤。

16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至13任一项中所述的方法的步骤。

17.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至13任一项中所述的方法的步骤。


技术总结
本申请实施例提供了一种回归模型的构建方法及装置、程序产品、存储介质,其中,该方法包括:基于N个对象的N个第一目标特征确定第一尺度参数和第一中性参数;基于第一尺度参数和第一中性参数调整第一分布函数,得到目标分布函数;计算第二分布函数与第三分布函数之间的第一KL散度,以及第二分布函数与目标分布函数之间的第二KL散度,其中,第二分布函数用于表示N个对象的分布情况,第三分布函数用于表示N个对象发生预设异常行为的概率分布;基于第一KL散度和第二KL散度之间的比较结果,构建目标回归模型。通过本申请,解决了相关技术中无法构建出精准的回归模型的问题,进而达到了构造的回归模型更加精准的效果。

技术研发人员:付荣辉,程建伟,石爱华,钱富,王子轩,秦川,郑子浩,薄士宁
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-24029.html