本技术涉及计算机,特别是涉及一种活动标签生成方法和设备。
背景技术:
1、活动标签主要用于反映用户的兴趣和/或活动参与度,被广泛应用于个性化推荐、广告定位和活动效果评估等领域,从而提升用户体验。
2、传统的活动标签生成方法主要基于简单规则或统计方法实现,比如设置固定的阈值和条件来生成活动标签,或通过统计用户行为发生的频次来生成活动标签等。
3、然而,上述基于简单规则或统计方法的活动标签生成方法,缺乏灵活性且难以捕捉复杂的行为模式,以致活动标签的精准度较低,难以准确反映用户真实的兴趣和/或活动参与度。
技术实现思路
1、鉴于上述问题,本技术实施例提供了一种活动标签生成方法和设备,以便克服上述问题或者至少部分地解决上述问题。
2、本技术实施例的第一方面,提供了一种活动标签生成方法,所述方法包括:
3、收集目标用户的行为数据,所述行为数据包括:用户行为相关的时序数据;
4、通过自然语言处理技术,对所述行为数据进行语义分析,得到所述行为数据所对应的语义分析结果;
5、通过预先训练好的机器学习模型,对所述行为数据进行行为模式识别,得到所述行为数据所对应的模式识别结果;
6、根据所述语义分析结果和所述模式识别结果,生成所述目标用户的活动标签,所述活动标签用于表征用户的兴趣和/或活动参与度。
7、作为一种可能的实施方式,所述通过自然语言处理技术,对所述行为数据进行语义分析,得到所述行为数据所对应的语义分析结果,包括:
8、在所述行为数据包括用户反馈行为相关的时序数据的情况下,通过自然语言处理技术,对所述用户反馈行为相关的时序数据进行第一语义分析,得到第一语义分析结果,所述第一语义分析包括:情感分析、反馈意图分析和主题分布分析中至少之一;
9、在所述行为数据包括用户搜索行为相关的时序数据的情况下,通过自然语言处理技术,对所述用户搜索行为相关的时序数据进行第二语义分析,得到第二语义分析结果,所述第二语义分析包括:搜索意图分析和主题分布分析中至少之一。
10、作为一种可能的实施方式,所述根据所述语义分析结果和所述模式识别结果,生成所述目标用户的活动标签,包括:
11、在所述语义分析结果包括情感分析结果的情况下,将所述情感分析结果中正面情感所针对的反馈对象,确定为所述目标用户的感兴趣对象;
12、根据所述目标用户的感兴趣对象、所述语义分析结果中的其它分析结果、以及所述模式识别结果,生成所述活动标签;
13、所述方法还包括:
14、根据所述情感分析结果中负面情感所关联的反馈信息,生成用于辅助改进产品的第一标签。
15、作为一种可能的实施方式,所述通过预先训练好的机器学习模型,对所述行为数据进行行为模式识别,得到所述行为数据所对应的模式识别结果,包括:
16、通过预先训练好的深度学习模型,对所述行为数据提取时序特征向量;
17、通过预先训练好的词向量模型,对所述行为数据提取文本特征向量;
18、将所述行为数据、所述时序特征向量和所述文本特征向量作为输入数据集,通过预先训练好的多个模式识别模型进行模式识别,所述多个模式识别模型属于集成学习模型和深度学习模型中至少之一;
19、根据所述多个模式识别模型的输出结果,确定所述行为数据所对应的模式识别结果。
20、作为一种可能的实施方式,在每次收集到所述目标用户的行为数据之后,所述方法还包括:
21、通过预先训练好的孤立森林模型,对所述行为数据进行异常行为模式的检测;
22、在对所述行为数据检测出异常行为模式的情况下,丢弃所述行为数据,并根据检测出的异常行为模式,更新所述目标用户的活动标签,以标记可能存在风险的用户行为。
23、作为一种可能的实施方式,所述方法还包括:
24、根据所述目标用户的多个维度的特征,确定所述目标用户所属的相似用户分组,所述多个维度的特征至少包括:人口统计特征,行为特征,兴趣特征和社会关系特征;
25、根据所述相似用户分组所对应的群组级活动标签,更新所述目标用户的活动标签。
26、作为一种可能的实施方式,所述方法还包括:
27、监测所述目标用户的行为变化情况;
28、根据所述目标用户的行为是否发生变化,确定是否重新收集所述目标用户的行为数据,以对所述目标用户的活动标签进行更新。
29、作为一种可能的实施方式,所述方法还包括:
30、根据所述目标用户的行为持续时间,将所述目标用户的活动标签划分为长期行为习惯所关联的第二标签和短期行为习惯所关联的第三标签;
31、对所述第二标签和所述第三标签分布进行长期存储和临时存储。
32、作为一种可能的实施方式,所述收集目标用户的行为数据,包括:
33、基于预设的数据接口标准,通过应用程序编程接口api、日志和监控工具,从多个平台对所述目标用户的行为数据进行收集,并通过多维度数据表对收集到的行为数据进行存储。
34、本技术实施例的第二方面,提供了一种活动标签生成装置,所述装置包括:
35、数据收集模块,用于收集目标用户的行为数据,所述行为数据包括:用户行为相关的时序数据;
36、语义分析模块,用于通过自然语言处理技术,对所述行为数据进行语义分析,得到所述行为数据所对应的语义分析结果;
37、模式识别模块,用于通过预先训练好的机器学习模型,对所述行为数据进行行为模式识别,得到所述行为数据所对应的模式识别结果;
38、标签生成模块,用于根据所述语义分析结果和所述模式识别结果,生成所述目标用户的活动标签,所述活动标签用于表征用户的兴趣和/或活动参与度。
39、本技术实施例的第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现如本技术实施例公开的第一方面所述的活动标签生成方法。
40、本技术实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现如本技术实施例公开的第一方面所述的活动标签生成方法。
41、本技术实施例的第五方面,提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如本技术实施例公开的第一方面所述的活动标签生成方法。
42、本技术实施例包括以下优点:将自然语言处理技术和机器学习模型结合应用至活动标签的生成过程,通过对行为数据进行语义分析和模式识别,以从多个维度对用户行为实现更加灵活和准确地理解和分析,由此可以提高所生成的活动标签的精准度,使其能够更加准确地反映用户真实的兴趣和/或活动参与度。
1.一种活动标签生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述通过自然语言处理技术,对所述行为数据进行语义分析,得到所述行为数据所对应的语义分析结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述语义分析结果和所述模式识别结果,生成所述目标用户的活动标签,包括:
4.根据权利要求1所述的方法,其特征在于,所述通过预先训练好的机器学习模型,对所述行为数据进行行为模式识别,得到所述行为数据所对应的模式识别结果,包括:
5.根据权利要求1所述的方法,其特征在于,在每次收集到所述目标用户的行为数据之后,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
9.根据权利要求1-8任一所述的方法,其特征在于,所述收集目标用户的行为数据,包括:
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;