本技术实施例涉及计算机,特别涉及一种基于笔记的用户特征分析方法。
背景技术:
1、用户特征是对用户基本属性、信息需求、信息行为、心理状态、环境影响等方面的描述。用户特征可以用来建立用户画像,识别用户群体中的共性,以采取针对性的运营或发展策略。比如某视频平台的用户对美食分类的视频点击率较高,平台在投入成本进行内容扶持时,可以针对美食视频有所倾斜,实现投入产出比最大化。
2、现有技术中,通过记录用户的行为操作,采集关键数据上报服务器,再分析生成用户的偏好倾向,来实现用户特征分析,但该用户特征分析方法应用于笔记用户时,由于笔记编辑的操作量大,需要消耗大量的服务器资源去存储和处理;且笔记应用涉及可删改且频繁变动的用户个人数据,导致可能记录大量的失误操作、无效信息,影响最终的用户特征结果;并且由于笔记可复制、移动,内容的信息量大,该方法无法对既存笔记进行内容偏好分析,导致用户画像不清晰、有偏差;从而使得现有的用户特征分析方法在基于笔记进行用户特征分析的效果较差。
技术实现思路
1、本技术实施例提供了一种基于笔记的用户特征分析方法,可以在本地终端设备中实现基于本地笔记数据实现在目标维度下的用户特征分析,在频繁删改的笔记数据场景中具有较好普适性,可以减少失误操作以及无效信息的干扰,提高用户特征分析的准确性,该技术方案如下。
2、一方面,提供了一种基于笔记的用户特征分析方法,所述方法由本地终端设备执行,所述方法包括:
3、获取用户的本地笔记数据;
4、基于从所述本地笔记数据提取到的对应于目标维度的笔记信息,构建对应于所述目标维度的初始特征空间以及评价指标;所述初始特征空间中包含对应于所述目标维度的各个笔记特征;
5、基于所述初始特征空间以及所述评价指标进行线性回归模型训练,得到对应于所述目标维度的本地模型;
6、基于所述目标维度的本地模型进行用户特征分析,得到分析结果;所述分析结果用于指示用户在所述目标维度的笔记使用倾向。
7、另一方面,提供了一种基于笔记的用户特征分析装置,应用于本地终端设备中,所述装置包括:
8、获取模块,用于获取用户的本地笔记数据;
9、构建模块,用于基于从所述本地笔记数据提取到的对应于目标维度的笔记信息,构建对应于所述目标维度的初始特征空间以及评价指标;所述初始特征空间中包含对应于所述目标维度的各个笔记特征;
10、训练模块,用于基于所述初始特征空间以及所述评价指标进行线性回归模型训练,得到对应于所述目标维度的本地模型;
11、分析模块,用于基于所述目标维度的本地模型进行用户特征分析,得到分析结果;所述分析结果用于指示用户在所述目标维度的笔记使用倾向。
12、在一种可能的实现方式中,所述训练模块,包括:
13、升维子模块,用于对所述初始特征空间中的各个笔记特征进行特征升维处理,得到扩展特征空间;
14、训练子模块,用于基于所述扩展特征空间中的各个笔记特征以及所述评价指标进行线性回归模型训练,得到对应于所述目标维度的本地模型。
15、在一种可能的实现方式中,所述构建模块,包括:
16、信息表构建子模块,用于基于从所述本地笔记数据提取到的对应于所述目标维度的笔记信息,构建所述目标维度对应的信息表;所述信息表中的信息随着所述本地笔记数据的变化实时更新;
17、信息确定子模块,用于基于所述目标维度对应的信息表,确定对应于所述目标维度的初始特征空间以及评价指标。
18、在一种可能的实现方式中,所述目标维度包括分类维度,内容维度以及编辑维度;
19、所述本地模型对应包括分类本地模型,内容本地模型以及编辑本地模型。
20、在一种可能的实现方式中,
21、在一种可能的实现方式中,所述信息表构建子模块,用于,
22、在所述目标维度为分类维度的情况下,基于从所述本地笔记数据提取到的对应于所述分类维度的分类信息,构建笔记信息表,所述笔记信息表的表头包含笔记标识,笔记标签数组以及笔记查看次数;
23、基于所述笔记信息表进行分类信息累加统计,得到分类信息表;所述分类信息表的表头包含笔记数量,标签数量以及总笔记查看次数;其中,所述标签数量用于指示多个笔记之间非重复标签的数量;
24、所述信息确定子模块,用于,
25、将所述笔记信息表中的所述笔记数量以及标签数量确定为对应于所述分类维度的所述初始特征空间中的笔记特征;
26、将所述笔记信息表中的所述总笔记查看次数确定为对应于所述分类维度的评价指标。
27、在一种可能的实现方式中,所述信息表构建子模块,用于,
28、在所述目标维度为内容维度的情况下,基于从所述本地笔记数据提取到的对应于所述内容维度的内容信息,构建内容信息表;所述内容信息表的表头包含笔记标识,笔记内容评分以及所述内容信息;所述内容信息包括以下至少之一:笔记查看次数,文本长度,图片数量,音频数量,视频数量,超链接数量,文件数量;所述笔记内容评分是基于所述内容信息确定的,用于指示用户增加对应内容信息的笔记的概率;
29、所述信息确定子模块,用于,
30、将所述内容信息表中的所述内容信息确定为对应于所述内容维度的所述初始特征空间中的笔记特征;
31、基于所述内容信息表中的所述笔记内容评分确定对应于所述内容维度的评价指标。
32、在一种可能的实现方式中,信息表构建子模块,用于,
33、在所述目标维度为编辑维度的情况下,基于从所述本地笔记数据提取到的对应于所述编辑维度的编辑信息,构建编辑信息表,所述编辑信息表的表头包含笔记标识,笔记编辑评分以及所述编辑信息;所述编辑信息包括以下至少之一:编辑次数,字体大小,字体颜色,强调样式,排版样式,列表样式以及表格样式;所述笔记编辑评分是基于所述编辑信息确定的,用于指示用户增加对应的编辑信息的笔记的概率;
34、所述信息确定子模块,用于,将所述编辑信息表中的所述编辑信息确定为对应于所述编辑维度的所述初始特征空间中的笔记特征;
35、基于所述编辑信息表中的所述笔记编辑评分确定对应于所述编辑维度的评价指标。
36、在一种可能的实现方式中,所述装置还包括:
37、模型更新模块,用于在达到模型训练节点,且目标维度为分类维度的情况下,基于更新后的分类信息表执行笔记特征提取以及线性回归模型训练的过程,得到更新后的所述分类本地模型。
38、在一种可能的实现方式中,所述模型更新模块,用于,
39、在达到模型训练节点,且目标维度为内容维度或编辑维度的情况下,基于更新后的内容信息表或编辑信息表中已更新的信息执行笔记特征提取以及线性回归模型训练的过程,得到更新后的所述内容本地模型或编辑本地模型。
40、在一种可能的实现方式中,所述分析模块,用于,
41、基于所述目标维度的本地模型中的模型参数进行用户特征分析,得到所述分析结果;
42、或者,
43、基于所述目标维度的本地模型生成对应的二维图像,以基于所述二维图像进行用户特征分析,得到所述分析结果。
44、另一方面,提供了一种计算机设备,所述计算机设备包含处理器和存储器,所述存储器存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现上述的基于笔记的用户特征分析方法。
45、另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述的基于笔记的用户特征分析方法。
46、另一方面,提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行以实现上述各种可选实现方式中提供的基于笔记的用户特征分析方法。
47、本技术提供的技术方案可以包括以下有益效果:
48、本技术实施例提供的基于笔记的用户特征分析方法,本地终端设备通过获取用户的本地笔记数据,对本地笔记数据进行目标维度的笔记信息提取,以基于提取到的笔记信息构建对应的初始特征空间以及得到对应的评价指标,之后,基于本地笔记数据的初始特征空间以及评价指标进行线性回归模型的训练,得到该目标维度下的本地模型,以基于该本地模型进行用户特征分析,得到指示用户在目标维度下的笔记使用倾向的分析结果。通过上述方法,可以在本地终端设备中实现基于本地笔记数据实现在目标维度下的用户特征分析,在频繁删改的笔记数据场景中具有较好普适性,可以减少失误操作以及无效信息的干扰,从而提高用户特征分析的准确性;此外,通过本地终端设备进行用户特征分析,可以提高对用户数据的隐私保护效果,提高用户数据的安全性。
49、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
1.一种基于笔记的用户特征分析方法,其特征在于,所述方法由本地终端设备执行,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述初始特征空间以及所述评价指标进行线性回归模型训练,得到对应于所述目标维度的本地模型,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于从所述本地笔记数据提取到的对应于目标维度的笔记信息,构建对应于所述目标维度的初始特征空间以及评价指标,包括:
4.根据权利要求1至3任一所述的方法,其特征在于,所述目标维度包括分类维度,内容维度以及编辑维度;
5.根据权利要求4所述的方法,其特征在于,在所述目标维度为分类维度的情况下,所述基于从所述本地笔记数据提取到的对应于所述目标维度的信息,构建所述目标维度对应的信息表,包括:
6.根据权利要求4所述的方法,其特征在于,在所述目标维度为内容维度的情况下,所述基于从所述本地笔记数据提取到的对应于所述目标维度的信息,构建所述目标维度对应的信息表,包括:
7.根据权利要求4所述的方法,其特征在于,在所述目标维度为编辑维度的情况下,所述基于从所述本地笔记数据提取到的对应于所述目标维度的信息,构建所述目标维度对应的信息表,包括:
8.根据权利要求4所述的方法,其特征在于,在所述目标维度为分类维度的情况下,所述方法还包括:
9.根据权利要求4所述的方法,其特征在于,在所述目标维度为内容维度或编辑维度的情况下,所述方法还包括:
10.根据权利要求1所述的方法,其特征在于,所述基于所述目标维度的本地模型进行用户特征分析,得到分析结果,包括:
