一种基于用户正负反馈信息的短视频点击率预测方法与流程

专利2024-07-11 61

本发明属于互联网服务技术领域，尤其是涉及一种基于用户正负反馈信息的短视频点击率预测方法。

背景技术：

短视频是一种新型的且时间较短的视频。短视频的拍摄不需要使用专业设备，也不需要专业技巧。用户直接通过手机就可以很方便地进行拍摄和上传到短视频平台，因此短视频平台的短视频数量增长得非常快。这使得对有效短视频推荐系统的需求非常迫切，有效的短视频推荐系统可以提升用户体验和用户黏性，从而给平台带来巨大的商业价值。

近些年，很多研究者提出了基于视频的个性化推荐方法。这些方法可以分为三类：协同过滤、基于内容的推荐和混合推荐方法。但是相比于视频，短视频有着不同的特点：描述文本质量较低、时长较短且用户在一段时间内的交互序列较长。因此，短视频推荐是一个更具有挑战性的任务，并且有研究者提出了一些方法。例如，chen等人利用分层的注意力机制去计算物品和类目这两种级别的重要性，得到更准确的预测结果。li等人结合正负反馈数据，并使用基于图的循环神经网络去建模，最后得到用户的偏好。

chen等人的方法只采用了用户的正反馈信息，没有考虑用户负反馈信息对推荐的影响。li等人的方法没有考虑到用户的正反馈信息和负反馈信息之间差异性，采用相同的模型结构来处理正反馈和负反馈信息。通常来讲，用户的兴趣是动态变化的，但是厌恶点是相对稳定的。用户的点击行为具有较强的序列性，而未点击行为则不存在这样的规律。并且在短视频平台中，用户的行为非常丰富，所以我们只关注和目标短视频相关的的用户行为。对于用户的点击序列，本方法采用基于目标短视频注意力机制的循环神经网络方法；对于用户的未点击序列，本方法采用目标短视频注意力机制方法。

技术实现要素：

本发明所要解决的技术问题是根据用户对短视频的点击和未点击序列，预测用户对目标短视频的点击率。本方法分别采用基于目标短视频注意力机制的循环神经网络方法和目标短视频注意力机制方法从用户点击和未点击序列中抽取用户的兴趣特征。为此，本发明采用以下技术方案：

一种基于用户正负反馈信息的短视频点击率预测方法，包括以下步骤：

将用户正反馈信息和负反馈信息分割成块，且从块中抽取特征。对于一个用户的点击行为序列可以表示为其中是短视频的封面图特征向量，d是特征向量长度。因为短视频时长较短，造成用户的行为序列比较长。所以，本方法用一个长度为w的窗口将序列x+分割成m个块，用户在一个块里的交互的短视频往往比较相似。此时，每个块特征表征的计算方式如下：

其中，为用户在第k个块的偏好特征。虽然求和的方式会丢失掉一部分信息，但是主要的信息会被保留，这正是我们所需要的。本方法采用相同的方式处理用户的负反馈信息，得到负反馈的块表征

基于用户正反馈序列捕捉用户行为的序列性，得到目标短视频相关的用户兴趣表征v⁺。

其中，为用户在正反馈序列的第k个块的偏好特征,xnew是目标短视频向量表征。是转换矩阵。是正反馈序列中的第k个块的偏好特征和目标短视频的相关性。表示采用循环神经网络(rnn)对序列进行建模。本方法中采用的循环神经网络结构是长短时记忆网络(lstm),如下:

hk＝okck

其中，长短期记忆网络的最后一层的隐藏状态hk的输出就是用户兴趣表征v+。是当前层的节点输入，和分别是控制输入门ik、遗忘门fk和输出门ok的参数。σ为sigmoid函数。所有这些参数和输入：隐层状态当前输入共同参与计算，来输出结果hk。

基于用户负反馈序列，捕捉和目标短视频相关的用户兴趣表征v^-。本方法采用注意力机制方法：

其中，为用户在负反馈序列中的第k个块的偏好特征,xnew是目标短视频向量表征。是转换矩阵。是负反馈序列中的第k个块的偏好特征和目标短视频的相关性。

根据用户兴趣表征，预测用户对目标短视频的点击率。

o＝concat(v⁺,v^-)

其中，v⁺,v^-分别为从用户正反馈和负反馈中抽取的用户兴趣。concat表示把两个向量连接。和是转移矩阵，是偏置向量，b2是偏置标量。σ是sigmoid激活函数。

根据模型特性，设计损失函数。通过用户对目标短视频的点击率预测值计算预测值和真实值y之间的误差，进而使用误差来更新模型参数。我们采用交叉熵损失函数来指导模型参数的更新过程：

其中，y∈{0,1}是真实值，代表用户是否点击了目标短视频。σ是sigmoid函数。最后采用adam优化器更新模型参数。

本发明的有益技术效果如下：

(1)本发明提出了一种基于用户正负反馈信息的短视频点击率预测方法，考虑到用户的兴趣是动态变化的，但是厌恶点是相对稳定的特点。也就是，用户的点击行为具有较强的序列性，而未点击行为则不存在这样的规律。所以，采用不同的方法分别从正负反馈信息中抽取用户兴趣特征。

(2)本发明认为在短视频平台中，用户的行为非常丰富，只关注和目标短视频相关的的用户行为更有利于推荐的准确性。所以，采用基于目标短视频的注意力机制从序列中抽取和目标短视频相关的特征。

附图说明

图1为本发明一种基于用户正负反馈信息的短视频点击率预测方法的流程示意图；

图2为本发明一种基于用户正负反馈信息的短视频点击率预测方法的模型框架图。

具体实施方式

为了进一步理解本发明，下面结合具体实施方式对本发明提供的一种基于用户正负反馈信息的短视频点击率预测方法进行具体描述，但本发明并不限于此，该领域技术人员在本发明核心指导思想下做出的非本质改进和调整，仍然属于本发明的保护范围。

短视频点击率预测任务是建立一个模型去预测用户点击短视频的概率。用户的历史序列表示为其中p∈{+,-}分别代表点击和未点击行为，xj代表第j个短视频，l是序列的长度。整个序列可以进一步细分为点击序列和未点击序列也就是正反馈和负反馈信息。因此，短视频点击率预测问题可以表示成：输入用户点击序列未点击的序列以及目标短视频xnew，来预测用户对目标短视频xnew的点击率。

为此，本发明提出了一种基于用户正负反馈信息的短视频点击率预测方法。它根据用户对短视频的点击和未点击序列，预测用户对目标短视频的点击率。这里的用户短视频序列输入的是短视频的封面图向量表征。通常来讲，用户的兴趣是动态变化的，但是厌恶点是相对稳定的。用户的点击行为具有较强的序列性，而未点击行为则不存在这样的规律。并且在短视频平台中，用户的行为非常丰富，所以我们只关注和目标短视频相关的的用户行为。对于用户的点击序列，本方法采用基于目标短视频注意力机制的循环神经网络方法；对于用户的未点击序列，本方法采用目标短视频注意力机制方法。

本方法主要由三个部分组成，如图2所示。第一部分是将用户行为序列分割成块(block)序列。短视频平台中，短视频时间较短且用户的短视频观看行为非常频繁，可以认为序列中连续的短视频具有相近的特征。第二部分是分别采用基于目标短视频注意力机制的循环神经网络方法和目标短视频注意力机制方法从用户点击和未点击序列中抽取用户的兴趣特征。第三部分是基于从用户点击序列和未点击序列中抽取的用户兴趣特征，进行短视频点击率的预测。

如图1所示，按照本发明的一个实施例，本方法包括如下步骤：

s100，将用户正反馈信息和负反馈信息分割成块，且从块中抽取特征。对于一个用户的点击行为序列可以表示为其中是短视频的封面图特征向量，d是特征向量长度。因为短视频时长较短，造成用户的行为序列比较长。所以，本方法用一个长度为w的窗口将序列x⁺分割成m个块，用户在一个块里的交互的短视频往往比较相似。此时，每个块特征表征的计算方式如下：

s200，基于用户正反馈序列捕捉用户行为的序列性，得到目标短视频相关的用户兴趣表征v⁺。

hk＝okck

其中，长短期记忆网络的最后一层的隐藏状态hk的输出就是用户兴趣表征v⁺。是当前层的节点输入，和分别是控制输入门ik、遗忘门fk和输出门ok的参数。σ为sigmoid函数。所有这些参数和输入：隐层状态当前输入共同参与计算，来输出结果hk。

s300,基于用户负反馈序列，捕捉和目标短视频相关的用户兴趣表征v^-。本方法采用注意力机制方法：

s400，根据用户兴趣表征，预测用户对目标短视频的点击率。

o＝concat(v⁺,v^-)

s500，根据模型特性，设计损失函数。通过用户对目标短视频的点击率预测值计算预测值和真实值y之间的误差，进而使用误差来更新模型参数。我们采用交叉熵损失函数来指导模型参数的更新过程：

其中，y∈{0,1}是真实值，代表用户是否点击了目标短视频。σ是sigmoid函数。我们采用adam优化器更新模型参数。

上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，对于本发明做出的改进和修改都应该在本发明的保护范围之内。

技术特征：

1.一种基于用户正负反馈信息的短视频点击率预测方法，其特征在于：

将用户正反馈信息和负反馈信息分割成块，且从块中抽取特征；对于一个用户的点击行为序列可以表示为其中是短视频的封面图特征向量，d是特征向量长度；因为短视频时长较短，造成用户的行为序列比较长；所以，本方法用一个长度为w的窗口将序列x⁺分割成m个块，用户在一个块里的交互的短视频往往比较相似；此时，每个块特征表征的计算方式如下：

其中，为用户在第k个块的偏好特征；虽然求和的方式会丢失掉一部分信息，但是主要的信息会被保留，这正是我们所需要的；本方法采用相同的方式处理用户的负反馈信息，得到负反馈的块表征

基于用户正反馈序列捕捉用户行为的序列性，得到目标短视频相关的用户兴趣表征v⁺；

其中，为用户在正反馈序列的第k个块的偏好特征,xnew是目标短视频向量表征；是转换矩阵；是正反馈序列中的第k个块的偏好特征和目标短视频的相关性；表示采用循环神经网络(rnn)对序列进行建模；本方法中采用的循环神经网络结构是长短时记忆网络(lstm)；

基于用户负反馈序列，捕捉和目标短视频相关的用户兴趣表征v^-；本方法采用注意力机制方法：

其中，为用户在负反馈序列中的第k个块的偏好特征,xnew是目标短视频向量表征；是转换矩阵；是负反馈序列中的第k个块的偏好特征和目标短视频的相关性；

根据用户兴趣表征，预测用户对目标短视频的点击率；

o＝concat(v⁺,v^-)

其中，v⁺,v^-分别为从用户正反馈和负反馈中抽取的用户兴趣；concat表示把两个向量连接；和是转移矩阵，是偏置向量，b2是偏置标量；σ是sigmoid激活函数；

根据模型特性，设计损失函数；通过用户对目标短视频的点击率预测值计算预测值和真实值y之间的误差，进而使用误差来更新模型参数；我们采用交叉熵损失函数来指导模型参数的更新过程：

其中，y∈{0,1}是真实值，代表用户是否点击了目标短视频；σ是sigmoid函数；最后采用adam优化器更新模型参数。

2.根据权利要求1所述的一种基于用户正负反馈信息的短视频点击率预测方法，其特征在于：所述长短时记忆网络(lstm)结构为：

hk＝okck

其中，长短期记忆网络的最后一层的隐藏状态hk的输出就是用户兴趣表征v⁺；是当前层的节点输入，和分别是控制输入门ik、遗忘门fk和输出门ok的参数；σ为sigmoid函数；所有这些参数和输入：隐层状态当前输入共同参与计算，来输出结果hk。

技术总结
本发明公开了一种基于用户正负反馈信息的短视频点击率预测方法。该方法根据用户对短视频的点击和未点击序列，预测用户对目标短视频的点击率。本方法主要由三个部分组成：第一部分是将用户行为序列分割成块(block)序列。短视频平台中，短视频时间较短且用户的短视频观看行为非常频繁，可以认为序列中连续的短视频具有相近的特征。第二部分是分别采用基于目标短视频注意力机制的循环神经网络方法和目标短视频注意力机制方法从用户点击和未点击序列中抽取用户的兴趣特征。第三部分是基于从用户点击序列和未点击序列中抽取的用户兴趣特征，进行短视频点击率的预测。

技术研发人员：顾盼
受保护的技术使用者：中国计量大学
技术研发日：2020.12.08
技术公布日：2021.04.06

转载请注明原文地址:https://xbbs.6miu.com/read-20304.html