本公开的实施例涉及计算机,具体涉及基于权限标签的问答信息处理方法、装置和电子设备。
背景技术:
1、随着机器学习相关技术的发展,基于机器学习的问答信息提炼及应用被越来越多使用(例如,应用于法规领域的问答信息应用)。然而,针对多个问答信息库,当存在重复的用于问答信息提炼的文件时,往往会导致问答信息的重复提炼和存储,可能造成计算资源和存储资源的浪费。
2、该背景技术部分中所公开的以上信息仅用于增强对本发明构思的背景的理解,并因此,其可包含并不形成本领域普通技术人员已知的现有技术的信息。
技术实现思路
1、本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
2、本公开的一些实施例提出了基于权限标签的问答信息处理方法、装置和电子设备,来解决以上背景技术部分提到的技术问题中的一项或多项。
3、第一方面,本公开的一些实施例提供了一种基于权限标签的问答信息处理方法,该方法包括:获取问答信息集合,其中,上述问答信息集合中的问答信息对应不同的且相互之间数据隔离的问答信息库,问答信息包括:问答信息源、问答内容信息和问答信息标签,其中,问答信息标签表征问答信息的被访问权限;对上述问答信息集合中的每个问答信息包括的问答内容信息进行问答信息特征提取,以生成问答信息特征;根据问答信息对应的问答信息特征,对上述问答信息集合中的问答信息进行异源问答信息合并,以生成问答信息组集合;对于上述问答信息组集合中的每个问答信息组,执行以下第一处理步骤:响应于确定上述问答信息组包括的问答信息的数量大于目标数量,根据上述问答信息组中的问答信息包括的问答信息源和问答信息标签,生成针对上述问答信息组的更新后问答信息标签;根据上述更新后问答信息标签和上述问答信息组,对虚拟问答信息库对应的问答信息索引树进行索引更新,得到更新后问答信息索引树;响应于确定上述问答信息组包括的问答信息的数量等于上述目标数量,根据上述问答信息组,对上述问答信息索引树进行索引更新,得到更新后问答信息索引树。
4、第二方面,本公开的一些实施例提供了一种基于权限标签的问答信息处理装置,装置包括:获取单元,被配置成获取问答信息集合,其中,上述问答信息集合中的问答信息对应不同的且相互之间数据隔离的问答信息库,问答信息包括:问答信息源、问答内容信息和问答信息标签,其中,问答信息标签表征问答信息的被访问权限;信息特征提取单元,被配置成对上述问答信息集合中的每个问答信息包括的问答内容信息进行问答信息特征提取,以生成问答信息特征;异源问答信息合并单元,被配置成根据问答信息对应的问答信息特征,对上述问答信息集合中的问答信息进行异源问答信息合并,以生成问答信息组集合;执行单元,被配置成对于上述问答信息组集合中的每个问答信息组,执行以下第二处理步骤:响应于确定上述问答信息组包括的问答信息的数量大于目标数量,根据上述问答信息组中的问答信息包括的问答信息源和问答信息标签,生成针对上述问答信息组的更新后问答信息标签;根据上述更新后问答信息标签和上述问答信息组,对虚拟问答信息库对应的问答信息索引树进行索引更新,得到更新后问答信息索引树;响应于确定上述问答信息组包括的问答信息的数量等于上述目标数量,根据上述问答信息组,对上述问答信息索引树进行索引更新,得到更新后问答信息索引树。
5、第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
6、第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
7、本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的基于权限标签的问答信息处理方法,减少了存储资源的浪费。具体来说,造成存储资源浪费的原因在于:针对多个问答信息库,当存在重复的用于问答信息提炼的文件时,往往会导致问答信息的重复提炼和存储,可能造成计算资源和存储资源的浪费。基于此,本公开的一些实施例的基于权限标签的问答信息处理方法,首先,获取问答信息集合,其中,上述问答信息集合中的问答信息对应不同的且相互之间数据隔离的问答信息库,问答信息包括:问答信息源、问答内容信息和问答信息标签,其中,问答信息标签表征问答信息的被访问权限。以此得到待合并存储的问答信息。接着,对上述问答信息集合中的每个问答信息包括的问答内容信息进行问答信息特征提取,以生成问答信息特征。通过问答信息特征提取,一是可以对问答信息进行特征粒度的信息提炼,二是将不同问答信息库的问答信息映射至相同的特征空间。进一步,根据问答信息对应的问答信息特征,对上述问答信息集合中的问答信息进行异源问答信息合并,以生成问答信息组集合。以此将来源不同的但内容相同的问答信息进行合并。此外,对于上述问答信息组集合中的每个问答信息组,执行以下第一处理步骤:第一步,响应于确定上述问答信息组包括的问答信息的数量大于目标数量,根据上述问答信息组中的问答信息包括的问答信息源和问答信息标签,生成针对上述问答信息组的更新后问答信息标签。即当问答信息组中包含至少一个来源于不同问答信息库的问答信息时,需要根据问答信息组中的问答信息标签,对问答信息组进行整体的问答信息标签更新。第二步,根据上述更新后问答信息标签和上述问答信息组,对虚拟问答信息库对应的问答信息索引树进行索引更新,得到更新后问答信息索引树。通过更新问答信息索引树,实现将来源于不同问答信息库的问答信息整体存储,避免了当存在信息冗余时,独立存储可能造成的存储资源浪费的问题。第三步,响应于确定上述问答信息组包括的问答信息的数量等于上述目标数量,根据上述问答信息组,对上述问答信息索引树进行索引更新,得到更新后问答信息索引树。实践中,当问答信息组包括的问答信息的数量等于上述目标数量,即表征问答信息组包括的问答信息均来源于相同的问答信息库,此时可以直接对问答信息索引树进行更新。通过此种将多个问答信息库中的问答信息合并存储的方式,大大提高了存储资源利用率。
1.一种基于权限标签的问答信息处理方法,包括:
2.根据权利要求1所述的方法,其中,所述方法还包括:
3.根据权利要求2所述的方法,其中,所述问答信息集合中的问答信息包括:问询信息和答复信息;以及
4.根据权利要求3所述的方法,其中,所述根据问答信息对应的问答信息特征,对所述问答信息集合中的问答信息进行异源问答信息合并,以生成问答信息组集合,包括:
5.根据权利要求4所述的方法,其中,所述根据所述问答信息组中的问答信息包括的问答信息源和问答信息标签,生成针对所述问答信息组的更新后问答信息标签,包括:
6.根据权利要求5所述的方法,其中,所述根据所述更新后问答信息标签和所述问答信息组,对虚拟问答信息库对应的问答信息索引树进行索引更新,得到更新后问答信息索引树,包括:
7.一种基于权限标签的问答信息处理装置,包括:
8.一种电子设备,包括:
9.一种计算机可读介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至6中任一所述的方法。