一种园区潜在上规企业识别方法和系统与流程

专利2025-03-01  29


本发明属于数据处理领域,更具体的说涉及一种园区潜在上规企业识别方法和系统。


背景技术:

1、随着经济的快速发展,企业评估和识别上规模具有巨大的经济价值和社会意义。经济园区是经济发展的重要推动者,准确地识别园区内的潜在上规企业,可以帮助园区管理者针对性地提供支持和服务,推动园区内经济的繁荣和发展。然而,传统的企业评估和识别方法通常较为繁琐,需要投入大量的人力和物力,而且结果的准确性也受到限制。因此,研究和开发一种能够自动化、准确地识别潜在上规企业的方法和系统具有重要意义。

2、同时,随着大数据和人工智能技术的发展,这些技术开始被广泛应用于各领域。在企业识别和评估的过程中,利用这些技术可以对企业的多维度数据进行深度分析和挖掘,从而更全面、更精确地识别和评估企业。然而,如何有效地运用这些技术进行企业识别和评估,仍然是一个具有挑战性的问题。特别是如何充分利用企业的多维度数据,有效捕捉企业的多维度关系,以提高识别和评估的准确性。


技术实现思路

1、本发明提出了一种园区潜在上规企业识别方法和系统。该方法和系统能够实现对企业的多维度数据的深度分析和挖掘,对企业进行准确的识别和评估,以此来解决上述问题。

2、为了实现上述目的,本发明是采用以下技术方案实现的:所述的方法包括:

3、数据预处理与关键信息提取:收集企业的多维度数据;对收集的数据进行预处理;

4、预测识别网络算法模型构建:构建园区潜在上规企业识别的模型,采用capsnet网络模型对潜在上规企业进行识别;

5、模型训练:对预测识别网络算法模型进行训练;

6、分类与预测:通过训练完成的模型对园区潜在上规企业识别预测。

7、在一个方案中,所述的收集企业的多维度数据包括:财务数据、创新能力、供应链关系、市场影响力信息;

8、财务数据包括营业收入、利润总额、净资产财务指标,通过企业盈利能力公式进行评估:盈利能力=利润总额/净资产;

9、创新能力包括专利数量、研发投入、新产品占比,通过创新能力公式进行评估:创新能力=(专利数量+研发投入)/营业收入

10、供应链关系包括供应商数量、采购量、采购物流支出,通过供应链关系公式进行评估:供应链关系=采购物流支出/采购量

11、市场影响力包括市场份额、客户满意度、品牌知名度,通过市场影响力公式进行评估:市场影响力=(市场份额+客户满意度+品牌知名度)/总市场规模;

12、其中,所有的数值型数据需要进行标准化处理,以消除不同量级间的影响,标准化公式如下:

13、标准化数值=x-平均值/标准差

14、其中x为原始数值,平均值和标准差为原始数据集的对应值。

15、在一个方案中,所述的预处理包括:

16、对待分类的文本数据进行数据清洗、分词、去停用词和特征提取;

17、使用基于行业知识库的自适应算法;针对特定行业的文本数据,调整分词策略,捕捉行业特有的术语和表达;

18、基于行业知识库,采用自适应算法,根据被处理的文本数据的行业属性,选择与之最匹配的行业知识库进行同义词替换、实体识别;

19、根据特定行业的文本数据,进行分词策略的调整;

20、使用word2vec模型训练得到词的向量表示;根据文本中词频和逆文档频率计算出权重。

21、在一个方案中,所述的预测识别网络算法模型采用capsnet网络模型,

22、对capsnet网络模型的改进包括:

23、优化更新因子μ:将μ设置为一个可学习的参数,在训练过程中采用随机梯度下降法确定最优的μ值;

24、引入注意力机制,在计算时,为每个胶囊引入一个α系数作为注意力权重;α通过softmax函数得到,所有α的和等于1。

25、在一个方案中,所述capsnet网络模型的构建过程如下:

26、s201、初始化capsnet网络模型,并设置基本的模型参数,模型的输入为企业的关键信息特征向量;

27、s202、根据输入构建初始的特征向量u,该向量是经过第一层卷积神经网络得到的结果;

28、s203、计算每个胶囊的预测向量;预测向量通过将初始的特征向量投影到高层的胶囊空间中得到;

29、s204、初始化路由权重为0;

30、s205、调整动态路由过程中的路由权重:根据一致性得分,通过softmax函数更新路由权重;

31、s206、通过非线性激活函数计算网络末端胶囊的输出:

32、s207、更新一致性得分和路由权重;

33、s208、重复s205-s207,进行多轮迭代更新,直到模型收敛;

34、使用网络末端胶囊的输出作为潜在上规企业识别结果,得到每个企业作为潜在上规企业的概率。

35、在一个方案中,capsnet网络模型训练如下:

36、在模型训练的过程中,定义margin loss损失函数评估预测结果和实际结果之间的差距;

37、在训练过程中,优化算法需要最小化整个训练数据集的总损失:

38、优化算法采用随机梯度下降,通过不断地迭代优化,更新模型参数以最小化损失函数。

39、在一个方案中,所说的分类与预测包括:

40、输入预处理:输入新的企业关键信息,将企业的关键信息转换为特征向量;

41、特征向量输入模型:将预处理后的特征向量输入到训练好的capsnet模型中,‌capsule‌是capsnet模型胶囊网络中的基本单元,通过前向传播计算,得到每个胶囊的预测向量,并进行动态路由;

42、输出分类结果:根据capsnet模型的输出进行分类判断,如果某一网络末端胶囊的向量长度大于设定的阈值,即认为该企业属于该capsule代表的类别;将企业分类两类:潜在上规企业和非上规企业;

43、概率计算:每个胶囊输出的向量长度都代表着该输出对应类别的概率;只输出对应类别概率最大的胶囊所代表的企业分类结果。

44、再一方面,一种园区潜在上规企业识别系统,所述的系统适用于所述的方法,所述的系统包括:

45、数据预处理与关键信息提取模块:用于收集企业的多维度数据,并进行数据预处理,包括数据清洗、分词、去停用词和特征提取;

46、预测识别模块:用于构建能进行园区潜在上规企业识别的capsnet网络模型;

47、分类与预测模块:用于通过已训练完成的模型对园区潜在上规企业进行分类和预测;

48、结果展示模块:用于将潜在上规企业的识别结果进行呈现。

49、本发明有益效果:

50、本发明提供了一种园区潜在上规企业识别方法和系统,以有效地实现园区内潜在上规企业的自动化、精准识别。采用了高深的capsnet网络模型及其优化策略,可以更好地捕捉并理解企业多维度数据之间的内在关系,提高潜在上规企业的识别准确性。同时,这种方法和系统操作简便,可以大大降低人力物力投入,提高工作效率,具有很高的实用价值和广阔的应用前景。

51、本发明在capsnet的基础上进行了进一步的改进优化,引入了注意力机制并优化了动态路由算法,提高了其在识别潜在上规企业任务中的性能,这些都是该方法相比于现有技术算法的显著优势和优点。


技术特征:

1.一种园区潜在上规企业识别方法,其特征在于:所述的方法包括:

2.根据权利要求1所述的一种园区潜在上规企业识别方法,其特征在于:所述的收集企业的多维度数据包括:财务数据、创新能力、供应链关系、市场影响力信息。

3.根据权利要求1所述的一种园区潜在上规企业识别方法,其特征在于:所述的预处理包括:

4.根据权利要求1所述的一种园区潜在上规企业识别方法,其特征在于:采用capsnet网络模型对潜在上规企业进行识别,

5.根据权利要求4所述的一种园区潜在上规企业识别方法,其特征在于:所述capsnet网络模型的构建过程如下:

6.根据权利要求1所述的一种园区潜在上规企业识别方法,其特征在于:capsnet网络模型训练如下:

7.根据权利要求1所述的一种园区潜在上规企业识别方法,其特征在于:所说的分类与预测包括:

8.一种园区潜在上规企业识别系统,所述的系统适用于如权利要求1-7中任一项权利要求所述的方法,其特征在于:所述的系统包括:


技术总结
本发明提出了一种园区潜在上规企业识别方法和系统。属于,大数据分析领域,该方法通过收集和预处理企业的多维度数据,利用CapsNet网络模型进行预测识别模型的构建和训练。在预测识别中,优化的动态路由策略足以捕捉企业各项数据之间的内在关系,提高了企业分类预测的速度和准确率。系统以高层capsule的输出作为识别结果,得出预测的潜在上规企业,并通过结果展示模块进行呈现,使园区管理者能更准确、更快速地识别出具有快速成长潜力的上规企业。

技术研发人员:王志国,彭柏林,陈亮,袁浩杰,韩坤
受保护的技术使用者:成都高新愿景数字科技有限公司
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-22126.html