本发明涉及税务审计分析,具体涉及基于云计算的企业税务审计分析系统。
背景技术:
1、传统税务审计主要依赖人工处理数据,存在以下挑战:效率低,面对庞大的财务数据和复杂的税务规则,人工审计效率低下,易产生差错;成本高:需要大量的人力资源投入,增加了企业的审计成本;风险高,人为因素可能导致审计结果的不准确,增加企业的税务风险。
2、因此,亟需一种基于云计算的企业税务审计分析系统来解决上述问题。
技术实现思路
1、本发明的目的在于提供基于云计算的企业税务审计分析系统:解决现有方案传统税务审计主要依赖人工处理数据而导致企业税务审计效率低、成本高和风险高的技术问题。
2、本发明的目的可以通过以下技术方案实现:
3、基于云计算的企业税务审计分析系统,系统包括数据获取模块、实体关联图谱构建模块、云计算审计分析模块和风险监控模块;
4、数据获取模块用于获取企业税务数据并对企业税务数据进行预处理,其中,企业税务数据包括财务数据、税务数据和业务数据;
5、实体关联图谱构建模块用于通过改进过的长短期记忆网络模型对预处理后的企业税务数据进行文本实体抽取,得到企业税务实体,对企业税务实体进行分类得到财务类实体、税务类实体和业务类实体,基于依存句法分析方法分析各个类别实体之间的机理关系,并基于机理关系构建实体关联图谱;
6、云计算审计分析模块用于基于实体关联图谱将各类实体对应的交易编号、商品名称、交易金额、交易数量、税率和税额聚类为实体数据池,并对实体数据池进行审计分析,得到审计分析结果,其中,每个企业的每个实体对应一个实体数据池;
7、风险监控模块用于基于审计分析结果生成风险监控指数,并基于风险监控指数对企业税务进行风险预警。
8、进一步地,对企业税务数据进行预处理具体包括以下过程:
9、数据清洗:使用is.na函数来识别缺失值,若缺失值小于预设数目,直接删除含有缺失值的记录或变量,使用全局常量、均值、众数或回归模型方法来填充缺失值,使用统计分析方法识别异常值,对异常值进行修正或删除,使用数据去重技术,确保数据集中不含有重复的记录;
10、数据集成:从各个数据源中提取所需的税务数据,解决不同数据源之间数据格式、单位、编码不一致的问题,将数据转换为统一的格式,将转换后的数据加载到统一的数据存储设备中;
11、数据规约:对数据进行汇总或聚集,减少数据的详细程度,使用主成分分析技术对数据进行压缩,减少数据的维度,从原始数据集中抽取一个具有代表性的样本,用于后续的分析或建模。
12、进一步地,通过改进过的长短期记忆网络模型对预处理后的企业税务数据进行文本实体抽取,得到企业税务实体,对企业税务实体进行分类得到财务类实体、税务类实体和业务类实体包括以下过程:
13、对预处理后的企业税务数据通过词嵌入构成向量序列,表示第个词的输入向量,其中,词嵌入是将单独字符或者是词语的one-hot向量进行随机初始化方法从embedding矩阵映射到低维度稠密向量;
14、将向量序列输入到改进过的长短期记忆网络模型得到文本特征矩阵p:将向量序列输入到改进过的长短期记忆网络模型,分别得到前向隐藏层序列和后向隐藏层序列,把、按照位置整合得到最后的完整隐藏层序列,将列接入线性层,从n维映射到k维,把向量维度与标签集长度分别相对应,映射成文本特征矩阵p,其中,k的数值为标准集标签数;
15、将特征矩阵p通过crf模型进行分类标注处理,得到财务类实体、税务类实体和业务类实体。
16、进一步地,将特征矩阵p通过crf模型进行分类标注处理,得到财务类实体、税务类实体和业务类实体包括以下过程:
17、基于特征矩阵p获取实体含义元素,其中,表示第j个标注中的第i个词;
18、通过输入和向量序列所对应的标签序列,并结合crf模型的状态转移矩阵a,得到向量序列的得分情况:
19、;
20、其中,表示crf模型中相邻的状态转移矩阵分数值,表示输出向量分数值;
21、通过将得分情况归一化处理之后获得模型的概率公式公式如下:
22、;
23、其中,代表全部可能的标注序列;
24、选择采用极大似然估计函数进行标注的预测得到财务类实体、税务类实体和业务类实体,其中,每个实体类别对应一个输出区间值,公式如下:
25、。
26、进一步地,基于依存句法分析方法分析各个类别实体之间的机理关系,并基于机理关系构建实体关联图谱包括以下过程:
27、依存关系提取:对包含实体的句子进行依存句法分析,提取出实体之间的依存关系;
28、关系分类:根据依存关系的类型和上下文信息,将实体之间的关系分类为具体的机理关系,机理关系包括因果关系、并列关系、包含关系;
29、关系筛选:去除噪声和无关的关系,只保留对构建实体关联图谱有用的关系;
30、实体节点构建:将识别出的实体作为图谱中的节点;
31、关系边构建:根据提取出的机理关系,在图谱中构建连接实体的边,并标注边的类型。
32、进一步地,对实体数据池进行审计分析,得到审计分析结果包括以下过程:
33、获取实体数据池中的交易编号、商品名称、交易金额、交易数量、税率和税额,云服务中心的已登记交易编号、已登记的商品名称、已登记的交易金额、已登记的交易数量、已登记的税率和已登记的税额;
34、分别计算得到交易编号与已登记交易编号的相同率jy、交易金额与已登记的交易金额的相同率je、交易数量与已登记的交易数量的相同率sl、税率与已登记的税率的相同率sw、税额与已登记的税额的相同率sew;
35、计算商品名称种类占已登记的商品名称种类比例sp;
36、将jy、je、sl、sw、sew和sp记为审计分析结果。
37、进一步地,基于审计分析结果生成风险监控指数,并基于风险监控指数对企业税务进行风险预警包括以下过程:
38、基于jy、je、sl、sw、sew计算企业税务相同指数swx:
39、;
40、将企业税务相同指数swx和sp代入风险监控指数计算公式,得到风险监控指数lms,计算公式如下:
41、;
42、其中,、为权重系数,由系统设定;
43、当风险监控指数大于预设阈值时,生成风险预警反馈给企业。
44、相比于现有方案,本发明实现的有益效果:
45、本发明获取企业税务数据并对企业税务数据进行预处理,其中,企业税务数据包括财务数据、税务数据和业务数据;通过改进过的长短期记忆网络模型对预处理后的企业税务数据进行文本实体抽取,得到企业税务实体,对企业税务实体进行分类得到财务类实体、税务类实体和业务类实体,基于依存句法分析方法分析各个类别实体之间的机理关系,并基于机理关系构建实体关联图谱;基于实体关联图谱对各类实体对应的交易编号、商品名称、交易金额、交易数量、税率和税额进行聚类为实体数据池,并对实体数据池进行审计分析,得到审计分析结果,其中,每个企业的每个实体对应一个实体数据池;基于审计分析结果生成风险监控指数,并基于风险监控指数对企业税务进行风险预警。能够提高对企业税务审计效率,降低审计成本高,降低企业的税务风险。
1.基于云计算的企业税务审计分析系统,其特征在于,系统包括数据获取模块、实体关联图谱构建模块、云计算审计分析模块和风险监控模块;
2.根据权利要求1所述的基于云计算的企业税务审计分析系统,其特征在于,对企业税务数据进行预处理具体包括以下过程:
3.根据权利要求1所述的基于云计算的企业税务审计分析系统,其特征在于,通过改进过的长短期记忆网络模型对预处理后的企业税务数据进行文本实体抽取,得到企业税务实体,对企业税务实体进行分类得到财务类实体、税务类实体和业务类实体包括以下过程:
4.根据权利要求3所述的基于云计算的企业税务审计分析系统,其特征在于,将特征矩阵p通过crf模型进行分类标注处理,得到财务类实体、税务类实体和业务类实体包括以下过程:
5.根据权利要求1所述的基于云计算的企业税务审计分析系统,其特征在于,基于依存句法分析方法分析各个类别实体之间的机理关系,并基于机理关系构建实体关联图谱包括以下过程:
6.根据权利要求1所述的基于云计算的企业税务审计分析系统,其特征在于,对实体数据池进行审计分析,得到审计分析结果包括以下过程:
7.根据权利要求1所述的基于云计算的企业税务审计分析系统,其特征在于,基于审计分析结果生成风险监控指数,并基于风险监控指数对企业税务进行风险预警包括以下过程: