本技术涉及电子发票验证,尤其是涉及一种电子发票查验方法、装置、终端及存储介质。
背景技术:
1、随着电子商务和数字化办公的普及,电子发票已经成为日常商业交易中的重要凭证。因此,如何快速、批量地验证发票及其版式文件的真伪成为企业和财务机构面临的重要问题。然而,传统的人工查验方式只能单张发票逐一验证,不仅效率低下,且易出错,难以满足现代财务管理的快速响应要求。另外,虽然市场上已存在部分电子发票查验工具,但大多依赖于单一识别模式(如仅通过二维码扫描或ocr文字识别),且当批量查验电子发票时,通常只能处理单一类型的发票,难以应对复杂多变的发票格式,容易出现误检的问题。此外,伪造电子发票的手段也越来越复杂,单一模式的查验手段已经难以应对潜在的伪造手段。
2、因此,亟需一种能够高效、准确地批量查验电子发票及版式文件真伪的技术解决方案。
技术实现思路
1、为了能够高效、准确地批量查验电子发票及版式文件,本技术提供了一种电子发票查验方法、装置、终端及存储介质,通过多模态识别和预设的多种发票文件模版对电子发票及版式文件实现准确、细致的查验。
2、第一方面,本技术提供一种电子发票查验方法,采用如下的技术方案:
3、获取待查验的电子发票的发票文件并对所述发票文件进行预处理,得到所述发票文件所对应的发票图片;
4、逐一对所述发票图片进行多模态识别并分别得到每张所述发票图片的识别结果,所述识别结果包括发票版式信息和发票数据信息;
5、依据所述发票数据信息从第三方平台获取所述电子发票的实际发票数据,结合所述实际发票数据对所述电子发票进行初次真伪性验证;
6、当所述初次真伪性验证通过后,依据所述发票版式信息和预存的发票模版对所述电子发票进行二次真伪性验证;
7、当所述二次真伪性验证通过后,输出所述电子发票的验证结果。
8、通过采用上述的技术方案,通过多模态识别技术识别出电子发票上的所有发票数据信息和发票版式信息,依次依据上述信息进行两次的真伪性验证,使得电子发票的识别结果拥有双层保障,更加准确,同时使用预存的发票模版进行匹配的方式能够支持多种模版的电子发票的查验,更加具有实用性。
9、优选地,所述获取待查验的电子发票的发票文件并对所述发票文件进行预处理,得到所述发票文件所对应的发票图片,具体包括如下步骤:
10、获取全部待查验的电子发票的发票文件,所述发票文件的上传方式为批量上传,对全部所述发票文件进行预处理,所述预处理包括解压处理和格式转换;
11、当上传的所述发票文件为压缩包时,对所述压缩包进行解压,对解压后得到的所述发票文件统一进行所述格式转换,得到每个所述发票文件对应的所述电子发票的发票图片。
12、通过采用上述的技术方案,将上传的发票文件进行统一的格式转换,使所有文件变成统一的图片格式,方便后续的识别和处理。
13、优选地,所述逐一对所述发票图片进行多模态识别并分别得到每张所述发票图片的识别结果,所述识别结果包括发票版式信息和发票数据信息,具体包括如下步骤:
14、对转换后得到的所述发票图片进行多模态识别,所述多模态识别包括图像识别和文字识别;所述图像识别包括二维码识别和票面图案识别,通过所述二维码识别得到所述电子发票的编码信息,所述编码信息包括发票号码和发票代码,通过所述票面图案识别得到所述电子发票上的全部版式元素以及所述版式元素的特征信息;通过ocr技术进行所述文字识别,提取所述电子发票中的文字信息,所述文字信息包括发票类型;
15、将所述编码信息和所述文字信息汇总成发票数据信息,将所述版式元素和所述特征信息汇总成发票版式信息通过采用上述的技术方案,详细说明了多模态识别的内容,通过多模态的识别能够对电子发票上所有存在的信息进行识别,为后续的电子发票查验提供了数据基础。
16、优选地,所述依据所述发票数据信息从第三方平台获取所述电子发票的实际发票数据,结合所述实际发票数据对所述电子发票进行初次真伪性验证,具体包括如下步骤:
17、建立与第三方平台之间的通信,依据所述发票数据信息中的所述发票号码和所述发票代码构造查询语句并提交给所述第三方平台的数据库,接收所述第三方平台返回的与所述发票号码、所述发票代码相对应的实际发票数据;
18、当所述实际发票数据不为空时,将所述实际发票数据与所述发票数据信息进行比对得到比对结果,当所述比对结果一致时,所述电子发票的初次真伪性验证通过,所述发票数据信息为真,当所述比对结果不一致时,所述初次真伪性验证不通过,认定所述电子发票为假;
19、当所述实际发票数据为空时,所述初次真伪性验证不通过,认定所述电子发票为假。
20、通过采用上述的技术方案,连接第三方的平台对识别到的发票数据信息的真伪性进行查验,同时也是对电子发票的初次真伪性验证,当无法查询到数据时可直接判定电子发票为假,当能够查询到数据时对二者的一致性进行比对,能够判定电子发票的发票数据信息的真实性。
21、优选地,所述当所述初次真伪性验证通过后,依据所述发票版式信息和预存的发票模版对所述电子发票进行二次真伪性验证,具体包括如下步骤:
22、若所述发票数据信息为真,依据所述发票类型获取预先存储的发票模版,从所述发票模版中提取期望发票版式信息,依据所述发票版式信息与所述期望发票版式信息进行模板匹配,从而判断所述发票文件的真伪性,所述模板匹配包括位置匹配、尺寸匹配以及间距匹配;
23、所述模板匹配包括以所述版式元素为索引,从所述特征信息中提取与所述版式元素相对应的实际特征、从所述期望发票版式信息中提取与所述版式元素相对应的期望特征,依据所述实际特征和所述期望特征分别计算各个所述版式元素的位置差异度、尺寸差异度以及间距差异度。
24、通过采用上述的技术方案,对识别到的发票版式信息的真伪性进行验证,即是对电子发票的二次真伪性验证,将发票版式信息和发票模版中提取到的期望发票版式信息进行匹配,计算每个版式元素的各种特征的差异度,分别计算多种特征的差异度能够使得匹配更加地精准,提高匹配精确度。
25、优选地,在所述依据所述实际特征和所述期望特征分别计算各个所述版式元素的位置差异度、尺寸差异度以及间距差异度之后,还包括如下步骤:
26、为各个所述版式元素的所述位置差异度、所述尺寸差异度以及所述间距差异度分别设置第一权重系数,并结合所述第一权重系数计算每个所述版式元素的版式元素差异度;
27、为各个所述版式元素分别设置第二权重系数,并依据所述第二权重系数和所述版式元素差异度计算所述发票文件的综合差异度;
28、当所述综合差异度不超过预设的差异度阈值时,所述电子发票的二次真伪性验证通过,所述发票文件为真,否则所述二次真伪性验证不通过。
29、通过采用上述的技术方案,通过设置两种权重系数能够保证差异度的最终计算结果更加地全面和稳定,降低计算出错的概率,使得最终差异度的计算更加具有可信度。
30、优选地,所述当所述二次真伪性验证通过后,输出所述电子发票的验证结果,具体包括如下步骤:
31、当所述二次真伪性验证通过后,认定所述电子发票为真,输出验证通过的结果;
32、当所述二次真伪性验证不通过时,根据所述初次真伪性验证的结果、所述版式元素差异度以及所述综合差异度生成验证报告并输出。
33、通过采用上述的技术方案,当二次真伪性验证不通过时将验证过程的相关数据进行输出生成报告,方便工作人员通过报告迅速获知不通过的原因,提升处理效率。
34、第二方面,本技术提供一种电子发票查验装置,采用如下的技术方案:
35、一种电子发票查验装置,包括如下模块:
36、发票处理模块,用于获取待查验的电子发票的发票文件并对所述发票文件进行预处理,得到所述发票文件所对应的发票图片;
37、发票识别模块,用于逐一对所述发票图片进行多模态识别并分别得到每张所述发票图片的识别结果,所述识别结果包括发票版式信息和发票数据信息;
38、初次真伪性验证模块,用于依据所述发票数据信息从第三方平台获取所述电子发票的实际发票数据,结合所述实际发票数据对所述电子发票进行初次真伪性验证;
39、二次真伪性验证模块,用于当所述初次真伪性验证通过后,依据所述发票版式信息和预存的发票模版对所述电子发票进行二次真伪性验证;
40、验证结果输出模块,用于当所述二次真伪性验证通过后,输出所述电子发票的验证结果。
41、通过采用上述的技术方案,搭建出了一套电子发票的批量查验体系,为电子发票文件的真伪性验证提供了必要的软件技术支撑,实现了全面且准确的批量电子发票的查验,为批量查验多种类型的电子发票提供了有力的支持。
42、第三方面,本技术提供了一种智能终端,采用如下的技术方案:
43、一种智能终端,包括存储器和处理器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现如前文所述的电子发票查验方法。
44、第四方面,本技术提供了一种计算机可读存储介质,采用如下的技术方案:
45、一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如前文所述的电子发票查验方法。
46、综上所述,本技术至少具有如下有益效果:
47、1.本技术通过集成多种验证方式,对发票及版式文件进行全面、细致的查验,不仅能够验证电子发票上的数据的真实性,还能比对发票文件与预设标准模版的差异,使得电子发票的识别结果拥有双层保障,更加准确,同时预存了多种类型的发票模版,能够支持多种类型的电子发票的查验,使本方法更加具有实用性。
1.一种电子发票查验方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的电子发票查验方法,其特征在于,所述获取待查验的电子发票的发票文件并对所述发票文件进行预处理,得到所述发票文件所对应的发票图片,具体包括如下步骤:
3.根据权利要求1所述的电子发票查验方法,其特征在于,所述逐一对所述发票图片进行多模态识别并分别得到每张所述发票图片的识别结果,所述识别结果包括发票版式信息和发票数据信息,具体包括如下步骤:
4.根据权利要求1所述的电子发票查验方法,其特征在于,所述依据所述发票数据信息从第三方平台获取所述电子发票的实际发票数据,结合所述实际发票数据对所述电子发票进行初次真伪性验证,具体包括如下步骤:
5.根据权利要求3所述的电子发票查验方法,其特征在于,所述当所述初次真伪性验证通过后,依据所述发票版式信息和预存的发票模版对所述电子发票进行二次真伪性验证,具体包括如下步骤:
6.根据权利要求5所述的电子发票查验方法,其特征在于,在所述依据所述实际特征和所述期望特征分别计算各个所述版式元素的位置差异度、尺寸差异度以及间距差异度之后,还包括如下步骤:
7.根据权利要求6所述的电子发票查验方法,其特征在于,所述当所述二次真伪性验证通过后,输出所述电子发票的验证结果,具体包括如下步骤:
8.一种电子发票查验装置,其特征在于,包括如下模块:
9.一种智能终端,其特征在于,包括存储器和处理器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的电子发票查验方法。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如权利要求1至7任一所述的电子发票查验方法。