本发明涉及应用生成与数据集成,具体是基于自然语言的零代码应用生成与数据集成方法。
背景技术:
1、自然语言是指人类用于日常交流的语言,通常是通过口语和书面形式进行表达的,自然语言技术的使用可以使得非技术用户也能以自然语言进行数据操作和应用生成,降低了用户对编程语言和技术知识需求,可以让用户更加广泛的参与到应用开发和数据处理过程中,并且通过自然语言了解技术,用户可以快速的描述他们需要的需求,通过解析这些需求可以自动生成应用程序的框架,进一步加快了应用程序开发的过程,同时,通过自然语言用户可以更加自然地描述数据源和集成需求,简化数据融合的过程中。
2、通过自然语言可以快速的进行应用生成与数据集成,但是在实际的应用生成与数据集成的过程中,平台需要根据用户的输入的自然语言去进行相应操作,但是由于自然语言的本身就很模糊,再加上不同用户的表述习惯和风格各异,因此对于同样的意图不同的用户的表述方式可能大不相同,平台很难准确的理解用户的真实含义,这不仅仅会使得用户的体验感下降,甚至还有还有可能导致用户失去对平台的信任,从而影响品牌形象和用户的信赖度。
技术实现思路
1、本发明的目的在于提供基于自然语言的零代码应用生成与数据集成方法,以解决现有技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:基于自然语言的零代码应用生成与数据集成方法,方法包括:
3、步骤s100:构建自然语言处理云平台,获取用户的历史输入记录,从历史输入记录中提取出文本信息,分析用户不同的历史输入记录之间的文本信息近似程度,得到近似历史输入记录;
4、步骤s200:获取平台根据历史输入记录输出的历史输出数据,获取历史输入记录的近似历史输入记录,评估历史输入记录,与近似历史输入记录之间的历史输出数据的数据差异性,得到目标近似历史输入记录;
5、步骤s300:获取历史输入记录的文本信息中的关键词,分析历史输入记录,与目标近似历史输入记录之间的文本信息中的关键词的语义近似程度,得到目标关键词替换数据;
6、步骤s400:对当前周期内用户在平台上输入的自然语言信息的进行获取,获取用户的目标关键词替换数据,对当前周期内的用户的输入的信息内容进行优化调整,并生成目标数据,在平台上向用户进行展示;
7、进一步的,步骤s100包括:
8、步骤s101:构建自然语言处理云平台,获取用户进行应用生成与数据集成时,在平台输入的自然语言并进行记录,得到用户的历史输入记录,从历史输入记录中提取出文本信息;
9、步骤s102:获取用户的各个历史输入记录的文本信息,对历史输入记录中的文本信息进行预处理,得到历史输入记录中的关键词组;
10、步骤s103:获取关键词组中的第a个关键词的特征值df(a);
11、步骤s104:分析用户不同的历史输入记录之间的文本信息近似程度,其中,分析第b个历史输入记录与第c个历史输入记录之间的文本信息近似程度,得到第c个历史输入记录与第b个历史输入记录的文本信息近似值;
12、步骤s105:当文本信息近似值pc,b大于预设的文本信息近似阈值,判定第c个历史输入记录与第b个历史输入记录之间的文本信息近似,获取第c个历史输入记录和第b个历史输入记录对应的用户输入信息的时间点,当第c个历史输入记录对应的时间点小于第b个历史输入记录的时间点,将第b个历史输入记录记为第c个历史输入记录的近似历史输入记录,反之,则将第c个历史输入记录,记为第b个历史输入记录的近似历史输入记录。
13、进一步的,步骤s103中,获取第a个关键词的特征值的具体过程包括:
14、计算历史输入记录的关键词组中的各个关键词的特征文档频率,其中,关键词组中的第a个关键词的特征逆文档频率f(a):
15、
16、其中,nsum表示为各个历史输入记录的总个数;na表示为含有第a个关键词的历史输入记录的总个数;
17、计算历史输入记录中的第a个关键词的特征值df(a):
18、df(a)=f(a)×qa,
19、其中,qa表示为第a个关键词,在历史输入记录中的文本信息中出现的频率。
20、进一步的,步骤s104中,获取第c个历史输入记录与第b个历史输入记录的文本信息近似值具体过程包括:
21、分析用户不同的历史输入记录之间的文本信息近似程度,其中,分析第b个历史输入记录与第c个历史输入记录之间的文本信息近似程度的具体过程为,获取第c个历史输入记录和第b个历史输入记录的关键词组;
22、获取第c个历史输入记录,与第b个历史输入记录的关键词组中的各个关键词的特征值,根据特征值,将第c个历史输入记录和第b个历史输入记录中的文本信息转化为数值向量组;
23、计算第c个历史输入记录与第b个历史输入记录的文本信息近似值pc,b:
24、
25、其中,y表示为第c个历史输入记录的数值向量组中的元素的总个数;bz表示为第b个历史输入记录的数值向量组中的第z个的元素;cz表示为第c个历史输入记录的数值向量组中的第z个的元素。
26、进一步的,步骤s200包括:
27、步骤s201:当用户在平台内输入自然语言的文本信息后,平台根据用户输入的文本信息进行内容生成,并在平台上将生成内容输出给用户,得到平台的输出数据;
28、步骤s202:获取获取平台根据历史输入记录输出的历史输出数据,获取历史输入记录的近似历史输入记录,评估历史输入记录,与历史输入记录的某一近似历史输入记录之间的历史输出数据的数据差异性,具体评估过程为,分别历史输入记录,与某一近似历史输入记录的历史输出数据中提取出平台生成的代码;
29、步骤s203:使用代码格式化工具,对生成的代码进行格式化,并代码内的注释和空白行进行移除,并对代码进行预处理;
30、步骤s204:分析历史输入记录,与某一近似历史输入记录之间代码中的各个字符串之间的字符串相似程度,得到历史输入记录的各个字符串,与某一近似历史输入记录的各个字符串的字符串相似度;
31、步骤s205:评估历史输入记录,与近似历史输入记录之间的历史输出数据的数据差异性,得到历史输入记录的目标近似历史输入记录;
32、上述步骤中对历史输入记录,与近似历史输入记录之间的历史输出数据的数据差异性进行评估,是因为历史输入记录与某一近似历史输入记录之间的用户输入的文本信息被判定为相似,但是多次进行相似的内容的输入,则表面用户使用自然语言输入的文本信息平台输出的内容,与用户的实际需求不符,所以通过评估历史输入记录,与近似历史输入记录之间的历史输出数据的数据差异性,以及历史输入记录的时间顺序,就可以快速的找到用户实际想要输入的内容,从而提高了后续对用户输入内容的优化效果。
33、进一步的,步骤s204中获取历史输入记录的各个字符串,与某一近似历史输入记录的各个字符串的字符串相似度的具体过程包括:
34、分析历史输入记录的某一近似历史输入记录之间代码中的各个字符串之间的字符串相似程度,其中,历史输入记录的代码的第d个字符串,与某一近似历史输入记录的代码中的第p个字符串的字符串相似度程度具体分析为,创建二维数组dp,设置二维数组dp的大小为m×n,其中,m表示为历史输入记录中的第d个字符串中的字符的总个数,n表示为某一近似历史输入记录中的第p个字符串中的字符的总个数,第d个字符串与第p个字符串,为历史输入记录与某一近似历史输入记录相对应的字符串;
35、其中,计算二维数组dp中的第i行第j列元素dp[i,j]的特征编辑距离,dp[i,j]的特征编辑距离具体为计算公式为:
36、
37、其中,di表示为第d个字符串中的第i个字符;pj表示为第p个字符串中的第j个字符;dp[i-1,j-1]表示为二维数组dp中的第i-1行第j-1列元素;dp[i,j-1]表示为二维数组dp中的第i行第j-1列元素;dp[i-1,j]表示为二维数组dp中的第i-1行第j列元素;
38、获取二维数组dp中的dp[m,n]的特征编辑距离,计算历史输入记录的代码的第d个字符串,与某一近似历史输入记录的代码中的第p个字符串的字符串相似度rd,p:
39、
40、其中,|d|表示为历史输入记录的代码的第d个字符串的长度;|p|表示为某一近似历史输入记录的代码中的第p个字符串的长度;
41、获取历史输入记录的各个字符串,与某一近似历史输入记录的各个字符串的字符串相似度。
42、进一步的,步骤s205中对历史输入记录,与近似历史输入记录之间的历史输出数据的数据差异性进行评估的具体过程包括:
43、获取历史输入记录的代码的各个字符串,与某一近似历史输入记录的代码中的各个字符串的字符串相似度的平均值,并将平均值的倒数,作为历史输入记录与某一近似历史输入记录的输出差异值;
44、获取历史输入记录与相应的若干个历史近似输入记录的输出差异值,并将输出差异值的最大值对应的历史近似输入记录,判定最大值对应的历史近似输入记录,与历史输入记录的历史输出数据的数据差异性最大,将最大值对应的历史近似输入记录,记为历史输入记录的目标近似历史输入记录。
45、进一步的,步骤s300包括:
46、步骤s301:对用户的历史输入记录的文本信息的关键词组进行获取,获取历史输入记录的目标近似历史输入记录的关键词组;
47、步骤s302:分析目标近似历史输入记录,与历史输入记录之间的关键词组中的不同关键词的语义近似程度,获取历史输入记录的第α个关键词,与目标近似历史输入记录的关键词组中的各个关键词的特征语义近似值;
48、步骤s303:当目标近似历史输入记录的关键词组中的某一关键词,与第α个关键词的特征语义近似值,在各个关键词的特征语义近似值中为最大值,将某一关键词,为第α个关键词的目标替换关键词;
49、步骤s304:获取用户的若干个关键词的若干个目标替换关键词,并将若干个关键词的若干个目标替换关键词进行汇集,得到用户的目标关键词替换数据。
50、进一步的,步骤s302中,对历史输入记录的第α个关键词,与目标近似历史输入记录的关键词组中的各个关键词的特征语义近似值的具体获取过程包括:
51、分别将历史输入记录,与目标近似历史输入记录的关键词组内的各个关键词转化为向量;
52、计算历史输入记录,与目标近似历史输入记录中的各个关键词之间的特征语义近似值,其中,历史输入记录中的第α个关键词,与目标近似历史输入记录中的第β个关键词的特征语义近似值uα,β:
53、
54、其中,α表示为第α个关键词对应的向量;β表示为第β个关键词对应的向量。
55、进一步的,步骤s400包括:
56、步骤s401:对当前周期内的用户在平台上输入的自然语言信息进行获取,并将当前周期内用户输入的自然语言信息转化为文本信息;
57、步骤s402:对用户的目标关键词替换数据进行获取,对当前周期内用户输入文本信息进行关键词提取,并根据目标关键词替换数据,使用关键词对应的目标替换关键词,对当前周期内用户输入文本信息中的关键词进行替换,对当前周期内的用户的输入的信息内容进行优化调整,平台基于优化调整后的文本信息输出目标数据,并在平台上将目标数据向用户进行展示。
58、与现有技术相比,本发明的有益效果是:本发明实现了根据用户输入的自然语言去个性化进行应用生成与数据集成,考虑在用户实际输入过程中,不同用户的表述方式和表述习惯各不相同,因此本发明在对用户输入的自然语言进行分析时,以用户自己的历史记录为参考,对用户输入的表述进行优化和调整,使得平台可以准确的对用户输入的内容进行理解,做到真正的个性化对用户进行分析,使得用户的体验感提高,增强对平台的依赖性。
1.基于自然语言的零代码应用生成与数据集成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于自然语言的零代码应用生成与数据集成方法,其特征在于,所述步骤s100包括:
3.根据权利要求2所述的基于自然语言的零代码应用生成与数据集成方法,其特征在于,所述步骤s103中,获取第a个关键词的特征值的具体过程包括:
4.根据权利要求2所述的基于自然语言的零代码应用生成与数据集成方法,其特征在于,所述步骤s104中,获取所述第c个历史输入记录与所述第b个历史输入记录的文本信息近似值具体过程包括:
5.根据权利要求2所述的基于自然语言的零代码应用生成与数据集成方法,其特征在于,所述步骤s200包括:
6.根据权利要求5所述的基于自然语言的零代码应用生成与数据集成方法,其特征在于,所述步骤s204中获取历史输入记录的各个字符串,与某一近似历史输入记录的各个字符串的字符串相似度的具体过程包括:
7.根据权利要求6所述的基于自然语言的零代码应用生成与数据集成方法,其特征在于,所述步骤s205中对历史输入记录,与近似历史输入记录之间的历史输出数据的数据差异性进行评估的具体过程包括:
8.根据权利要求5所述的基于自然语言的零代码应用生成与数据集成方法,其特征在于,所述步骤s300包括:
9.根据权利要求8所述的基于自然语言的零代码应用生成与数据集成方法,其特征在于,所述步骤s302中,对所述历史输入记录的所述第α个关键词,与所述目标近似历史输入记录的关键词组中的各个关键词的特征语义近似值的具体获取过程包括:
10.根据权利要求9所述的基于自然语言的零代码应用生成与数据集成方法,其特征在于,所述步骤s400包括: