首页> 中国专利> 一种利用违规问题分析自动生成审计试题的方法

一种利用违规问题分析自动生成审计试题的方法

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明公开了一种利用违规问题分析自动生成审计试题的方法，首先，利用文本分析技术，通过对比审计知识库中的法律法规及典型违规案例，提取出违规关键信息，以键值对的方式构建违规问题数据库；然后，从违规问题数据库中，随机抽取1条记录，构成试题母版；接着，将试题母版中每条记录的键与值进行相关度匹配，提取试题母版的出题点；最后，根据出题点是数值类型还是文本类型，搜索例外选项NL，并结合试题母版中的案例，从而形成审计试题。通过上述方式，本发明能够有效构建审计试题，特征是针对违规案例比较多，且分类较明确的审计知识库的试题生成。

著录项

公开/公告号CN112966105A

专利类型发明专利
公开/公告日2021-06-15

原文格式PDF
申请/专利权人南京审计大学;
展开▼

申请/专利号CN202110242032.2
发明设计人陈勇;徐超;
展开▼

申请日2021-03-04
分类号G06F16/35(20190101);G06F16/36(20190101);G06F40/289(20200101);G06F40/30(20200101);G06Q10/06(20120101);
代理机构32218 南京天华专利代理有限责任公司;
代理人刘畅;徐冬涛
地址 210000 江苏省南京市浦口区江浦街道雨山西路86号
入库时间 2023-06-19 11:26:00

说明书

技术领域

本发明属于文本分析及模式识别领域，特别是涉及一种利用违规问题分析自动生成审计试题的方法。

背景技术

随着审计重要性的日益突显，对审计人员的专业素质要求也越来越强。审计考试作为检验审计人员专业素养的重要手段，其考试试题的科学性、针对性尤为重要。但审计业务的越来越丰富，审计知识也越来越多，如果按照传统的手工输入试题的方式，其试题的体量和重要知识点的覆盖率将受到很大的限制。如何联系实际，从大量审计知识中自动抽取出重要而普遍的知识点，形成审计试题，是实现全方位高质量考察审计人员专业素质的重要研究方向。审计知识点虽然比较多，但每年公布的审计违规案例也不少，每一个违规案例中均潜藏有该案例的领域、该案例所违反的法律法规条目，只要能够有效的利用这些信息，就能够很好的了解当前审计的重点及常见的问题。而对于这些信息，大部分都是文本信息，且有固定的格式，同时，现有的自然语言处理技术也正处于高速发展阶段，利用计算机自动提取这些文本中的语义信息成为了可能。

在利用审计知识库构建试题时，如何结合考察的知识点高效快捷的生成试题题干及其选项，一直是试题自动生成的难点。

发明内容

为解决上述问题，本发明利用违规问题信息的分析，结合相关的审计法律法规，提出一种利用违规问题分析自动生成审计试题的方法。

技术方案：

所述方法包括以下步骤：

(1)利用文本分析与自然语言处理技术，通过对比审计知识库中的法律法规及典型违规案例，提取出违规关键信息，以键值对的方式构建违规问题数据库；

(2)从违规问题数据库中，随机抽取1条记录，构成试题母版；

(3)试题母版分析，将试题母版中每条记录的键与值进行相关度匹配，提取试题母版的出题点；

(4)根据出题点是数值类型还是文本类型，利用语义匹配模板，搜索例外选项构建反例列表NL，并结合试题母版中的案例，形成审计试题。

优选的，步骤(1)中违规问题数据库每条记录的数据结构用表示，其中K为键，表示该违规条目所对应的关键知识点；其中v1表示典型违规案例在审计知识库中的索引地址，v2表示其违规所对应的所有法律法规，每个条目用“《法律法规名称》：条目编号”表示，条目之间用分号分隔。

优选的，v2是根据给定的违规特征模板，按照模式匹配的方式在违规案例中搜索得到的；K是利用文本分析技术从v2中提取获得的。

优选的，步骤(3)中在提取试题母版出题点时，首先将母版中涉及的有关法规条款的数字提取出来作为基本出题点，然后再采用文本的相似度进行计算，包括以下几个步骤：

-提取v1中有关法律法规条款的数字d1以及v2中的数值数据d2；

-用母版的K值与v2进行相似度计算，获得v2中与K相关的单词列表m；

-根据母版的v1，从审计知识库中提取对应的案例p；

-对p的内容进行分词，用m的每一个词与p的每个分词进行相似度计算，提取出p的分词中与m的某个分词相似度大于阈值的单词，形成可选单词列表L；

-基于d1、d2、m与L，构建成两个映射{v1:(d1,L),v2:(d2,m)}，作为出题点。其中，v1:(d1,L)表示原始案例v1与可用于出题的变量部分之间的映射关系，v2:(d2,m)表示考察的法律法规与具体的考察知识点法规内容之间的映射关系。。

优选的，步骤(4)中从出题点中随机挑选一个映射，根据具体出题点的类型的不同，分别进行如下操作，构建出题点例外选项：

a)如果出题点t是数值数据，则直接使用如下公式进行例外选项e的构建：

其中ceil是向上取整函数,rand是随机数生成函数，能够随机生成一个(0,1)之间的小数；判断计算获得的例外选项e是否满足条件：e与t同符号，且e与t不同；是则结束，否则再次利用上式计算获得新的例外选项e进行上述判断；

b)如果出题点t是文本数据，则搜索与t语义相反的词，具体按照如下步骤进行：

i.利用语义匹配模板，搜索与t语义相反的词形成反例列表NL；

ii.如果NL的个数小于4，则通过人机交互的方式提示由人工补充输入n个与t语义相反的词，并将该词加入到语义匹配模板，n>1。

优选的，用于文本类型出题点的语义匹配模板表示为,其中key为关键字，即匹配的文本，N表示与key语义相反的文本列表，Y表示与key语义相似的文本列表。

优选的，在利用语义匹配模板进行匹配时：

-如果存在与t完全匹配的key值，则首先提取其中所有的N值，然后依次遍历key所对应的Y值，将模板中与Y相匹配的key所对应的N值也提取出来，然后合并形成最终的反例列表NL；

-如果不存在于t完全匹配的key值，则通过文本的相似度计算，将相似度大于某个阈值的所有key值作为匹配结果，然后依次提取key值中的N并合并，形成反例列表NL。

优选的，在通过人机交互方式人工输入的反例M，在加入到语义匹配模板时依次进行如下操作：

-在语义匹配模板中搜索与t相同的key值，如果找到，则将人工输入的反例M加入到匹配的key值所对应的N的列表中；否则，新建以t为key值，M为N值的匹配项；

-依次遍历M中的每一项m，在语义匹配模板中搜索与m相同的key值，如果找到，则将M中除m以外的项加入到key值所对应的Y中。

优选的，在生成试题时，从NL中随机抽取三个，与出题点t相结合，形成对应的4个选项，然后根据试题母版的v1提取审计案例的内容，并将其中与出题点匹配的文字扣除，构成题干，最终从而完成审计试题的生成。

本发明的有益效果

本发明从违规问题信息中提取出题点，并通过文本分析和模式匹配有效构建相关选项，能够有效生成审计试题，特别是针对违规案例比较多，且分类较明确的审计知识库的审计试题生成。

附图说明

图1是本发明审计试题自动生成的示意图；

图2违规问题数据库每条记录示意图；

图3是违规案例的示意图；

图4是《XX省行政事业性收费管理办法》第十、十八条的示意图；

图5是违规问题数据库条目的示意图；

图6是生成的试题示意图。

具体实施方式

下面结合附图对本发明的较佳实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域技术人员理解，从而对本发明的保护范围做出更为清楚明确的界定。

结合图1，一种利用违规问题分析自动生成审计试题的方法，他包括：

(2)从违规问题数据库中，随机抽取1条记录，构成试题母版；

(3)试题母版分析，将试题母版中每条记录的键与值进行相关度匹配，提取试题母版的出题点；

(4)根据出题点是数值类型还是文本类型，利用语义匹配模板，搜索例外选项构建反例列表NL，并结合试题母版中的案例，形成审计试题。

其中，违规问题数据库每条记录定义为如图2所示的数据结构，该结构可以用表示，其中K为键，表示该违规条目所对应的关键知识点；其中v1表示典型违规案例在审计知识库中的索引地址，v2表示其违规所对应的所有法律法规，它通过链表的形式表示。v2是根据给定的违规特征模板，按照模式匹配的方式在违规案例中搜索得到的；K是利用文本分析技术从v2中提取获得的。

在一个具体实例中，采用本发明方法对审计知识库中如图3所示的索引为13的违规案例进行文本分析，发现其内容主要同年检费相关，所涉及的法规是《XX省行政事业性收费管理办法》的第十条和第十八条，这两条对应的内容如图3所示；接着对比分析该违规案例与相应法规，发现其与收费许可证相关，因此提取“收费许可证”作为本案例的一个知识点。然后构成一个如图5所示条目，加入到违规问题数据库。通过逐案例分析，使得违规问题数据库的案例数据不断丰富。

接着，当需要进行审计试题生成时，将从违规问题数据库中随机抽取一个条目作为试题母版。此处抽取的条目如图4所示。

然后，将图3中有关法律法规条目号的“十”和“十八”提取出来，并转为数值数据“10”和“18”，作为d1，图4中的所有数值数据提取出来，此处没有，所以d2为空。接着，将图5的关键字“收费许可证”与图3的文本进行相似度匹配，发现匹配项有“收费许可证”；再与图4所示文本进行相似度匹配，发现匹配项也为“收费许可证”。因而建立出题点集合为{13：(10，18，“收费许可证”)，“《XX省行政事业性收费管理办法》：10；《XX省行政事业性收费管理办法》：18”：(“收费许可证”)}。

接着，从出题点集合中随机选择一个出题点，为(13：10)。由于10是一个数值数据，且是一个整数，所以利用e＝ceil(t×(1.5-rand()))计算3个反例选项。rand()的值为0.4，则计算结果为ceil(10×(1.5-0.4))＝11，rand()的值为0.8，则计算结果为ceil(10×(1.5-0.8))＝7，这样通过不同的rand()取值，可以获得3个不同于10的不同数值数据。实施例中这三个选项分别为7,11,13。

最后，我们将索引13所对应的图3所示的示例取出来，从其中找到数值10的位置，并把该值去除，然后结合构建的3个反例选项，则生成了对应的审计试题，如图6所示。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种利用违规问题分析自动生成审计试题的方法 [P] . 中国专利： CN112966105B . 2021.09.10
2. 一种利用违规问题分析自动生成审计试题的方法 [P] . 中国专利： CN112966105A . 2021-06-15
3. METHOD FOR AUTOMATICALLY GENERATING ISSUE ANALYSIS REPORT BASED ON BIG DATA MINING [P] . 韩国专利： KR20170073427A . 2017-06-28

机译：大数据挖掘的自动生成问题分析报告的方法
4. Exam questions provide and review system, exam questions provides system, review system, server, providing method of exam questions, and review how [P] . 日本专利： JP4176739B2 . 2008-11-05

机译：试题提供与复习系统，试题提供系统，复习系统，服务器，试题提供方法以及复习方式
5. Exam questions provides system, exam questions provides equipment, exam questions provides a method and program for executing its way into computer [P] . 日本专利： JP4004299B2 . 2007-11-07

机译：考试题提供系统，考试题提供设备，考试题提供将其执行到计算机中的方法和程序