首页> 中国专利> 一种利用违规问题分析自动生成审计试题的方法

一种利用违规问题分析自动生成审计试题的方法

摘要

本发明公开了一种利用违规问题分析自动生成审计试题的方法,首先,利用文本分析技术,通过对比审计知识库中的法律法规及典型违规案例,提取出违规关键信息,以键值对的方式构建违规问题数据库;然后,从违规问题数据库中,随机抽取1条记录,构成试题母版;接着,将试题母版中每条记录的键与值进行相关度匹配,提取试题母版的出题点;最后,根据出题点是数值类型还是文本类型,搜索例外选项NL,并结合试题母版中的案例,从而形成审计试题。通过上述方式,本发明能够有效构建审计试题,特征是针对违规案例比较多,且分类较明确的审计知识库的试题生成。

著录项

  • 公开/公告号CN112966105A

    专利类型发明专利

  • 公开/公告日2021-06-15

    原文格式PDF

  • 申请/专利权人 南京审计大学;

    申请/专利号CN202110242032.2

  • 发明设计人 陈勇;徐超;

    申请日2021-03-04

  • 分类号G06F16/35(20190101);G06F16/36(20190101);G06F40/289(20200101);G06F40/30(20200101);G06Q10/06(20120101);

  • 代理机构32218 南京天华专利代理有限责任公司;

  • 代理人刘畅;徐冬涛

  • 地址 210000 江苏省南京市浦口区江浦街道雨山西路86号

  • 入库时间 2023-06-19 11:26:00

说明书

技术领域

本发明属于文本分析及模式识别领域,特别是涉及一种利用违规问题分析自动生成审计试题的方法。

背景技术

随着审计重要性的日益突显,对审计人员的专业素质要求也越来越强。审计考试作为检验审计人员专业素养的重要手段,其考试试题的科学性、针对性尤为重要。但审计业务的越来越丰富,审计知识也越来越多,如果按照传统的手工输入试题的方式,其试题的体量和重要知识点的覆盖率将受到很大的限制。如何联系实际,从大量审计知识中自动抽取出重要而普遍的知识点,形成审计试题,是实现全方位高质量考察审计人员专业素质的重要研究方向。审计知识点虽然比较多,但每年公布的审计违规案例也不少,每一个违规案例中均潜藏有该案例的领域、该案例所违反的法律法规条目,只要能够有效的利用这些信息,就能够很好的了解当前审计的重点及常见的问题。而对于这些信息,大部分都是文本信息,且有固定的格式,同时,现有的自然语言处理技术也正处于高速发展阶段,利用计算机自动提取这些文本中的语义信息成为了可能。

在利用审计知识库构建试题时,如何结合考察的知识点高效快捷的生成试题题干及其选项,一直是试题自动生成的难点。

发明内容

为解决上述问题,本发明利用违规问题信息的分析,结合相关的审计法律法规,提出一种利用违规问题分析自动生成审计试题的方法。

技术方案:

所述方法包括以下步骤:

(1)利用文本分析与自然语言处理技术,通过对比审计知识库中的法律法规及典型违规案例,提取出违规关键信息,以键值对的方式构建违规问题数据库;

(2)从违规问题数据库中,随机抽取1条记录,构成试题母版;

(3)试题母版分析,将试题母版中每条记录的键与值进行相关度匹配,提取试题母版的出题点;

(4)根据出题点是数值类型还是文本类型,利用语义匹配模板,搜索例外选项构建反例列表NL,并结合试题母版中的案例,形成审计试题。

优选的,步骤(1)中违规问题数据库每条记录的数据结构用表示,其中K为键,表示该违规条目所对应的关键知识点;其中v1表示典型违规案例在审计知识库中的索引地址,v2表示其违规所对应的所有法律法规,每个条目用“《法律法规名称》:条目编号”表示,条目之间用分号分隔。

优选的,v2是根据给定的违规特征模板,按照模式匹配的方式在违规案例中搜索得到的;K是利用文本分析技术从v2中提取获得的。

优选的,步骤(3)中在提取试题母版出题点时,首先将母版中涉及的有关法规条款的数字提取出来作为基本出题点,然后再采用文本的相似度进行计算,包括以下几个步骤:

-提取v1中有关法律法规条款的数字d1以及v2中的数值数据d2;

-用母版的K值与v2进行相似度计算,获得v2中与K相关的单词列表m;

-根据母版的v1,从审计知识库中提取对应的案例p;

-对p的内容进行分词,用m的每一个词与p的每个分词进行相似度计算,提取出p的分词中与m的某个分词相似度大于阈值的单词,形成可选单词列表L;

-基于d1、d2、m与L,构建成两个映射{v1:(d1,L),v2:(d2,m)},作为出题点。其中,v1:(d1,L)表示原始案例v1与可用于出题的变量部分之间的映射关系,v2:(d2,m)表示考察的法律法规与具体的考察知识点法规内容之间的映射关系。。

优选的,步骤(4)中从出题点中随机挑选一个映射,根据具体出题点的类型的不同,分别进行如下操作,构建出题点例外选项:

a)如果出题点t是数值数据,则直接使用如下公式进行例外选项e的构建:

其中ceil是向上取整函数,rand是随机数生成函数,能够随机生成一个(0,1)之间的小数;判断计算获得的例外选项e是否满足条件:e与t同符号,且e与t不同;是则结束,否则再次利用上式计算获得新的例外选项e进行上述判断;

b)如果出题点t是文本数据,则搜索与t语义相反的词,具体按照如下步骤进行:

i.利用语义匹配模板,搜索与t语义相反的词形成反例列表NL;

ii.如果NL的个数小于4,则通过人机交互的方式提示由人工补充输入n个与t语义相反的词,并将该词加入到语义匹配模板,n>1。

优选的,用于文本类型出题点的语义匹配模板表示为,其中key为关键字,即匹配的文本,N表示与key语义相反的文本列表,Y表示与key语义相似的文本列表。

优选的,在利用语义匹配模板进行匹配时:

-如果存在与t完全匹配的key值,则首先提取其中所有的N值,然后依次遍历key所对应的Y值,将模板中与Y相匹配的key所对应的N值也提取出来,然后合并形成最终的反例列表NL;

-如果不存在于t完全匹配的key值,则通过文本的相似度计算,将相似度大于某个阈值的所有key值作为匹配结果,然后依次提取key值中的N并合并,形成反例列表NL。

优选的,在通过人机交互方式人工输入的反例M,在加入到语义匹配模板时依次进行如下操作:

-在语义匹配模板中搜索与t相同的key值,如果找到,则将人工输入的反例M加入到匹配的key值所对应的N的列表中;否则,新建以t为key值,M为N值的匹配项;

-依次遍历M中的每一项m,在语义匹配模板中搜索与m相同的key值,如果找到,则将M中除m以外的项加入到key值所对应的Y中。

优选的,在生成试题时,从NL中随机抽取三个,与出题点t相结合,形成对应的4个选项,然后根据试题母版的v1提取审计案例的内容,并将其中与出题点匹配的文字扣除,构成题干,最终从而完成审计试题的生成。

本发明的有益效果

本发明从违规问题信息中提取出题点,并通过文本分析和模式匹配有效构建相关选项,能够有效生成审计试题,特别是针对违规案例比较多,且分类较明确的审计知识库的审计试题生成。

附图说明

图1是本发明审计试题自动生成的示意图;

图2违规问题数据库每条记录示意图;

图3是违规案例的示意图;

图4是《XX省行政事业性收费管理办法》第十、十八条的示意图;

图5是违规问题数据库条目的示意图;

图6是生成的试题示意图。

具体实施方式

下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。

结合图1,一种利用违规问题分析自动生成审计试题的方法,他包括:

(1)利用文本分析与自然语言处理技术,通过对比审计知识库中的法律法规及典型违规案例,提取出违规关键信息,以键值对的方式构建违规问题数据库;

(2)从违规问题数据库中,随机抽取1条记录,构成试题母版;

(3)试题母版分析,将试题母版中每条记录的键与值进行相关度匹配,提取试题母版的出题点;

(4)根据出题点是数值类型还是文本类型,利用语义匹配模板,搜索例外选项构建反例列表NL,并结合试题母版中的案例,形成审计试题。

其中,违规问题数据库每条记录定义为如图2所示的数据结构,该结构可以用表示,其中K为键,表示该违规条目所对应的关键知识点;其中v1表示典型违规案例在审计知识库中的索引地址,v2表示其违规所对应的所有法律法规,它通过链表的形式表示。v2是根据给定的违规特征模板,按照模式匹配的方式在违规案例中搜索得到的;K是利用文本分析技术从v2中提取获得的。

在一个具体实例中,采用本发明方法对审计知识库中如图3所示的索引为13的违规案例进行文本分析,发现其内容主要同年检费相关,所涉及的法规是《XX省行政事业性收费管理办法》的第十条和第十八条,这两条对应的内容如图3所示;接着对比分析该违规案例与相应法规,发现其与收费许可证相关,因此提取“收费许可证”作为本案例的一个知识点。然后构成一个如图5所示条目,加入到违规问题数据库。通过逐案例分析,使得违规问题数据库的案例数据不断丰富。

接着,当需要进行审计试题生成时,将从违规问题数据库中随机抽取一个条目作为试题母版。此处抽取的条目如图4所示。

然后,将图3中有关法律法规条目号的“十”和“十八”提取出来,并转为数值数据“10”和“18”,作为d1,图4中的所有数值数据提取出来,此处没有,所以d2为空。接着,将图5的关键字“收费许可证”与图3的文本进行相似度匹配,发现匹配项有“收费许可证”;再与图4所示文本进行相似度匹配,发现匹配项也为“收费许可证”。因而建立出题点集合为{13:(10,18,“收费许可证”),“《XX省行政事业性收费管理办法》:10;《XX省行政事业性收费管理办法》:18”:(“收费许可证”)}。

接着,从出题点集合中随机选择一个出题点,为(13:10)。由于10是一个数值数据,且是一个整数,所以利用e=ceil(t×(1.5-rand()))计算3个反例选项。rand()的值为0.4,则计算结果为ceil(10×(1.5-0.4))=11,rand()的值为0.8,则计算结果为ceil(10×(1.5-0.8))=7,这样通过不同的rand()取值,可以获得3个不同于10的不同数值数据。实施例中这三个选项分别为7,11,13。

最后,我们将索引13所对应的图3所示的示例取出来,从其中找到数值10的位置,并把该值去除,然后结合构建的3个反例选项,则生成了对应的审计试题,如图6所示。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号