首页> 中国专利> 交通事故影响因子预测方法、装置、设备及存储介质

交通事故影响因子预测方法、装置、设备及存储介质

摘要

本发明涉及大数据领域,公开了一种交通事故影响因子预测方法、装置、设备及存储介质。该方法包括:采用预置文本信息提取算法,从多条历史交通事故数据中提取多个第一影响因子;并将第一影响因子分别输入预置第一、第二预训练模型进行训练,以预测第一影响因子对交通事故的影响程度,得到对应的第一、第二预测结果;计算第一、第二预测结果的似然比,以调整第二预训练模型中的随机参数,得到预测模型;获取当前发生交通事故的第二影响因子,并采用预测模型预测各第二影响因子对当前发生交通事故的影响,以确定当前发生交通事故的影响因子。本发明还涉及区块链技术,所述交通事故数据存储于区块链中。本发明提升了行人交通安全因素分析的异质性。

著录项

  • 公开/公告号CN112561175A

    专利类型发明专利

  • 公开/公告日2021-03-26

    原文格式PDF

  • 申请/专利权人 深圳赛安特技术服务有限公司;

    申请/专利号CN202011506865.7

  • 发明设计人 王玥颖;

    申请日2020-12-18

  • 分类号G06Q10/04(20120101);G06Q50/26(20120101);G06F40/216(20200101);G06F40/284(20200101);G06F40/289(20200101);

  • 代理机构11321 北京市京大律师事务所;

  • 代理人姚维

  • 地址 518027 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)

  • 入库时间 2023-06-19 10:24:22

说明书

技术领域

本发明涉及大数据领域,尤其涉及一种交通事故影响因子预测方法、装置、设备及存储介质。

背景技术

随着公路里程的增加及基础设施的完善,其单位里程事故率和亿车公里死亡率趋于下降,但事故总量仍然居高不下,且事故的严重程度逐年上升,安全形势依然严峻,严重影响人民生命财产安全。因此,对公路交通事故进行成因分析,剖析交通事故的发生机理,并提出相应的安全改善措施,从源头上改善其交通安全状况,是十分有意义的。

传统的行人交通安全的因素影响分析方法是主要通过描述性的数据比较和趋势分析等方法来实现。当前交管部门、科研机构等,已采用多种统计方法来分析交通事故的影响因素及各影响因素的影响程度,其中,常见的统计模型包括多项式对数、有序对数、有序概率、贝叶斯分层模型、随机参数模型等。然而,上类标准的、固定参数的有序模型,不足以捕获事故模型数据中未观察到的异质性,例如针对老年人碰撞中,为考虑到老人的健康状况、道路交通特征以及驾驶员行为等,在固定参数模型中,假设估计的参数在所有观察中保持相同是不合适的。如果是针对一个重要的考虑因素,且当参数实际上在观察结果中是变化的,将参数限制为固定可能就会导致参数估计不一致,进而影响模型的效率低下且有偏差。因此,现有技术通过带固定参数的有序模型分析行人交通安全因素存在异质性不足的问题。

发明内容

本发明的主要目的在于解决现有技术通过带固定参数的有序模型分析行人交通安全因素存在异质性不足的技术问题。

本发明第一方面提供了一种交通事故影响因子预测方法,包括:

获取多条历史的交通事故数据,并采用预置文本信息提取算法,从所述各交通事故数据中提取交通事故中的多个第一影响因子;

获取第一预训练模型和第二预训练模型,其中,所述第二预训练模型相对于所述第一预训练模型增加了预置随机参数;

将所述第一影响因子分别输入所述第一预训练模型和所述第二预训练模型进行训练,以预测所述第一影响因子对所述交通事故的影响程度,得到对应的第一预测结果及第二预测结果;

计算所述第一预测结果和所述第二预测结果的似然比,并根据所述似然比,调整所述第二预训练模型中的随机参数,得到对应的预测模型;

获取当前发生的交通事故中的第二影响因子,并采用所述预测模型,预测所述各第二影响因子对当前发生的交通事故的影响程度;

根据所述影响程度,筛选符合预置条件的第二影响因子作为当前发生的交通事故的影响因子。

可选的,在本发明第一方面的第一种实现方式中,所述采用预置文本信息提取算法,从所述各交通事故数据中提取交通事故中的多个第一影响因子包括:

对所述各交通事故数据对应内容进行分词处理,得到多个分词,并采用预置先验知识,从所述各分词中提取交通事故中的影响分词;

统计所述各影响分词的出现频率,并根据所述出现频率由高至低,从所述影响分词中筛选预设数量的影响分词作为第一影响因子。

可选的,在本发明第一方面的第二种实现方式中,在所述根据所述出现频率由高至低,从所述影响分词中筛选预设数量的影响分词作为第一影响因子之后,还包括:

采用预置显著性测试算法,计算所述各第一影响因子的第一显著性得分;

判断所述显著性得分是否低于预置的得分阈值;

若是,则保留低于所述得分阈值的第一影响因子。

可选的,在本发明第一方面的第三种实现方式中,在所述获取多条历史的交通事故数据之后,还包括:

提取所述各交通事故数据中的标识信息、属性信息、数据结构信息;

根据所述标识信息、属性信息、数据结构信息,采用预置规则对所述交通事故数据进行检查,确定所述交通事故数据中的无效数据;

筛除所述交通事故数据中的无效数据。

可选的,在本发明第一方面的第四种实现方式中,所述计算所述第一预测结果和所述第二预测结果的似然比包括:

根据所述第一预测结果,确定所述第一影响因子的固定参数,以及根据所述第二预测结果,确定所述第一影响因子的随机参数;

根据所述固定参数,计算所述第一预训练模型训练后的第一对数似然值,以及根据所述随机参数,计算所述第二预训练模型训练后的第二对数似然值;计算所述第二对数似然值和所述第一对数似然值的差值,得到所述第一预测结果和所述第二预测结果的似然比。

可选的,在本发明第一方面的第五种实现方式中,所述交通事故数据还存储于区块链中。

本发明第二方面提供了一种交通事故影响因子预测装置,包括:

提取模块,用于获取多条历史的交通事故数据,并采用预置文本信息提取算法,从所述各交通事故数据中提取交通事故中的多个第一影响因子;

获取模块,用于获取第一预训练模型和第二预训练模型,其中,所述第二预训练模型相对于所述第一预训练模型增加了预置随机参数;

训练模块,用于将所述第一影响因子分别输入所述第一预训练模型和所述第二预训练模型进行训练,以预测所述第一影响因子对所述交通事故的影响程度,得到对应的第一预测结果及第二预测结果;

调整模块,用于计算所述第一预测结果和所述第二预测结果的似然比,并根据所述似然比,调整所述第二预训练模型中的随机参数,得到对应的预测模型;

预测模块,用于获取当前发生的交通事故中的第二影响因子,并采用所述预测模型,预测所述各第二影响因子对当前发生的交通事故的影响程度;

筛选模块,用于根据所述影响程度,筛选符合预置条件的第二影响因子作为当前发生的交通事故的影响因子。

可选的,在本发明第二方面的第一种实现方式中,所述提取模块包括:

分词单元,用于对所述各交通事故数据对应内容进行分词处理,得到多个分词,并采用预置先验知识,从所述各分词中提取交通事故中的影响分词;

筛选单元,用于统计所述各影响分词的出现频率,并根据所述出现频率由高至低,从所述影响分词中筛选预设数量的影响分词作为第一影响因子。

可选的,在本发明第二方面的第二种实现方式中,在所述筛选单元之后,还包括:

第一计算单元,用于采用预置显著性测试算法,计算所述各第一影响因子的第一显著性得分;

判别单元,用于判断所述显著性得分是否低于预置的得分阈值;若是,则保留低于所述得分阈值的第一影响因子。

可选的,在本发明第二方面的第三种实现方式中,在所述提取模块之后,还包括:

检查模块,用于提取所述各交通事故数据中的标识信息、属性信息、数据结构信息;根据所述标识信息、属性信息、数据结构信息,采用预置规则对所述交通事故数据进行检查,确定所述交通事故数据中的无效数据;

筛除模块,用于筛除所述交通事故数据中的无效数据。

可选的,在本发明第二方面的第四种实现方式中,所述调整模块包括:

确定单元,用于根据所述第一预测结果,确定所述第一影响因子的固定参数,以及根据所述第二预测结果,确定所述第一影响因子的随机参数;

第二计算单元,用于根据所述固定参数,计算所述第一预训练模型训练后的第一对数似然值,以及根据所述随机参数,计算所述第二预训练模型训练后的第二对数似然值;

第三计算单元,用于计算所述第二对数似然值和所述第一对数似然值的差值,得到所述第一预测结果和所述第二预测结果的似然比。

可选的,在本发明第二方面的第五种实现方式中,所述交通事故数据还存储于区块链中。

本发明第三方面提供了一种交通事故影响因子预测设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述交通事故影响因子预测设备执行上述的交通事故影响因子预测方法。

本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的交通事故影响因子预测方法。

本发明提供的技术方案中,通过提取交通事故数据中的多个第一影响因子,并分别输入第一预训练模型和第二预训练模型中进行训练,以分别预测第一影响因子对交通事故的影响程度,得到对应的第一预测结果和第二预测结果;然后通过第一预测定结果与第二预测结果计算两个模型输出结果的似然比,以比较两个模型的优劣;通过似然比调整第二预训练模型中的随机参数,以对第二预训练模型进行优化,直到得到最优第二预训练模型,即作为对应的预测模型;最后将当前发生的交通事故的各第二影响因子输入预测模型中,以预测各第二影响因子对交通事故的影响程度,通过增加随机参数筛选随机影响因子,提升预测模型对分析行人交通安全因素的异质性。

附图说明

图1为本发明交通事故影响因子预测方法的第一个实施例示意图;

图2为本发明交通事故影响因子预测方法的第二个实施例示意图;

图3为本发明交通事故影响因子预测方法的第三个实施例示意图;

图4为本发明交通事故影响因子预测方法的第四个实施例示意图;

图5为本发明交通事故影响因子预测装置的一个实施例示意图;

图6为本发明交通事故影响因子预测装置的另一个实施例示意图;

图7为本发明交通事故影响因子预测设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种交通事故影响因子预测方法、装置、设备及存储介质,用预置文本信息提取算法,从多条历史交通事故数据中提取多个第一影响因子;并将第一影响因子分别输入预置第一、第二预训练模型进行训练,以预测第一影响因子对交通事故的影响程度,得到对应的第一、第二预测结果;计算第一、第二预测结果的似然比,以调整第二预训练模型中的随机参数,得到预测模型;获取当前发生交通事故的第二影响因子,并采用预测模型预测各第二影响因子对当前发生交通事故的影响程度,以确定当前发生交通事故的影响因子。本发明提升预测模型对分析行人交通安全因素的异质性。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中交通事故影响因子预测方法的第一个实施例包括:

101、获取多条历史的交通事故数据,并采用预置文本信息提取算法,从所述各交通事故数据中提取交通事故中的多个第一影响因子;

可以理解的是,本发明的执行主体可以为交通事故影响因子预测装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。需要强调的是,为进一步保证上述交通事故数据的私密和安全性,上述交通事故数据还可以存储于一区块链的节点中。

本实施例中,可以从交通管理部门收集城市道路的交通事故数据,根据城市道路交通事故数据,按照事故发生地点、事故发生时间、事故类型、事故形态、事故原因及事故后果等进行分类统计,并以检索字段进行标识后,存储与数据库中;此处可根据所针对类型的交通事故获取对应的历史交通事故数据,比如欲分析夜晚的交通事故成因,则可选择时间段18:00-6:00的交通事故数据。

本实施例中,第一影响因子包括事故时间、路口几何设计、路口控制种类、限速、车辆种类、车辆注册种类、驾驶员性别、驾驶员是否主责、信号控制路口、单行路段、限速超过50km/h等。如果是针对老年行人的交通事故进行分析,则可能还包括老年行人年龄、老年人的运动状态等。

102、获取第一预训练模型和第二预训练模型,其中,所述第二预训练模型相对于所述第一预训练模型增加了预置随机参数;

本实施例中,第一预训练模型包含固定参数,第二预训练模型在第一预训练模型的基础上引入了随机参数,其中,第一预训练模型优选为一个Probit模型(服从正态分布的模型),具体的,固定参数与随机参数的设置可以参照以下函数:

β

其中,β

比如,固定影响因子包括事故时间、路口几何设计、路口控制种类、限速、车辆种类、车辆注册种类、驾驶员性别、驾驶员是否主责、老年行人年龄等,随机影响因子包括信号控制路口、单行路段、限速超过50km/h、老年行人的运动状态等;则在第一预训练模型中,为事故时间、路口几何设计、路口控制种类、限速、车辆种类、车辆注册种类、驾驶员性别、驾驶员是否主责、老年行人年龄、信号控制路口、单行路段、限速超过50km/h、老年行人的运动状态设置固定参数;在第二预训练模型中,为事故时间、路口几何设计、路口控制种类、限速、车辆种类、车辆注册种类、驾驶员性别、驾驶员是否主责、老年行人年龄设置固定参数,为信号控制路口、单行路段、限速超过50km/h、老年行人的运动状态设置随机参数。

103、将所述第一影响因子分别输入所述第一预训练模型和所述第二预训练模型进行训练,以预测所述第一影响因子对所述交通事故的影响程度,得到对应的第一预测结果及第二预测结果;

本实施例中,第一预训练模型和第二预训练模型需确定训练的关键点,若采用Probit模型,则关键点包括响应频率、实测值总数、因子、协变量;两个模型在于预测第一影响因子对交通事故的影响程度,故可以将第一影响因子作为协变量,第一影响因子对应发生的交通事故数量作为响应频率;发生的交通事故总数量作为实测值总数,此处只考量单类型交通事故的影响因素,故因子范围为[1,1];最后设置模型输出结果以概率的形式进行表示即可。设置完第一预训练模型和第二预训练模型训练的关键点后即可进行训练。

本实例中,第一影响因子对交通事故的影响程度以概率的形式进行表示,即各第一影响因子导致此类型的交通事故发生的概率值,其中,第一预训练模型输出第一预测结果,第二预训练模型输出第二预测结果。

104、计算所述第一预测结果和所述第二预测结果的似然比,并根据所述似然比,调整所述第二预训练模型中的随机参数,得到对应的预测模型;

本实施例中,通过计算第一预测结果和第二预测结果的似然比,然后通过似然比检验对应第一预训练模型和第二预训练模型的优劣;当第一预训练模型较优时,表明无需针对部分随机影响因子在第二预训练模型中引入对应的随机参数,需进行剔除,再重新进行训练;当第二预训练模型较优时,可继续对第二预训练模型进行迭代更新;直到模型再次收敛时停止,即可得到对应的预测模型。

105、获取当前发生的交通事故中的第二影响因子,并采用所述预测模型,预测所述各第二影响因子对当前发生的交通事故的影响程度;

106、根据所述影响程度,筛选符合预置条件的第二影响因子作为当前发生的交通事故的影响因子。

本实施例中,当前发生的交通事类型需与交通事故数据训练对应的交通事故类型相同,比如预测模型训练依托“老年行人”、“夜晚”相关的交通事故数据进行训练,则该预测模型仅在用于预测“带有老年行人”、“夜晚”的交通事故中,各第二影响因子的影响程度时适用。其中,第二影响因子指的是可能造成当前发生的交通事故的影响因素,包括事故时间、路口几何设计、路口控制种类、限速、车辆种类、车辆注册种类、驾驶员性别、驾驶员是否主责、信号控制路口、单行路段、限速超过50km/h等。

具体的,可选取典型场景,例如“老年社区”、“夜晚”条件下发生的交通事故,分析各第二影响因子影响“老年行人”交通事故的影响程度,发现信号灯路口、道路设施的光照程度等属于随机影响因子,但是对老人行人的交通事故影响较大。此项发现有助于道路交通管理部门加强针对老年社区的交通安全管理,针对信号灯路口、社区照明系统进行专项管理和监察,提出并实施交通安全改善措施。

本发明实施例中,通过提取交通事故数据中的多个第一影响因子,并分别输入第一预训练模型和第二预训练模型中进行训练,以分别预测第一影响因子对交通事故的影响程度,得到对应的第一预测结果和第二预测结果;然后通过第一预测定结果与第二预测结果计算两个模型输出结果的似然比,以比较两个模型的优劣;通过似然比调整第二预训练模型中的随机参数,以对第二预训练模型进行优化,直到得到最优第二预训练模型,即作为对应的预测模型;最后将当前发生的交通事故的各第二影响因子输入预测模型中,以预测各第二影响因子对交通事故的影响程度,通过增加随机参数筛选随机影响因子,提升预测模型对分析行人交通安全因素的异质性。

请参阅图2,本发明实施例中交通事故影响因子预测方法的第二个实施例包括:

201、获取多条历史的交通事故数据;

202、对所述各交通事故数据对应内容进行分词处理,得到多个分词,并采用预置先验知识,从所述各分词中提取交通事故中的影响分词;

本实施例中,采用分词工具对各交通事故数据对应的内容进行分词,采用的分词工具包括:HMM(Hidden Markov Model,隐马尔科夫模型)、CRF(Conditional RandomField,条件随机场模型)、ME((Maximum Entropy Model,最大熵模型)、N-gram(N元文法模型)、SVM(support vector machines,支持向量机)等。

本实施例中,通过建立一个专门的数据处理模型,该模型集成了交通事故影响因子的数据处理经验作为先验知识,将各分词依次输入该数据处理模型中,即可识别出该分词是否为交通事故中的影响分词。

203、统计所述各影响分词的出现频率,并根据所述出现频率由高至低,从所述影响分词中筛选预设数量的影响分词作为第一影响因子;

本实施例中,依托大数据的统计分析结果,统计各影响分词的出现频率,自动输出一个可能的影响因子库,其中,影响因子库中的各影响分词按照出现频率的高低进行排序;而对于出现频率比较低的影响分词,可以认定为对交通事故的影响较为微小,故不予考虑,只筛选预设数量的影响分词作为第一影响因子即可。

204、采用预置显著性测试算法,计算所述各第一影响因子的第一显著性得分;

205、判断所述显著性得分是否低于预置的得分阈值,若是,则保留低于所述得分阈值的第一影响因子;

本实施例中,通过建立专门的显著性测试算法,基于概率统计方法,计算各第一影响因子的P-value(Probability-value,显著值),并于预先设定的P-value的得分阈值进行对比,只有P-value低于得分阈值的第一影响因子才会进入下一步第一预训练模型和第二预训练模型的训练中。

206、获取第一预训练模型和第二预训练模型,其中,所述第二预训练模型相对于所述第一预训练模型增加了预置随机参数;

207、将所述第一影响因子分别输入所述第一预训练模型和所述第二预训练模型进行训练,以预测所述第一影响因子对所述交通事故的影响程度,得到对应的第一预测结果及第二预测结果;

208、计算所述第一预测结果和所述第二预测结果的似然比,并根据所述似然比,调整所述第二预训练模型中的随机参数,得到对应的预测模型;

209、获取当前发生的交通事故中的第二影响因子,并采用所述预测模型,预测所述各第二影响因子对当前发生的交通事故的影响程度;

210、根据所述影响程度,筛选符合预置条件的第二影响因子作为当前发生的交通事故的影响因子。

本发明实施例中,详细介绍了交通事故数据中第一影响因子的提取过程,通过先验知识提取交通事故数据中的影响分词,通过统计各影响分词的出现频率,初步筛选预置数量出现频率较高的影响分词作为第一影响因子,再通过预置显著性测试算法,保留第一显著性得分低于预置得分阈值的第一影响因子,保证最终得到的第一影响因子对交通事故影响的全面性。

请参阅图3,本发明实施例中交通事故影响因子预测方法的第三个实施例包括:

301、获取多条历史的交通事故数据;

302、提取所述各交通事故数据中的标识信息、属性信息、数据结构信息;

本实施例中,可通过在存储交通事故数据的数据库中定义标准数据字段、属性字段和数据结构字段等,其中,标准数据字段作为交通事故数据的标识信息,属性字段作为其属性信息,数据结构字段作为其数据结构信息;然后再编写数据一致性检查、数据缺失检查、数据查重等规则,形成数据库编译语言。

303、根据所述标识信息、属性信息、数据结构信息,采用预置规则对所述交通事故数据进行检查,确定所述交通事故数据中的无效数据;

304、筛除所述交通事故数据中的无效数据;

本实施例中,对于根据标识信息、属性信息、数据结构信息对交通事故数据进行分组排序,然后根据各类对应的规则对交通事故数据进行检查,以排查其中的无效数据。

具体的,例如对交通事故数据进行数据查重,针对标识字段,例如事故时间、涉事车辆车牌等进行分组排序,然后用count(*)函数计数,其中没有重复的纪录为1,所有反馈结果大于1的,即为重复的记录。针对完全重复的交通事故数据,可以通过delete删除;针对部分重复的数据,可以合并或补全。

305、采用预置文本信息提取算法,从所述各交通事故数据中提取交通事故中的多个第一影响因子;

306、获取第一预训练模型和第二预训练模型,其中,所述第二预训练模型相对于所述第一预训练模型增加了预置随机参数;

307、将所述第一影响因子分别输入所述第一预训练模型和所述第二预训练模型进行训练,以预测所述第一影响因子对所述交通事故的影响程度,得到对应的第一预测结果及第二预测结果;

308、计算所述第一预测结果和所述第二预测结果的似然比,并根据所述似然比,调整所述第二预训练模型中的随机参数,得到对应的预测模型;

309、获取当前发生的交通事故中的第二影响因子,并采用所述预测模型,预测所述各第二影响因子对当前发生的交通事故的影响程度;

310、根据所述影响程度,筛选符合预置条件的第二影响因子作为当前发生的交通事故的影响因子。

本发明实施例中,具体介绍了如何初步筛除交通事故数据中的无效数据,通过交通事故中包含的标识信息、属性信息、数据结构信息,确定重复出现、部分数据缺失、数据结构有误的交通事故数据并进行筛除,以减少交通事故数据中的噪音数据,增加模型训练的效率。

请参阅图4,本发明实施例中交通事故影响因子预测方法的第四个实施例包括:

401、获取多条历史的交通事故数据,并采用预置文本信息提取算法,从所述各交通事故数据中提取交通事故中的多个第一影响因子;

402、获取第一预训练模型和第二预训练模型,其中,所述第二预训练模型相对于所述第一预训练模型增加了预置随机参数;

403、将所述第一影响因子分别输入所述第一预训练模型和所述第二预训练模型进行训练,以预测所述第一影响因子对所述交通事故的影响程度,得到对应的第一预测结果及第二预测结果;

404、根据所述第一预测结果,确定所述第一影响因子的固定参数,以及根据所述第二预测结果,确定所述第一影响因子的随机参数;

本实施例中,假定参数β

β

其中μ

405、根据所述固定参数,计算所述第一预训练模型训练后的第一对数似然值,以及根据所述随机参数,计算所述第二预训练模型训练后的第二对数似然值;

本实施例中,根据不同的第一预训练模型,各固定参数与各随机参数的随机分布规律亦不同,需采用对应公式计算第一预训练模型和第二预训练模型的对数似然值。具体的,若第一预训练函数采用Probit模型,则各固定参数与各随机参数服从正态分布,假设Xi=β

其中,当x=β'时,InL(μ,σ

406、计算所述第二对数似然值和所述第一对数似然值的差值,得到所述第一预测结果和所述第二预测结果的似然比;

本实施例中,第一预测结果和第二预测结果的似然比计算公式如下所示:

LR=-2[InL(μ,σ

其中,LR(Likelihood Ratio,似然比)值与预置的卡方检验值进行对比,如果LR值大于卡方检验值,则引入随机参数的第二预训练模型并不比只有固定参数的第一预训练模型优秀,即无需针对某部分第一影响因子引入随机参数。

407、根据所述似然比,调整所述第二预训练模型中的随机参数,得到对应的预测模型;

408、获取当前发生的交通事故中的第二影响因子,并采用所述预测模型,预测所述各第二影响因子对当前发生的交通事故的影响程度;

409、根据所述影响程度,筛选符合预置条件的第二影响因子作为当前发生的交通事故的影响因子。

本发明实施例中,详细介绍了固定参数与随机参数的预训练模型,其预测结果的似然比计算过程,通过分别计算第一预训练模型中的固定参数的第一对数似然值,和计算第二预训练模型中随机参数的第二对数似然值,然后求两者的差值,以确定第一、第二预测结果的似然比,通过似然比可以确定随机参数的优劣性,以及调整随机参数的值,以提升最后预测模型的优度。

上面对本发明实施例中交通事故影响因子预测方法进行了描述,下面对本发明实施例中交通事故影响因子预测装置进行描述,请参阅图5,本发明实施例中交通事故影响因子预测装置一个实施例包括:

提取模块501,用于获取多条历史的交通事故数据,并采用预置文本信息提取算法,从所述各交通事故数据中提取交通事故中的多个第一影响因子;

获取模块502,用于获取第一预训练模型和第二预训练模型,其中,所述第二预训练模型相对于所述第一预训练模型增加了预置随机参数;

训练模块503,用于将所述第一影响因子分别输入所述第一预训练模型和所述第二预训练模型进行训练,以预测所述第一影响因子对所述交通事故的影响程度,得到对应的第一预测结果及第二预测结果;

调整模块504,用于计算所述第一预测结果和所述第二预测结果的似然比,并根据所述似然比,调整所述第二预训练模型中的随机参数,得到对应的预测模型;

预测模块505,用于获取当前发生的交通事故中的第二影响因子,并采用所述预测模型,预测所述各第二影响因子对当前发生的交通事故的影响程度;

筛选模块506,用于根据所述影响程度,筛选符合预置条件的第二影响因子作为当前发生的交通事故的影响因子。

本发明实施例中,通过提取交通事故数据中的多个第一影响因子,并分别输入第一预训练模型和第二预训练模型中进行训练,以分别预测第一影响因子对交通事故的影响程度,得到对应的第一预测结果和第二预测结果;然后通过第一预测定结果与第二预测结果计算两个模型输出结果的似然比,以比较两个模型的优劣;通过似然比调整第二预训练模型中的随机参数,以对第二预训练模型进行优化,直到得到最优第二预训练模型,即作为对应的预测模型;最后将当前发生的交通事故的各第二影响因子输入预测模型中,以预测各第二影响因子对交通事故的影响程度,通过增加随机参数筛选随机影响因子,提升预测模型对分析行人交通安全因素的异质性。

请参阅图6,本发明实施例中交通事故影响因子预测装置的另一个实施例包括:

提取模块501,用于获取多条历史的交通事故数据,并采用预置文本信息提取算法,从所述各交通事故数据中提取交通事故中的多个第一影响因子;

获取模块502,用于获取第一预训练模型和第二预训练模型,其中,所述第二预训练模型相对于所述第一预训练模型增加了预置随机参数;

训练模块503,用于将所述第一影响因子分别输入所述第一预训练模型和所述第二预训练模型进行训练,以预测所述第一影响因子对所述交通事故的影响程度,得到对应的第一预测结果及第二预测结果;

调整模块504,用于计算所述第一预测结果和所述第二预测结果的似然比,并根据所述似然比,调整所述第二预训练模型中的随机参数,得到对应的预测模型;

预测模块505,用于获取当前发生的交通事故中的第二影响因子,并采用所述预测模型,预测所述各第二影响因子对当前发生的交通事故的影响程度;

筛选模块506,用于根据所述影响程度,筛选符合预置条件的第二影响因子作为当前发生的交通事故的影响因子。

具体的,所述提取模块包括:

分词单元5011,用于对所述各交通事故数据对应内容进行分词处理,得到多个分词,并采用预置先验知识,从所述各分词中提取交通事故中的影响分词;

筛选单元5012,用于统计所述各影响分词的出现频率,并根据所述出现频率由高至低,从所述影响分词中筛选预设数量的影响分词作为第一影响因子。

具体的,在所述筛选单元之后,还包括:

第一计算单元5013,用于采用预置显著性测试算法,计算所述各第一影响因子的第一显著性得分;

判别单元5014,用于判断所述显著性得分是否低于预置的得分阈值;若是,则保留低于所述得分阈值的第一影响因子。

具体的,在所述提取模块之后,还包括:

检查模块507,用于提取所述各交通事故数据中的标识信息、属性信息、数据结构信息;根据所述标识信息、属性信息、数据结构信息,采用预置规则对所述交通事故数据进行检查,确定所述交通事故数据中的无效数据;

筛除模块508,用于筛除所述交通事故数据中的无效数据。

具体的,所述调整模块包括:

确定单元5041,用于根据所述第一预测结果,确定所述第一影响因子的固定参数,以及根据所述第二预测结果,确定所述第一影响因子的随机参数;

第二计算单元5042,用于根据所述固定参数,计算所述第一预训练模型训练后的第一对数似然值,以及根据所述随机参数,计算所述第二预训练模型训练后的第二对数似然值;

第三计算单元5043,用于计算所述第二对数似然值和所述第一对数似然值的差值,得到所述第一预测结果和所述第二预测结果的似然比。

具体的,所述交通事故数据还存储于区块链中。

本发明实施例中,详细介绍了交通事故数据中第一影响因子的提取过程,通过先验知识与预置显著性测试算法,确定及保留出现频率高、第一显著性得分低于预置得分阈值的第一影响因子,保证最终得到的第一影响因子对交通事故影响的全面性;具体介绍了如何初步筛除交通事故数据中的无效数据,以减少交通事故数据中的噪音数据,增加模型训练的效率。;详细介绍了固定参数与随机参数的预训练模型,其预测结果的似然比计算过程,通过第一、第二预测结果的似然比,可以确定随机参数的优劣性,并调整随机参数的值,以提升最后预测模型的优度。

上面图5和图6从模块化功能实体的角度对本发明实施例中的交通事故影响因子预测装置进行详细描述,下面从硬件处理的角度对本发明实施例中交通事故影响因子预测设备进行详细描述。

图7是本发明实施例提供的一种交通事故影响因子预测设备的结构示意图,该交通事故影响因子预测设备700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)710(例如,一个或一个以上处理器)和存储器720,一个或一个以上存储应用程序733或数据732的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器720和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对交通事故影响因子预测设备700中的一系列指令操作。更进一步地,处理器710可以设置为与存储介质730通信,在交通事故影响因子预测设备700上执行存储介质730中的一系列指令操作。

交通事故影响因子预测设备700还可以包括一个或一个以上电源740,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口760,和/或,一个或一个以上操作系统731,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图7示出的交通事故影响因子预测设备结构并不构成对交通事故影响因子预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

本发明还提供一种交通事故影响因子预测设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述交通事故影响因子预测方法的步骤。

本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述交通事故影响因子预测方法的步骤。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号