首页> 中文会议>2018中国保险与风险管理国际年会 >基于机器学习的车险索赔频率研究

基于机器学习的车险索赔频率研究

摘要

我国机动车辆保险行业发展迅速、规模巨大,车险的保费收入在财产险中一直位居首位,近几年来,其比重达到70%以上.车险费率厘定一直是保险公司的重点研究方向,其核心是对保险损失进行预测,包含索赔强度预测和索赔频率预测.本文重点研究索赔频率的预测方法,传统上最为广泛使用的是广义线性模型,但其过多依赖于模型的分布假设,且不能很好的刻画解释变量之间的相依性问题.近年来,随着大数据和机器学习的迅速发展,有不少学者尝试将机器学习算法应用到车险领域,研究结果显示机器学习在某些方面优于广义线性模型,但这些结果一般只基于某个单一数据集.本文将在六个来自不同国家不同类型的车险数据上比较广义线性模型与机器学习方法的效果,其中包括深度学习算法、随机森林、支持向量机、xgboost等机器学习方法.特别的,其中一个数据集为车险团体客户数据,它与通常的散车业务有很大的不同,例如其不能使用从人因子,同一车队内的车辆索赔有相依关系(组内不独立性)等,这使得普通广义线性模型并不能很好地处理这一数据.本文的具体方法为:首先基于训练集,建立不同的广义线性模型预测索赔频率,根据最小信息准则(AIC)选取最优的广义线性模型;然后应用机器学习算法(包括深度学习算法、随机森林、支持向量机、xgboost等),通过交叉验证确定模型参数.最后基于测试集,计算广义线性模型和机器学习的均方误差,比较机器学习算法与广义线性模型的性能.本文的结果显示在所有的数据集上,xgboost的预测效果一致的优于广义线性模型.但是对于某些自变量较多、变量间相关性强、索赔频率数据越大的数据集,神经网络、深度学习和随机森林的预测效果比xgboost更好.此外,支持向量机的效果要次于广义线性模型.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号