个人征信数据不平衡结构处理及特征选择

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文数据来源为“东证期货杯”全国大学生统计建模大赛中选题二提供的贷款机构历史业务数据[1]。首先，针对数据缺失，对连续变量根据数据缺失率分别采用删除法和多重填补法处理，名义变量采用特殊类别法处理；在信用数据不平衡问题上，结合K均值算法欠抽样与SMOTE过抽样组合抽样方法在处理数据不平衡问题上有较好的预测效果。其次，在变量体系指标选择方面，改进了logistic回归的Lasso估计，采用四种信用评分模型对变量选择方法进行比较：针对不同模型特点，该变量选择方法对预测结果有不同程度提升。最后，经过实验比较可得，随机森林分类精度高；logistic回归总体分类精度略低于其他模型，但对于数据中少类样本的识别要高于一般模型；决策树模型分类精度略低于随机森林，但对数据中少类样本识别率不高。

著录项

作者
石荣平;
展开▼
作者单位

暨南大学;

展开▼
授予单位暨南大学;
学科应用统计
授予学位硕士
导师姓名吴池业;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类科学、科学研究;金融、银行;
关键词
征信数据; 不平衡; 结构处理;

相似文献

中文文献
外文文献
专利

1. 个人征信数据沉淀问题探析 [J] . 谢新泉 . 征信 . 2017,第012期
2. 积极探索个人征信数据元推动征信标准化建设 [J] . 李勇 . 征信 . 2012,第004期
3. 个人征信数据责任主体及其权利义务问题探析 [J] . 马延彬 . 征信 . 2012,第006期
4. 个人征信数据质量现场核查验收工作的开展模式探讨——基于中国建设银行现场核查验收工作的实践 [J] . 翟光明 ,刘瑛娜 ,刘丽丽 . 征信 . 2011,第001期
5. 提高个人征信数据质量的对策 [J] . 李富强 ,张睿 . 甘肃金融 . 2010,第012期
6. 不平衡情感分类中的特征选择方法研究 [C] . 王志昊 ,王中卿 ,李寿山 . 第六届全国青年计算语言学会议 . 2012
7. 山东省农村信用社个人征信数据处理系统的设计与实现 [A] . 赵涛 . 2012

个人征信数据不平衡结构处理及特征选择

目录

摘要

著录项

相似文献

相关主题

期刊订阅