首页> 中国专利> 一种基于复用的竞赛数据集自动化处理系统及方法

一种基于复用的竞赛数据集自动化处理系统及方法

摘要

本发明提出了一种基于复用的竞赛数据集自动化处理系统及方法,通过本发明的技术方案,可以对原始数据集进行自动整理和划分,并上传到竞赛网站服务器上。其中,包括对原始数据集进行自动整理和分割和上传,生成竞赛网站数据集,以解决现有技术中人工整理和分割数据集造成的代码不能复用,整理效率低下,以及分割后的子数据集样本不符合整个数据集样本的概率密度分布问题。本发明设计的分割数据集的方法可以对标注属性为类别、标注属性为数值以及多属性标注的数据进行分层抽样,提高了抽样的准确性,使得分割出的子数据集合中的数据分布更符合原数据集的数据分布。

著录项

  • 公开/公告号CN110389978B

    专利类型发明专利

  • 公开/公告日2020-10-23

    原文格式PDF

  • 申请/专利权人 北京智能工场科技有限公司;

    申请/专利号CN201910645848.2

  • 申请日2019-07-17

  • 分类号G06F16/25(20190101);G06F21/62(20130101);G06N20/00(20190101);

  • 代理机构11715 北京君莫知识产权代理事务所(普通合伙);

  • 代理人崔云鹤

  • 地址 100193 北京市海淀区东北旺西路8号院4号楼四层421-48

  • 入库时间 2022-08-23 11:18:17

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号