首页> 外文会议>コンピュータセキュリティシンポジウム2018論文集 >侵入検知モデル構築における能動学習と無作為選択を用いたラベリングコスト削減手法の検討
【24h】

侵入検知モデル構築における能動学習と無作為選択を用いたラベリングコスト削減手法の検討

机译:基于主动学习和随机选择的入侵检测模型构建降低标签成本的方法研究

获取原文
获取原文并翻译 | 示例

摘要

機械学習を用いた侵入検知システム構築には,大量の教師データが必要となるため個々のデータにラベルを付ける手作業に高いコストがかかる.筆者らは,学習効率の高いデータを選択的に利用する手法である能動学習を適用してラベリングコストの削減を試みた.しかし,学習初期の教師データ数が少ない状態においては,能動学習による効果がみられず,無作為にデータを選択した場合より精度が低くなるという問題が確認された.そこで本研究では,極少量の教師データを用いて初期の分類モデルを構築し,学習済みデータが少ない時期には無作為にデータ選択を行い,途中から能動学習によるデータ選択に切り替える手法を用いて学習の進行状況に依らずラベリングコストを削減可能か検討する.常に無作為にデータを選択した場合を比較対象として分類精度を評価し,同程度の精度を得るのに必要な教師データの数を調査した.
机译:使用机器学习来构建入侵检测系统需要大量的老师数据,因此手动标记每个数据非常昂贵。作者试图通过应用主动学习来降低标签成本,主动学习是一种选择性地使用具有高学习效率的数据的方法。但是,当在学习开始时教师数据的数量较少时,未观察到由于主动学习而产生的\ r \ n的影响,并且确认该问题不如随机选择数据时准确。因此,在本研究中,我们使用非常少量的训练数据构建初始分类模型,并在训练数据很少的情况下随机选择数据,并积极地从中间学习。我们将通过使用切换到数据选择的方法,研究是否可以降低标签成本,而不管学习进度如何。我们通过比较随机选择的数据来评估分类准确性,并调查了获得相同准确性所需的训练数据的数量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号