首页> 中文学位 >基于机器学习的网络流量分类系统设计与实现
【6h】

基于机器学习的网络流量分类系统设计与实现

代理获取

目录

1 绪 论

1.1 研究背景

1.2 国内外研究现状

1.3 研究意义与目的

1.4 论文主要工作

2 网络流量识别与分类技术

2.1 网络流量识别与分类的基础概念

2.2 基于熟知端口号

2.3 基于应用层特征签名

2.4 基于应用流的统计特征

2.5 本章小结

3 基于机器学习的网络流量分类算法

3.1 朴素贝叶斯

3.2 支持向量机

3.3 C4.5决策树

3.4 本章小结

4 在线网络流量分类模型设计

4.1 流量分类模型构建过程

4.2 数据预处理

4.3 数据模型

4.4 流量分类模型构建与验证结果分析

4.5 本章小结

5 在线网络流量分类原型系统设计与实现

5.1 系统平台搭建

5.2 功能模块设计与实现

5.3 系统测试

5.4 本章小结

6 总结与展望

6.1 总结

6.2 后续工作展望

致谢

参考文献

展开▼

摘要

近年来,互联网已经成为人类社会生活的重要组成部分。网络流量管理对于保障互联网的正常运行,满足各种不同服务质量的要求具有至关重要的作用。网络流量识别与分类是网络流量管理的核心技术。成功地识别和分类网络流量能够为进一步进行流量控制、监测、统计以及服务质量保证等网络管理操作提供前期的技术保证。
  网络流量识别可以采用多种技术手段,包括基于端口、网络应用特征签名、网络流量统计特征等的流量识别技术。机器学习是一种利用数据集训练出模型,再利用模型预测目标数据属性的方法。论文将机器学习中的一些经典算法应用在网络流量分类领域,进而比较各种算法的分类效果,为实际工程应用提供必要的参考。论文主要完成工作如下:
  ①研究了几种经典的机器学习分类算法。分析了算法的原理和各自的特点,结合网络流量的数据特性来得到它们在网络流量识别与分类中的应用结合点。
  ②提出了一种针对在线网络流量分类的数据模型。数据模型根据属性的信息增益率排名以及实验验证结果选择流量特征属性。对基于此数据模型建立的分类模型进行评估,验证该数据模型对缩短流量特征处理时间,简化分类模型结构的有效性。
  ③分析比较了3种基于机器学习算法构建的网络流量分类模型的性能。首先,基于不同的抽样策略对样本数据集进行抽样获取训练集,分别使用朴素贝叶斯、支持向量机和C4.5决策树3种机器学习算法构建流量分类模型,并在测试集上对这3种分类模型进行验证。然后根据模型的分类准确率,召回率以及训练和验证的时间消耗等性能指标评估各分类模型在处理在线网络流量分类问题时的性能表现。
  ④设计并开发了一个基于机器学习的在线网络流量分类原型系统。该原型系统采用B/S模式,选择分类效果较优的流量分类模型作为分类模块,可以对10种应用类别的网络流量进行在线识别与分类,实现了网络流量监控,可视化图表展示分类的统计结果以及根据属性条件筛选查询特定流量信息等功能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号