首页> 中文学位 >HTTPS应用分类技术研究
【6h】

HTTPS应用分类技术研究

代理获取

目录

第1章绪论

1.1课题背景

1.2国内外研究现状

1.3本文的研究内容

1.4本文的组织结构

第2章HTTPS流量识别技术综述

2.1 HTTPS协议分析

2.2流量识别相关概念

2.3流量识别方法概述

2.4本章小结

第3章HTTPS应用分类系统的设计

3.1 HTTPS流量识别

3.2 server name扩展域分析

3.3证书分析

3.4 HTTPS流量标注

3.5本章小结

第4章HTTPS应用分类算法研究

4.1离线数据获取

4.2 HTTPS指纹识别算法

4.3基于机器学习的识别算法

4.4基于改进的BOG识别算法

4.5三种分类算法的比较

4.6本章小结

第5章HTTPS应用分类系统的实现

5.1系统开发和运行环境

5.2在线流量采集

5.3 HTTPS应用分类系统的实现

5.4 HTTPS应用分类系统的实验结果评估

5.5本章小结

结论

参考文献

攻读学位期间发表的学术论文

声明

致谢

展开▼

摘要

随着网络技术的快速发展,用户个人隐私问题越来越得到人们的重视,因此HTTPS加密技术得到了深入研究并被广泛应用到网页访问中。然而一些受限制的网站通过使用HTTPS让用户访问,以此来传播危害社会稳定的言论。传统的基于端口和载荷的流量识别方法无法识别HTTPS的加密流量,因而对网络管理提出了更高的要求。为了更好地管理网络流量,需要对HTTPS应用分类进行研究。
  本文通过对HTTPS协议的深入研究,提出了一种HTTPS协议特征和端口识别相结合的方法来识别网络中的HTTPS流量。同时利用SSL握手过程中server name扩展域信息和证书信息来标记HTTPS不用应用,通过对证书和扩展域进行统计分析,把扩展域和网络应用之间存在的对应关系作为先验知识应用到后续分类研究中。接着深入研究了三种HTTPS应用分类算法:HTTPS指纹识别算法、基于机器学习识别算法和基于改进的BOG识别算法。本文针对对指纹选择和特征选取方面做了改进:针对HTTPS指纹识别算法,通过实验对比选取了SSL分片长度序列作为HTTPS的指纹信息;而针对基于机器学习的识别算法,重点在机器学习算法选择和特征选取方面做了研究,最终选取C4.5算法作为机器学习的核心和SSL分片大小作为机器学习的特征。在离线环境下对三种分类算法进行对比实验,结果表明基于机器学习的识别算法在HTTPS应用分类中表现最好,分类的精度和召回率均达到95%以上。最后设计实现了HTTPS在线应用分类系统,选取了离线环境下表现最好的机器学习的识别算法作为分类系统的核心。实验结果表明在线应用识别准确率在91%以上。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号