声明
目 录
第 1 章 绪论
1.1研究背景及意义
1.2国内外研究现状
1.2.1文本表示方法国内外研究
1.2.2 文本分类方法国内外研究
1.3本文主要工作
1.4论文组织结构
第 2 章 相关理论技术
2.1文本分类流程
2.2文本预处理
2.2.1文本分词
2.2.2去除停用词与提取词干
2.2.3去除非法格式字符
2.3文本表示模型
2.3.1离散表示
2.3.2分布表示
2.4文本分类常用算法
2.4.1 K 近邻分类算法
2.4.2支持向量机算法
2.4.3卷积神经网络
2.4.4循环神经网络
2.5注意力机制
2.5.1层次注意力
2.5.2前馈注意力
2.5.3多头自注意力
2.6深度学习框架介绍
2.7相关知识库
本章小结
第 3 章 基于知识库统计信息的短文本分类方法
3.1相关特征加权计算方法
3.1.1 布尔权重
3.1.2词频
3.1.3逆文档频率
3.1.4词频-逆文档频率
3.2权重计算方法
3.3分类流程及实现
3.3.1特征加权流程
3.3.2整体分类流程
3.4实验结果分析
3.4.1数据集
3.4.2分类器及评价标准
3.4.3实验结果
本章小结
第 4 章 融入知识库概念信息的短文本分类方法
4.1词嵌入表示
4.2概念表示
4.3 CAE-CNN 分类模型
4.3.1输入编码层
4.3.2短文本卷积层
4.3.3 softmax 分类层
4.4实验分析
4.4.1实验数据集
4.4.2实验参数设置
4.4.3对比实验方法及实验结果分析
4.5基于深度学习的变体方法
4.5.1实验设置
4.5.2实验结果和分析
本章小结
结 论
参考文献
附录 A 攻读工程硕士学位期间研究成果
致谢
湖南大学;