声明
1 绪论
1.1 研究背景及意义
1.2 国内外现状
1.2.1 自杀诱因研究现状
1.2.2 自杀诱因中的语言特征的研究现状
1.2.3 自杀意念检测研究现状
1.3 研究工作及贡献
1.4 本章小结
2 相关知识
2.1 逻辑回归
2.1.1Logistic Distribution
2.1.2 逻辑回归模型
2.1.3 模型参数估计
2.1.4 逻辑回归算法的特性与优缺点
2.2 支持向量机
2.2.1 感知机模型
2.2.2 线性可分支持向量机
2.2.3 线性支持向量机与软间隔最大化
2.2.4 非线性支持向量机与核函数
2.2.5 支持向量机的优缺点
2.3 朴素贝叶斯
2.4 随机森林
2.4.1 Bagging
2.4.2 随机森林
2.4.3 随机森林优缺点
2.5 本章小结
3 自杀词典
3.1 自杀词典的构建
3.2 词汇特征的量化
3.2.1 TF-IDF模型
3.2.2 词汇特征的量化
3.3 本章小结
4 词性特征
4.1 词性特征的构建
4.2 词性特征的量化
4.3 本章小结
5 实验与结果
5.1 数据预处理
5.1.1 数据清洗
5.1.2 数据标注
5.2 n-gram特征
5.2.1 原理
5.2.2 应用
5.3 实验工具
5.2 Python库
5.3 参数配置
5.3.1 逻辑回归参数配置
5.3.2 SVM参数配置
5.3.3 朴素贝叶斯参数配置
5.3.4 随机森林参数配置
5.3.5 参数对模型性能的影响
5.4 实验
5.4.1 提出假设
5.4.2 实验设置
5.4.3 模型评估方法
5.4.4 实验过程
5.5 实验结果与分析
5.5.1 不同算法下的模型评估
5.5.2 组间模型评估
5.6 本章小结
6 总结与展望
6.1 总结
6.2 展望
附录
1.极大似然估计法
1.1极大似然原理及其数学表述
1.2极大似然估计法
2.梯度下降法
2.1原理
2.2问题描述
2.3过程描述
2.4数学原理描述
2.5算法描述
3. 牛顿法
3.1原理
3.2算法描述
4. 凸二次规划问题
4.1二次规划
4.2凸二次规划问题求解
参考文献
攻读硕士学位期间发表的论文及所取得的研究成果
致谢