文本聚类在话题检测与人名消歧中的应用研究
TEXT CLUSTERING METHOD IN TOPIC DETECTION AND PERSON NAME DISAMBIGUATION
摘要
Abstract
第1章 绪论
1.1 课题背景
1.2 课题目的及意义
1.3 国内外相关技术发展现状
1.3.1 话题检测与跟踪概述
1.3.2 话题检测方法介绍
1.3.3 话题跟踪方法介绍
1.3.4 话题检测与跟踪系统性能评测方法
1.4 本文的主要研究内容和组织结构
第2章 基于仿射传播聚类与凝聚层次聚类结合的聚类方法及其应用
2.1 仿射传播聚类与凝聚层次聚类概述
2.2 基于仿射传播聚类与凝聚层次聚类结合的聚类方法
2.2.1 预处理及新闻报道表示
2.2.2 仿射传播聚类
2.2.3 二次特征选择
2.2.4 凝聚层次聚类
2.3 基于仿射传播聚类与凝聚层次聚类结合的聚类方法性能分析
2.3.1 数据集
2.3.2 评测方法
2.3.3 实验结果与分析
2.4 本章小结
第3章 基于层次聚类算法的中文人名消歧
3.1 人名消歧概述
3.2 人名识别
3.3 人名身份识别及抽取
3.4 基于文本聚类的人名消歧方法
3.4.1 特征选择和文档表示
3.4.2 相似度计算
3.4.3 基于文本聚类的人名消歧方法
3.5 评测方法及实验结果分析
3.5.1 数据集
3.5.2 评测方法
3.5.3 实验结果与分析
3.6 本章小结
第4章 金融新闻话题检测与跟踪系统
4.1 引言
4.2 金融新闻话题检测与跟踪系统框架
4.3 金融新闻话题检测与跟踪系统功能模块介绍
4.3.1金融爬虫模块
4.3.2预处理模块
4.3.3话题检测与跟踪模块
4.4 金融新闻话题检测与跟踪系统演示
4.4.1话题列表演示界面
4.4.2最新话题新闻演示界面
4.5 本章小结
结 论
参考文献
攻读学位期间发表的学术论文
哈尔滨工业大学硕士学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
致谢