首页> 中文学位 >基于OODA决策循环的主题发现技术的研究与设计
【6h】

基于OODA决策循环的主题发现技术的研究与设计

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 课题背景、目的和意义

1.2 国内外研究动态

1.2.1 近十年国内研究动态

1.2.2 国外研究动态

1.3 论文的组织结构

1.4 论文的主要研究成果

第二章 基于OODA决策循环的主题发现理论框架研究

2.1 OODA

2.2 基于OODA的主题发现

2.2.1 Observe(观察)——数据集整理

2.2.2 Orient(判断)——数据的挖掘与融合

2.2.3 Decide(决策)——主题的可视化展现

2.2.4 Action(行动)——评估

第三章 数据仓库与数据挖掘

3.1 数据仓库

3.1.1 数据仓库的概念与特点

3.1.2 数据仓库的体系结构

3.1.3 数据仓库的分析与设计概述

3.1.4 数据仓库的应用发展

3.2 数据挖掘

3.2.1 数据挖掘的概念和特点

3.2.2 数据挖掘与数据仓库的关系

3.2.3 数据挖掘的分类

3.2.4 数据挖掘的一般步骤和过程

3.2.5 数据挖掘的应用

3.2.6 数据挖掘存在的问题、研究热点展望

第四章 文本挖掘

4.1 文本挖掘的概念

4.2 文本挖掘的一般过程

4.2.1 文本数据集的准备整理

4.2.2 进行文本数据挖掘分析

4.2.3 知识的获取、评价和输出

4.3 相关文本数据挖掘技术的研究介绍

4.3.1 关联分析

4.3.2 文本分类

4.3.3 文本聚类

第五章 基于关联规则与改进的TF*IDF相结合的领域词库的构建

5.1 领域词库建立的主要过程

5.1.1 分词

5.1.2 提取特征项和向量表示

5.1.3 复合词的识别

5.1.4 统计特征项词频

5.1.5 基于改进的TF*IDF算法的特征项权重计算

5.1.6 对特征项进行阈值筛选建立领域词库

5.2 有关建立该领域词库的数据设计

5.2.1 数据字典

5.2.2 数据定义规范

5.3 实验结果及分析

第六章 针对BBS数据的基于OODA决策循环的主题发现的分析与设计

6.1 系统的分析与设计

6.1.1 有关BBS数据的基于OODA的主题发现的分析

6.1.2 有关BBS数据的基于OODA的主题发现的设计

6.2 实验结果及分析

第七章 总结与展望

7.1 总结

7.2 进一步研究展望

参考文献

致谢

附录

一、在校期间发表的学术论文

二、在校期间参加的项目

展开▼

摘要

本文针对日益严峻的“信息爆炸、数据泛滥、知识贫乏”的窘境,提出了一种基于OODA决策循环的主题发现。主题发现是从海量的数据中快速,有效的获取有价值的信息,了解数据集内容的一系列技术方法的总称。主题发现分为广义和狭义之分,广义的主题发现针对各种常见数据集(文本,图像,音频,视频等),狭义的主题发现仅针对文本数据。我们通常所说的主题发现是狭义的主题发现。本文将类似人类思考模式的OODA引入,作为主题发现的框架,充分借鉴智能数据挖掘、文本挖掘,数据融合,知识发现等技术方法和相关的思想,融合多个学科,多角度的对主题发现进行研究和分析。基于OODA的主题发现可以使人们能够从大量繁杂的信息中快速有效的提取主题,获取必要的知识,供人们分析决策。其相关的技术、方法、模型和思路可以应用到信息检索,文本分类和聚类,舆情监控,文献检索,主动信息推送等应用领域。
   目前,主题发现缺乏通用完善的主题发现框架;主题发现中模式的识别,特征项的提取,相似度的计算等模块都需要研究加强改进的算法,提高性能;主题发现中领域的适应性不够,缺乏专门领域的主题发现,以适应不同的用户和环境需求;主题发现的过程和结果缺乏可视化的展示以及与用户的交互,需要寻找或研究将可视化的发现过程与结果直观展示,便于用户理解,评价,交互,改进的方法和工具。
   本文除了将OODA作为主题发现的技术框架加以研究探索外,还改进了TF*IDF算法计算特征项的权重和去除停用词;利用关联规则挖掘解决复合词的识别问题;利用关联规则与改进的TF*IDF算法相结合构建领域词库,增强领域适应性,加快主题词提取的效率和准确度。对词语,句子,文本等进行基于关键词的关联规则挖掘的关联分析,相似度计算,并将关联分析和改进的K-means算法进行主题聚类研究;利用可视化的开发工具NetBeans,验证实现主题发现的相关技术方法,将该主题发现的过程加以可视化的展示,便于进行直观的理解、分析,便于与用户交互,从而更好的调试改进。使用某大学长年积累的BBS数据对基于OODA的主题发现框架加以验证,发现论坛数据中的热点问题,便于进行舆情监控。
   经过理论分析论证,及大量实验的验证,基于OODA决策循环的主题发现是可行的,有效地,能够很好的对主题发现问题进行剖析,合理抽象划分,易于理解分析,适合于主题发现的分析与设计。本文中的一些创新性的主题发现技术分析方法,也取得了比较好的效果或比以往的一些技术方得到了改进提高。

著录项

  • 作者

    徐西孟;

  • 作者单位

    济南大学;

  • 授予单位 济南大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 曲守宁;
  • 年度 2011
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.131;
  • 关键词

    主题发现; 领域词库; 关联规则; 决策循环;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号