摘要:随着互联网的广泛普及,人们可以更方便地从网络上获取信息,甚至随时随地都可以通过网络同外界进行交互.方便获取信息的同时也带了诸如信息泄露、账户密码失窃等安全问题,因此信息安全越来越受到大众的关注.网络新闻作为时下的主流媒体之一,其中包含了大量人们关注的问题,包括近期发生的各种信息安全事件等.然而,这些信息往往淹没在海量的网络文档中,大众难以快速了解近期国内外发生的关于信息安全的大事件.因此,建立一种自动发现梳理信息安全事件的方法具有一定的现实意义.将单个句子作为表述"信息安全事件"的单元,应用机器学习算法判断句子中是否包含"信息安全事件"相关信息,从新闻文档中抽取出包含"信息安全事件"内容的句子作为所需要的结果.通过人工构建训练数据集、句子特征设计和支持向量机(support vector machine,SVM)模型训练,建立了一种自动从新闻文档中抽取"信息安全事件"相关句子的方法.实验结果表明,该方法在信息安全事件的发现方面有着较高的准确率和召回率,验证了所提方法的有效性.