基于神经网络的中文词法分析系统的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本论文的研究目的是构建一套基于神经网络的中文词法分析（中文分词，词性标注和命名实体识别）系统，主要研究内容包含两点，其一是研究适合中文词法分析任务的具体模型，其二是研究如何将其良好地实现。
　　首先我们多维度地简要介绍了中文词法分析的各个任务，随后调研了当下已有的词法分析系统。接着我们将用于序列标注的神经网络结构拆分为输入层、表示学习层和标签预测层，并逐层展开介绍。随后本文以实验为出发点，探究了不同的输入特征和模型结构在各任务上的效果，确定了适合各个任务的神经网络模型。我们得到的各模型结构不尽相同，但都以双向LSTM结构作为表示学习方法，同时融合手工特征或未标注数据的信息。最后，我们介绍了系统实现的代码结构，并完成系统的速度评估。
　　本论文的研究成果主要包含两点。第一点是通过实验确定了适合各中文词法分析任务的具体神经网络结构。我们选择LTP作为基准线模型，以LTP使用的数据集作为实验数据集。在中文分词任务上，我们的模型在开发集和测试集上的F1值比LTP分别高0.33、0.48个百分点；在词性标注任务上，最优模型在开发集上的Accuracy比基准线高0.2个百分点，测试集上高0.22个点；在命名实体识别上，我们确定的模型在开发集和测试集上的F1值比LTP提升了2.57和0.57个百分点。第二个研究成果体现在系统实现上。我们用清晰地代码结构实现了上述神经网络模型，获得了一套可用的中文词法分析系统。

著录项

作者
徐伟;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名车万翔;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类人工神经网络与计算;
关键词
神经网络; 中文词法分析; 中文分词; 代码结构;

相似文献

中文文献
外文文献
专利

1. 基于多知识源的中文词法分析系统 [J] . 姜维 ,王晓龙 ,关毅 . 计算机学报 . 2007,第001期
2. 基于字符的递归神经网络在中文语言模型中的研究与实现 [J] . 伍逸凡 ,朱龙娇 ,石俊萍 . 现代信息科技 . 2018,第008期
3. 基于字符的递归神经网络在中文语言模型中的研究与实现 [J] . 伍逸凡 ,朱龙娇 ,石俊萍 . 现代信息科技 . 2018,第008期
4. 基于优化神经网络算法的大数据专家系统的继电保护二次回路故障定位系统(RSFLS)的研究与实现 [J] . 钟臻 ,徐曦 ,张楷旋 . 电力大数据 . 2019,第010期
5. 基于优化神经网络算法的大数据专家系统的继电保护二次回路故障定位系统(RSFLS)的研究与实现 [J] . 钟臻 ,徐曦 ,张楷旋 . 贵州电力技术 . 2019,第010期
6. 异种语料融合方法:基于统计的中文词法分析应用 [C] . Meng Fandong ,孟凡东 ,Xu Jinan . 第十一届全国计算语言学学术会议 . 2011
7. 中文词法分析技术的研究与实现 [A] . 张会鹏 . 2006

基于神经网络的中文词法分析系统的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅