声明
1 绪 论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 自然语言处理和信息抽取技术的发展及应用
1.2.2 建筑规范的合规性检查研究
1.2.3 规范类文本的信息抽取工具和建模方法
1.3 本文研究工作及主要创新点
1.4 本文组织结构
2 相关理论与关键技术研究
2.1 自然语言的向量化表示
2.1.1 独热编码法
2.1.2 分布式表示法
2.2 命名实体识别
2.3 循环神经网络
2.4 本章小结
3 建筑工程质量验收规范的约束表达模式分析与建模
3.1 建筑工程质量验收规范
3.2 约束条文和约束要素的概念
3.3 建筑工程质量规范约束表达模式分析
3.3.1 规范文本的复杂性
3.3.2 关系类约束表达模式分析
3.3.3 属性类约束表达模式分析
3.4 建筑工程质量验收规范的抽取模板定义
3.5 本章小结
4 建筑工程质量验收规范信息抽取
4.1 约束要素标签和分类标签的定义
4.2 约束要素的识别
4.2.1. 约束的最小单元——字的向量化
4.2.2. 约束要素的最大概率标签标记
4.2.3. 约束要素的最优标签序列标记
4.3 约束条文的自动分类
4.3.1 约束要素的词向量化
4.3.2 约束上下文语义关系矩阵计算
4.3.3 约束条文分类
4.4 本章小结
5 建筑工程质量验收规范抽取实验及结果分析
5.1. 信息抽取模型训练
5.2. 模型测试及结果输出
5.3. 抽取结果评价标准
5.3.1 正确率和错误率
5.3.2 ROC曲线和AUC值
5.3.3 准确率、召回率和F值
5.4. 结果分析及模型评价
5.5. 本章小结
6 结论与展望
6.1. 结论
6.2. 展望
参考文献
致谢