基于多元特征的文本阅读难度自动分级研究

程勇; 徐德宽; 吕学强

首页> 中文期刊> 《现代图书情报技术》 >基于多元特征的文本阅读难度自动分级研究

基于多元特征的文本阅读难度自动分级研究

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

【目的】实现文本阅读难度自动分级。【方法】采用基于多元特征的机器学习方法实现对文本难度的分析和判别,包括词频特征、结构特征、主题特征、深度特征等。这些特征从不同角度对文本的内容进行描述。在此基础上,对这些多元特征进行融合,并在多种分类器上进行文本阅读难度自动分级实验。【结果】利用本文提出的方法在面向中学英语考试的阅读理解文本上进行实验,最终在测试集上的正确率达到0.88,性能相较传统的阅读分级方法有较大提升。【局限】由于人工标注的高成本,目前的阅读难度数据集在数量、规模、难度标注程度上都有相应的限制。这在一定程度上影响了本文方法的应用。【结论】本文提出的多元特征提升了机器对阅读文本的分析和理解能力,使机器能够在理解文本内容的基础上对文本的阅读难度进行自动评级。

著录项

来源
《现代图书情报技术》 |2019年第7期|103-112|共10页
作者
程勇; 徐德宽; 吕学强;
展开▼
作者单位

1. 鲁东大学文学院 2. 北京信息科技大学计算机学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类英语;
关键词
多元特征; 阅读难度; 自动分级;

相似文献

中文文献
外文文献
专利

1. 基于多元语言特征与深度特征融合的中文文本阅读难度自动分级研究 [J] . 程勇 ,徐德宽 ,董军 . 中文信息学报 . 2020,第004期
2. 基于G MM与图像多元特征的自动决策树分类方法研究 [J] . 赵健赟 ,彭军还 . 内蒙古师范大学学报（自然科学汉文版） . 2016,第005期
3. 基于特征融合和判别式学习的胎盘成熟度自动分级 [J] . 李婉君 ,汪天富 ,倪东 . 中国生物医学工程学报 . 2016,第004期
4. 基于多特征描述的乳腺癌肿瘤病理自动分级 [J] . 龚磊 ,徐军 ,王冠皓 . 计算机应用 . 2015,第012期
5. 基于颜色和纹理特征的柑橘自动分级 [J] . 卢军 ,付雪媛 ,苗晨琳 . 华中农业大学学报 . 2012,第6期
6. 汉语文本阅读难度模型及易讯性公式研究 [C] . 陈阿林 . 计算语言学文集 . -1
7. 第二语言词汇难度及难度因素分级研究 [A] . 李永康 . 2003

基于多元特征的文本阅读难度自动分级研究

摘要

著录项

相似文献

相关主题

期刊订阅