首页> 外文会议>Conference on Computational Linguistics and Speech Processing >可讀性預測於中小學國語文教科書及優良课外讀物之硏究
【24h】

可讀性預測於中小學國語文教科書及優良课外讀物之硏究

机译:可读性预测于中小学国语文教科书及优良课外读物之硏究

获取原文

摘要

可讀性(Readability)是指閱讀材料能夠被讀者理解的程度。可讀性高的文章較容易被讀者理解。文章的可讀性與很多因素有關,如:文長、字詞難度、句法結構、内容是否符合讀者的先備知識等,然而表淺的語言特徵無法反映這些複雜的成分。本論文以先前的研究為基礎,更深入的探討不同種類的特徵,包括句法分析(Syntactic Analysis)、詞性生標記(Part-of-Speech, POS)、詞表示法(Word Embedding)、語意資訊(Semantic Information )與寫作程度(Well-written)等特徵,分析比對不同類型的特徵與可讀性高低的關聯性。實驗資料分為二部分:其一為中小學國語文教科書,選自98年度台灣三大出版社所出版的1~9年級(共18冊)審定版國中小國語文教科書;其二為優良課外讀物,選自文化部歷屆「中小學生優良課外讀物」獲選書籍。本論文嘗試透過逐步迴歸與支持向量機等兩種方式建立可讀性模型,比較兩者之效能優劣:最後,再將兩者加以結合,以提升預測之正確率。實驗結果顯示,本論文所提出的可讀性特徵相較於傳統所使用的表淺特徵,在文本難易度評估的任務中,能有顯著的效能提升。
机译:可读性(Readability)是指阅读材料能够被读者理解的程度。可读性高的文章较容易被读者理解。文章的可读性与很多因素有关,如:文长、字词难度、句法结构、内容是否符合读者的先备知识等,然而表浅的语言特征无法反映这些复杂的成分。本论文以先前的研究为基础,更深入的探讨不同种类的特征,包括句法分析(Syntactic Analysis)、词性生标记(Part-of-Speech, POS)、词表示法(Word Embedding)、语意资讯( Semantic Information )与写作程度(Well-written)等特征,分析比对不同类型的特征与可读性高低的关联性。实验资料分为二部分:其一为中小学国语文教科书,选自98年度台湾三大出版社所出版的1~9年级(共18册)审定版国中小国语文教科书;其二为优良课外读物,选自文化部历届「中小学生优良课外读物」获选书籍。本论文尝试透过逐步回归与支持向量机等两种方式建立可读性模型,比较两者之效能优劣:最后,再将两者加以结合,以提升预测之正确率。实验结果显示,本论文所提出的可读性特征相较于传统所使用的表浅特征,在文本难易度评估的任务中,能有显著的效能提升。

著录项

相似文献

  • 外文文献
  • 中文文献
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号