首页> 外文会议>知能システムシンポジウム >語の分散表現を利用した分野依存性の高い固有表現抽出
【24h】

語の分散表現を利用した分野依存性の高い固有表現抽出

机译:使用单词的色散表示,高依赖的特征化提取

获取原文

摘要

本稿では,固有表現抽出(Named Entity Extraction)と呼ばれる,文章からその文章の記述対象に関わる固有表現を抽出する処理,特にコンピュータの専門用語を例として,特定の専門分野文章における分野依存性の高い固有表現を分析する処理を扱う.従来,固有表現抽出には Conditional Random Field(CRF)と呼ばれる手法が採用され,高い精度を収めてきた.CRF では,固有表現抽出に寄与する特徴的な文脈を複数の素性関数により表現する.そのため素性関数の設計が重要な課題とされてきた.本稿の提案は,近年,語の意味を分散表現で表す研究が進hでいることを背景とし,語の意味分散表現を利用して,CRF の素性関数を効率的に設計することである.語の意味分散表現では,特にMikolovらにより開発された Word2Vec が広く利用されているが,Word2Vec は,大量の文章を用いることにより,語の意味分散表現を得るという特徴がある.
机译:在本文中,它是从文本中提取与文本描述相关的唯一表达式的过程,该过程描述了从文本中描述文本的文本,更具体地,高依赖于依赖的字段依赖于特定的专业字段句子。处理分析特征的处理。传统上,一种方法被称为条件随机场(CRF)已经通过了独特的表达提取并具有高的精度。 CRF表达了通过多个特征函数促进针对特征表达提取的特征上下文。因此,特征函数的设计一直是一个重要问题。近年来,本文的提议最近用于设计CRF的功能函数,使用该研究的语义色散表示来设计CRF的语义色散表示,所述研究的研究代表了分散表示中这个词的含义。在单词的语义色散表示中,Word2VEC,特别是Mikolov等人。由Mikolov等人开发,SOWN2VEC通过使用大量句子来获得单词的语义色散表示。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号