首页> 外文会议> >What's in an Embedding? Analyzing Word Embeddings through Multilingual Evaluation
【24h】

What's in an Embedding? Analyzing Word Embeddings through Multilingual Evaluation

机译:嵌入中有什么?通过多语言评估分析词的嵌入

获取原文

摘要

In the last two years, there has been a surge of word embedding algorithms and research on them. However, evaluation has mostly been carried out on a narrow set of tasks, mainly word similarity/relatedness and word relation similarity and on a single language, namely English. We propose an approach to evaluate embeddings on a variety of languages that also yields insights into the structure of the embedding space by investigating how well word embeddings cluster along different syntactic features. We show that all embedding approaches behave similarly in this task, with dependency-based embeddings performing best. This effect is even more pronounced when generating low dimensional embeddings.
机译:在过去的两年中,涌现了单词嵌入算法并对其进行了研究。但是,评估主要是在一组狭窄的任务上进行的,主要是单词相似性/相关性和单词关系相似性,以及一种单一的语言,即英语。我们提出了一种评估各种语言上的嵌入的方法,该方法还可以通过研究单词嵌入沿不同句法特征的聚集程度来深入了解嵌入空间的结构。我们证明了所有嵌入方法在此任务中的行为都相似,其中基于依存关系的嵌入效果最佳。当生成低维嵌入时,这种效果更加明显。

著录项

  • 来源
    《》|2015年|2067-2073|共7页
  • 会议地点
  • 作者

    Arne Koehn;

  • 作者单位
  • 会议组织
  • 原文格式 PDF
  • 正文语种
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号