要解决的问题:提供一种词素分析设备,即使存在任何未定义的单词,该词素分析设备也可以获取适当的词素分析结果。
解决方案:该词素分析装置设有检索结果请求装置,用于当字符串中未存储在单词词典存储装置140中的任何未定义的单词存在时,向内部或外部检索请求检索结果。装置50基于未定义的单词作为检索条件;文件矢量计算装置,用于将全部或部分检索结果计算为一个文件;一种相似度计算装置,用于计算未定义词的文档向量与已知词的文档向量的相似度;相似词指定装置,用于将相似词指定为与相似度高的文档向量相对应的已知词;属性应用装置,用于将相似词的词性和成本与未定义词相关联。所述划分装置被配置为通过使用由所述未定义词属性应用装置与所述未定义词相关联的词性和成本,将输入字符串划分为多个单元。
版权:(C)2009,日本特许厅&INPIT
公开/公告号JP2008276561A
专利类型
公开/公告日2008-11-13
原文格式PDF
申请/专利权人 YAHOO JAPAN CORP;
申请/专利号JP20070119982
申请日2007-04-27
分类号G06F17/27;
国家 JP
入库时间 2022-08-21 19:44:06