要解决的问题:提供一种能够对语言模型进行聚类的聚类系统,在该语言模型中,收集出现在多个说话者的语音中的词汇或其书面字符。
解决方案:用于对语言模型组进行聚类的聚类系统1包括:集合语言模型创建部分15,用于为每种语言模型创建集合语言模型的总和,其包括包含在语言模型组中的词汇的集合的总和。语言模型组,作为条目;聚类部分14,用于通过将集合语言模型组之和聚类而将集合语言模型组之和分类为多个聚类。当集合语言模型总和创建部分15创建关于某个语言模型的集合语言模型总和时,关于基本语言模型中所包括的词汇,记录与该语言模型相对应的条目的出现频率以及数据关于语言模型中不包括的词汇,记录表示出现频率为零的信息。
版权:(C)2008,日本特许厅&INPIT
公开/公告号JP2007256342A
专利类型
公开/公告日2007-10-04
原文格式PDF
申请/专利权人 FUJITSU LTD;
申请/专利号JP20060077126
发明设计人 KOJIMA HIDEKI;
申请日2006-03-20
分类号G10L15/10;G10L15/06;
国家 JP
入库时间 2022-08-21 21:13:46