一种新的语言模型判别训练方法

于浩; 高剑峰; 步丰林

首页> 中文期刊> 《计算机学报》 >一种新的语言模型判别训练方法

一种新的语言模型判别训练方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

已有的一些判别训练(discriminative training)方法如Boosting[1]为了提高算法的效率,要求损失函数(loss function)是可以求导的,这样的损失函数无法体现最直接的优化目标.而根据最直接优化目标定义的损失函数通常是不可导的阶梯函数的形式.为了解决上述问题,文章提出了一种新的判别训练的方法GAP(Greedy Approximation Processing).这种方法具有很强的通用性,只要满足阶梯函数形式的损失函数都可以通过此算法进行训练.由于阶梯形式的损失函数是不可导的,无法使用梯度下降的方式计算极值并获得特征权值.因此,GAP采用"贪心"算法的方式,顺序地从特征集合中选取特征,通过穷举搜索的方式确定其权值.为了提高GAP算法的速度,作者在GAP算法中引入了特征之间独立的假设,固定特征的更新顺序,提出了GAP的改进算法FGAP(Fast Greedy Approximation Processing).为了证明FGAP算法的有效性,该文将FGAP算法训练的模型应用到日文输入法中.实验结果表明通过FGAP算法训练的语言模型优于Boosting算法训练的模型,与基础模型相比相对错误率下降了15%～19%.

著录项

来源
《计算机学报》 |2005年第10期|1708-1715|共8页
作者
于浩; 高剑峰; 步丰林;
展开▼
作者单位

上海交通大学电子与电气工程学院;

上海;

200030;

微软亚洲研究院;

北京;

100080;

上海交通大学电子与电气工程学院;

上海;

200030;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
语言模型; 判别训练; 损失函数; 日文输入法;

相似文献

中文文献
外文文献
专利

1. 一种新的基于主题的语言模型自适应方法 [J] . 任纪生 ,王作英 . 中文信息学报 . 2006,第004期
2. 一种新的潜在语义分析语言模型 [J] . 任纪生 ,王作英 . 高技术通讯 . 2005,第008期
3. 一种新的级数绝对收敛判别法──导数判别法 [J] . 高永东 . 湖北科技学院学报 . 1994,第001期
4. 统计语言模型中句子的语义连贯性判别 [J] . 郭燕慧 ,钟义信 . 情报学报 . 2003,第004期
5. 一种新的RBF神经网络训练方法 [J] . 赵奇 ,刘开第 ,侯朝桢 . 弹箭与制导学报 . 2005,第002期
6. 一种自适应概率语言模型的训练方法及其应用于中文分词 [C] . 徐志明 ,揭春雨 ,Jonathan Webster . 全国第七届计算语言学联合学术会议 . 2003
7. 一种新的曲线相似性判别方法研究 [A] . 朱洁 . 2008

一种新的语言模型判别训练方法

摘要

著录项

相似文献

相关主题

期刊订阅