首页> 中国专利> 一种基于统计量与相似性的网络新词发现方法及系统

一种基于统计量与相似性的网络新词发现方法及系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明属于自然语言处理领域，公开了一种基于统计量与相似性的网络新词发现方法及系统，先计算单字词的词频得到初始的单字词集合，并利用改进后的增强互信息和加权左右邻接熵从左向右扩展多字候选词，合并单字词集和多字词集得到候选新词集，然后将候选词作为中心词进行依存句法分析，计算句法结构的相似性值和候选新词所在句子与历史表达的语义相似值，进行过滤得到新词集合。和传统的统计量计算结果相比，本发明选用的方法可以有效过滤部分重复含义的词串，也解决了字词出现次数以及贡献不对称问题，加入相似性判断之后，有效提高了新词发现的准确。

著录项

公开/公告号CN113033183A

专利类型发明专利
公开/公告日2021-06-25

原文格式PDF
申请/专利权人西北大学;
展开▼

申请/专利号CN202110235703.2
发明设计人陈莉;张爽;李铮;
展开▼

申请日2021-03-03
分类号G06F40/216(20200101);G06F40/289(20200101);G06F40/253(20200101);G06F40/30(20200101);G06K9/62(20060101);
代理机构61216 西安恒泰知识产权代理事务所;
代理人王芳
地址 710069 陕西省西安市太白北路229号
入库时间 2023-06-19 11:35:49

法律信息

法律状态公告日

法律状态信息

法律状态
2023-10-27

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种基于统计量与相似性的网络新词发现方法及系统 [P] . 中国专利： CN113033183A . 2021-06-25
2. 一种基于视觉相似性镜像网站发现方法及系统 [P] . 中国专利： CN108628703A . 2018-10-09
3. A method for introducing and metering a in the operation of evaporating and traeger metal serving as a discharge reserve or stock in metal vapor lamps, in particular, high-pressure lamps, by distillation, from a supply.) found in the lamp has been separated off from the pump line [P] . 德国专利： DE610422C . 1935-03-09

机译：从灯中发现的一种方法中，已经分离出了一种方法，该方法是通过蒸馏从电源中引入和计量在蒸发和作为金属蒸气灯（尤其是高压灯）中的放电储备或原料的金属的操作过程中通过蒸馏而引入和计量的。从泵线
4. Methods of Treating Wrinkles, Developing Wrinkle Treatments And Evaluating Treatment Efficacy, Based On Newly Discovered Similarities Between Wrinkles And Skin Wounds [P] . 美国专利： US2016270715A1 . 2016-09-22

机译：基于新发现的皱纹和皮肤伤口之间的相似性，治疗皱纹，开发皱纹治疗方法和评估治疗效果的方法
5. Methods of Treating Wrinkles, Developing Wrinkle Treatments And Evaluating Treatment Efficacy, Based On Newly Discovered Similarities Between Wrinkles And Skin Wounds [P] . 美国专利： US2010030058A1 . 2010-02-04

机译：基于新发现的皱纹和皮肤伤口之间的相似性，治疗皱纹，开发皱纹治疗方法和评估治疗效果的方法