首页> 中国专利> 医学文本的分词方法、装置、计算机设备和存储介质

医学文本的分词方法、装置、计算机设备和存储介质

摘要

本说明书实施方式提供了一种医学文本的分词方法、装置、计算机设备和存储介质。包括:获取所述医学文本中的医学基础词和医学复合词;其中,所述医学基础词不能被切分出医学子词;按照构成所述医学复合词的文字顺序,将所述医学复合词切分成多个非复合的医学子词;其中,所述医学复合词中的一个文字被分入一个医学子词;其中,所述非复合的医学子词不能被进一步切分出医学子词;标注所述医学基础词、所述医学复合词和所述医学子词的词性,得到所述医学文本的医学词分词结果。通过对医学文本采用多维词典匹配、模型预测和词语联想的方法,实现一款能提高医学文本分词准确性的医学分词工具。

著录项

  • 公开/公告号CN114154502A

    专利类型发明专利

  • 公开/公告日2022-03-08

    原文格式PDF

  • 申请/专利权人 浙江太美医疗科技股份有限公司;

    申请/专利号CN202210121004.X

  • 发明设计人 张凯;

    申请日2022-02-09

  • 分类号G06F40/289(20200101);G06F40/30(20200101);G06F16/35(20190101);G06F16/36(20190101);

  • 代理机构11505 北京布瑞知识产权代理有限公司;

  • 代理人周达

  • 地址 314001 浙江省嘉兴市昌盛南路36号智慧产业创新园9号楼3层

  • 入库时间 2023-06-19 14:26:44

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-08

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号