首页> 中国专利> 一种在word文档中提取英文缩略语的方法和系统

一种在word文档中提取英文缩略语的方法和系统

摘要

本申请公开了一种在word文档中提取英文缩略语的方法和系统,提取英文缩略语的方法,包括以下步骤:读取word文档中的全部语句,并将全部语句分割成单词格式;去除重复的单词及单词前后的标点符号,并生成单词列表;提取所述单词列表中存在两个以上大写字母的单词,并生成初选缩略语列表;读取过滤文件,并将所述过滤文件中的单词与所述初选缩略语列表进行匹配,其中,所述过滤文件中存储有含两个以上大写字母的非缩略语单词;删除所述初选缩略语列表中与所述过滤文件中重复的单词,生成精选缩略语列表;输出所述精选选缩略语列表。本申请不仅能够提高提取英文缩略语的效率,同时也提高了提取英文缩略语的准确率。

著录项

  • 公开/公告号CN114528828A

    专利类型发明专利

  • 公开/公告日2022-05-24

    原文格式PDF

  • 申请/专利权人 深圳市吉祥腾达科技有限公司;

    申请/专利号CN202210072746.8

  • 申请日2022-01-21

  • 分类号G06F40/284;

  • 代理机构深圳市海顺达知识产权代理有限公司;

  • 代理人欧阳士

  • 地址 518000 广东省深圳市南山区西丽中山园路1001号TCL高新科技园E3栋6-8层

  • 入库时间 2023-06-19 15:24:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-24

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号