首页> 外国专利> Auto-classification of PDF forms by dynamically defining a taxonomy and vocabulary from PDF form fields

Auto-classification of PDF forms by dynamically defining a taxonomy and vocabulary from PDF form fields

机译:通过动态定义PDF表单字段中的分类法和词汇表,对PDF表单进行自动分类

摘要

Embodiments herein include a content manager that constructs vocabulary from the PDF form fields to classify documents. The content manager can associate a PDF form with a markup language schema (such as an XML Schema) so that PDF form fields are semantically bounded with XML schema elements. The XML schema elements can define semantics of form fields and specify other constraints on XML elements and attributes. The content manager then associates selected form fields from the PDF form with a content folder to construct a set of properties to apply to inbound PDF form data to classify documents.
机译:本文的实施例包括内容管理器,其从PDF表单字段构造词汇表以对文档进行分类。内容管理器可以将PDF表单与标记语言架构(例如XML Schema)相关联,以便PDF表单字段在语义上与XML架构元素绑定。 XML模式元素可以定义表单字段的语义,并指定对XML元素和属性的其他约束。然后,内容管理器将PDF表单中的选定表单字段与内容文件夹相关联,以构建一组属性,以应用于入站PDF表单数据以对文档进行分类。

著录项

  • 公开/公告号US8392472B1

    专利类型

  • 公开/公告日2013-03-05

    原文格式PDF

  • 申请/专利权人 SHASHANK GUPTA;RAMANDEEP BAWEJA;

    申请/专利号US20090612930

  • 发明设计人 RAMANDEEP BAWEJA;SHASHANK GUPTA;

    申请日2009-11-05

  • 分类号G06F17/30;G06F17/00;

  • 国家 US

  • 入库时间 2022-08-21 16:42:38

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号