基于本体的Web信息抽取系统

王志华; 魏斌; 李占波; 赵伟

首页> 中文期刊> 《计算机工程与设计》 >基于本体的Web信息抽取系统

基于本体的Web信息抽取系统

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了解决已有信息抽取系统中方法不具有重用性及不能抽取语义信息的问题,提出了一个基于领域本体的面向主题的Web信息抽取框架.对Web中文页面,借助外部资料,利用本体解析信息,对文件采集及预处理中的源文档及信息采集、文档预处理、文档存储等技术进行了分析设计,提出了文本转换中的分词及词表查询和命名实体识别算法,并给出了一种知识抽取方案.实验结果表明,该方法可以得到性能较高的抽取结果.%To address the semantic problem and method reuse of traditional information extraction system, a topic-oriented Web information extraction framework based on domain ontology is proposed. For Chinese documents on the Web, with external data and domain ontology, the source document, information collection, document pre-processing, document storage and document database of the document collection and preprocessing are analyzed, the word segmentation, vocabulary queries and named entity recognition algorithms of text conversion is introduced, In the end, a knowledge extraction method is given. The test shows that the method can get higher performance results.

著录项

来源
《计算机工程与设计》 |2012年第7期|2634-2639|共6页
作者
王志华; 魏斌; 李占波; 赵伟;
展开▼
作者单位

郑州大学软件技术学院;

河南郑州450002;

郑州大学软件技术学院;

河南郑州450002;

郑州大学软件技术学院;

河南郑州450002;

郑州大学软件技术学院;

河南郑州450002;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
本体; 信息抽取; Web页面; 关键技术; 抽取框架;

相似文献

中文文献
外文文献
专利

1. 基于本体的Web信息抽取系统的研究 [J] . 刘伟 ,贺露 . 软件 . 2013,第012期
2. 基于模板和领域本体的Deep Web信息抽取研究 [J] . 顾韵华 ,高原 ,高宝 . 计算机工程与设计 . 2014,第001期
3. 改进的基于本体的Web信息抽取 [J] . 陈雪 ,梁永全 ,赵相彬 . 计算机应用与软件 . 2013,第007期
4. 基于领域本体的Web信息抽取模型研究 [J] . 岳国伟 ,吕楠 ,申玉三 . 情报探索 . 2012,第001期
5. 基于领域本体构建的Web信息抽取 [J] . 张莉萍 . 图书情报工作网刊 . 2011,第005期
6. 基于Heritrix的web信息抽取优化与实现 [C] . 吴伟 ,陈建峡 . 湖北省机械工程学会机械设计与传动专委会暨武汉市机械设计与传动学会第20届学术年会 . 2012
7. 基于本体的手机领域Web信息抽取 [A] . 李宗超 . 2015

基于本体的Web信息抽取系统

摘要

著录项

相似文献

相关主题

期刊订阅