版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:Natl Cent Univ Dept Comp Sci & Informat Engn Chungli Taiwan
出 版 物:《IEEE INTELLIGENT SYSTEMS》 (IEEE Intell. Syst.)
年 卷 期:2004年第19卷第6期
页 面:56-64页
核心收录:
学科分类:0808[工学-电气工程] 08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:The Ministry of Education Taiwan sponsored this work under grant 92-H-FA07-1-4
主 题:Semistructured Data Web Data Extraction Multiple String Alignment Rule Generalization
摘 要:OLEPA is a semisupervised information-extraction system that produces extraction rules from semistructured Web documents without requiring detailed annotation of the training documents. It performs well for program-generated Web pages with few training pages and limited user intervention.