【快速转让】 CN201110196449.6 一种基于实体的自底向上Web数据抽取方法

发布者:胡乃菲发布时间:2025-09-21浏览次数:10

专利号:CN201110196449.6

专利名称:一种基于实体的自底向上Web数据抽取方法

申请日:2011-07-13

专利类型:授权发明

支付方式:面议

支付标准:面议

项目详情:本发明提供了一种基于实体的自底向上Web数据抽取方法,属于网络数据管理领域,具体步骤包括:选择Web数据页面、划分文本、标注实体属性、抽取属性序列重复模式抽取、化简结果模式;本发明的Web数据抽取方法,可以更广泛的抽取复杂Web页面的结构化数据,有效避免先前抽取技术对页面结构的过度依赖,适应性好,准确度高。

信息来源:东北大学专利快速许可服务平台