垂直搜索引擎中的网页对象抽取模型及实现技术研究

本文档由 kule 分享于2010-10-08 18:04

随着因特网技术的快速发展,网上信息呈几何级数增长,由于网络信息载体的异构性和多变性,如何检索和处理这些海量信息成为目前重要的研究课题。Web信息抽取是指从半结构化的网页中抽取指定的信息,将其形成结构化的数据填入数据库中供用户查询使用的过程。Web信息抽取是提高信息检索尤其是垂直领域信息检索性能的重要手段之一,本文研究垂直搜索引擎中的Web信息抽取技术。本文首先总结了Web信息抽取的主要技术,从Web信息抽取系..
文档格式:
.pdf
文档大小:
3.33M
文档页数:
61
顶 /踩数:
0 0
收藏人数:
0
评论次数:
0
文档热度:
文档分类:
论文  —  期刊/会议论文
添加到豆单
文档标签:
2009 湖南大学 模板检测 模板生成 DOM树 硕士论文 开发 设计 模式 模型
系统标签:
抽取 网页 搜索引擎 垂直 wrappermatching geeseek
下载文档
收藏
打印

扫扫二维码,随身浏览文档

手机或平板扫扫即可继续访问

推荐豆丁书房APP  

获取二维码

分享文档

将文档分享至:
分享完整地址
文档地址: 复制
粘贴到BBS或博客
flash地址: 复制

支持嵌入FLASH地址的网站使用

html代码: 复制

默认尺寸450px*300px480px*400px650px*490px

支持嵌入HTML代码的网站使用

分享到