首页

基于视觉信息和DOM树的Deep Web数据自动抽取 10月04日

【摘要】随着互联网的飞速发展,其中已蕴含了海量的信息资源,涵盖了现实世界的各个领域。相对于SurfaceWeb,DeepWeb蕴含着更丰富的数据、拥有更多的访问量和更快的增长速度。但是DeepWeb页面是动态生成的,难以被传统搜索引擎索引到。因此,如何有效地获取和利用DeepWeb页面的数据成为一个重要的研究方向。DeepWeb数据通过查询结果页面表现出来,但是网页中的数据形式各异、缺乏结构性,便 […]