加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

在web爬取过程期间给网站排优先级的系统和方法

发明专利无效专利
  • 申请号:
    CN200710091563.6
  • IPC分类号:G06F17/30
  • 申请日期:
    2007-03-28
  • 申请人:
    国际商业机器公司
著录项信息
专利名称在web爬取过程期间给网站排优先级的系统和方法
申请号CN200710091563.6申请日期2007-03-28
法律状态权利终止申报国家中国
公开/公告日2007-10-03公开/公告号CN101046820
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人国际商业机器公司申请人地址
美国纽约 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人国际商业机器公司当前权利人国际商业机器公司
发明人A·马库斯;I·E·冈萨雷斯;D·N·梅雷迪思;S·迪尔;D·L·布莱克曼;M·青;L·A·L·源
代理机构北京市中咨律师事务所代理人于静;李峥
摘要
一种用于给网页的读取顺序排优先级的系统和方法。所述方法包括:由web爬取器提取要爬取的候选网页集合。所述候选网页集合中的每个网页关联于计算机网络中的网站。确定所述网站的第一网站分数是否在网站分数数据库中。如果所述第一网站分数存在于所述网站分数数据库中,则把所述第一网站分数关联于所述候选网页集合中的网页。相对于所述网页候选集合中的每个网页的相关联的网站分数,给所述候选网页集合排优先级。从所述候选网页集合检索内容。从所述内容提取超链接。把所述超链接存储在存储器单元中。

专利服务由北京酷爱智慧知识产权代理公司提供