加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种Web日志数据的预处理方法

发明专利无效专利
  • 申请号:
    CN201110200615.5
  • IPC分类号:G06F17/30
  • 申请日期:
    2011-07-18
  • 申请人:
    电子科技大学
著录项信息
专利名称一种Web日志数据的预处理方法
申请号CN201110200615.5申请日期2011-07-18
法律状态驳回申报国家中国
公开/公告日2012-03-28公开/公告号CN102393849A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人电子科技大学申请人地址
四川省成都市高新区(西区)西源大道2006号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人电子科技大学当前权利人电子科技大学
发明人孙健;隆克平;李志;谢发川;黄悦;周伟强;李江华;王雁峰;林威;黎焯泓
代理机构成都行之专利代理事务所(普通合伙)代理人温利平
摘要
本发明针对Web日志挖掘系统,提出了一种Web日志数据的预处理方法,首先采用缺省的规则库对无用信息,即不需要的记录进行删除,并通过对规则库的修正来完成Web日志数据清理;然后利用启发式规则来解决代理和防火墙带来的用户识别难题,并结合对首页和导航页的综合考虑来完成对用户的会话识别;最后,用基于网站页面参引关系对访问路径进行补充,得到最终的各用户访问Web页面的页面访问序列,完成Web日志数据的预处理。与传统的以简单时间阀值会话识别相比,本发明明显提高对用户访问行为挖掘的精确度和可信度。

专利服务由北京酷爱智慧知识产权代理公司提供