加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种按涉及借壳上市主题的PDF文件切割方法

发明专利有效专利
  • 申请号:
    CN201710823783.7
  • IPC分类号:G06F17/30
  • 申请日期:
    2017-09-13
  • 申请人:
    张贝贝;徐小艳;周帅鹏;荆姝娟
著录项信息
专利名称一种按涉及借壳上市主题的PDF文件切割方法
申请号CN201710823783.7申请日期2017-09-13
法律状态实质审查申报国家中国
公开/公告日2018-01-09公开/公告号CN107562921A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人张贝贝;徐小艳;周帅鹏;荆姝娟申请人地址
陕西省西安市咸宁西路28号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人张贝贝,徐小艳,周帅鹏,荆姝娟当前权利人张贝贝,徐小艳,周帅鹏,荆姝娟
发明人张贝贝;徐小艳;周帅鹏;荆姝娟
代理机构西安通大专利代理有限责任公司代理人徐文权
摘要
本发明公开了一种按涉及借壳上市主题的PDF文件切割方法,包括以下步骤:1)通过分布式互联网爬虫技术获取公开的且以PDF格式存储的业务文件;2)确定涉及借壳上市主题的PDF文件的语言描述特征、关键字及关键字标题;3)确定包含关键字及关键字标题的PDF文件的页码信息集合P;4)采用页码异常去除机制对步骤3)得到的PDF文件页码信息集合P中的异常页码进行去除,得去除后的PDF文件页码信息集合Pfinal;5)根据步骤4)所获得的去除后PDF文件页码信息集合Pfinal对源PDF文件进行关于借壳上市主题的切割,完成涉及借壳上市主题的PDF文件切割,该方法能够高效、精准的实现涉及借壳上市主题的PDF文件切割。

专利服务由北京酷爱智慧知识产权代理公司提供