基于验证的文本识别的方法及装置

发明专利无效专利

申请号：
CN200810167116.9
IPC分类号：G06K9/62;G06K9/20
申请日期：
2008-09-27
申请人：
腾讯科技（深圳）有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	基于验证的文本识别的方法及装置
申请号	CN200810167116.9	申请日期	2008-09-27
法律状态	驳回	申报国家	中国
公开/公告日	2009-03-18	公开/公告号	CN101388078
优先权	暂无	优先权号	暂无
主分类号	G06K9/62 ? IPC结构图谱： G 物理 G0 仪器 G06 计算；推算；计数 G06K 数据识别；数据表示；记录载体；记录载体的处理（印刷本身入B41J） G06K9/00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置（用于图表阅读或者将诸如力或现状态的机械参量的图形转换为电信号的方法或装置入G06K 11/00；语音识别入G10L 15/00）〔1，7〕 G06K9/62 应用电子设备进行识别的方法或装置〔3〕	IPC分类号	G;0;6;K;9;/;6;2;;;G;0;6;K;9;/;2;0查看分类表>
申请人	腾讯科技（深圳）有限公司	申请人地址	广东省深圳市福田区振兴路赛格科技园2栋东403室变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	腾讯科技（深圳）有限公司	当前权利人	腾讯科技（深圳）有限公司
发明人	张程
代理机构	北京德琦知识产权代理有限公司	代理人	罗正云;宋志强

摘要

本发明公开了一种基于验证的文本识别的方法及装置，该方法包括：接收验证请求；将产生的验证码片段与待识别的包含文本特征的图片片段拼合为验证码图片，传送给终端；接收终端发送的用户对验证码图片识别后输入的用户识别信息，从用户识别信息中取出图片片段包含的文本特征，作为所述图片片段的识别结果。本发明方案提高了识别结果的正确识别率，解决了计算机识别的局限性。

1、一种基于验证的文本识别的方法，其特征在于，该方法包括：
接收验证请求；
将产生的验证码片段与待识别的包含文本特征的图片片段拼合为验证码图片，传送给终端；
接收终端发送的用户对验证码图片识别后输入的用户识别信息，从用户识别信息中取出图片片段包含的文本特征，作为所述图片片段的识别结果。
2、如权利要求1所述的方法，其特征在于，所述从用户识别信息中取出图片片段包含的文本特征，作为所述图片片段的识别结果之后，该方法包括：
判断得到所述图片片段的识别结果的次数是否大于或等于设定值，如果是，则从各次得到的所述图片片段的识别结果中选取存在概率最大的识别结果，作为所述图片片段的最终识别结果。
3、如权利要求1所述的方法，其特征在于，所述从用户识别信息中取出图片片段包含的文本特征，作为所述图片片段的识别结果之后，该方法包括：
判断得到所述图片片段的同一识别结果的次数是否大于或等于设定值，如果是，则将该同一识别结果作为所述图片片段的最终识别结果。
4、如权利要求1所述的方法，其特征在于，所述将验证码片段与图片片段拼合为验证码图片包括：
将验证码片段与图片片段按照固定的位置顺序或按照随机的位置顺序拼合为验证码图片。
5、如权利要求1所述的方法，其特征在于，所述接收终端发送的用户对验证码图片识别后输入的用户识别信息之后，该方法包括：
从用户识别信息中取出验证码信息，判断该取出的验证码信息与所产生的验证码片段中的原始的验证码是否相同，如果相同，则执行所述从用户识别信息中取出图片片段包含的文本特征的步骤。
6、如权权利要求1所述的方法，其特征在于，所述将产生的验证码片段与待识别的包含文本特征的图片片段拼合为验证码图片包括：
提取所述图片片段的背景信息，根据该背景信息在所述验证码片段中加入信息噪声，将所述图片片段与加入信息噪声后的验证码片段拼合为验证码图片。
7、如权利要求1至6中任一项所述的方法，其特征在于，获取所述待识别的包含文本特征的图片片段的方法包括：从待识别的图像中抽取包含文本特征的图片区域，对图片区域进行分段及编号，得到各个包含文本特征的图片片段，存储于数据库中，从数据库中获取待识别的包含文本特征的图片片段。
8、如权利要求7所述的方法，其特征在于，所述从用户识别信息中取出图片片段包含的文本特征，作为所述图片片段的识别结果之后，该方法包括：
将一幅图像的各个图片片段的识别结果按照各个图片片段的编号进行组合，得到该图像的完整文本特征。
9、一种基于验证的文本识别的装置，其特征在于，该装置包括拼合模块和提取模块；
所述拼合模块，用于接收验证请求，将产生的验证码片段与待识别的包含文本特征的图片片段拼合为验证码图片，传送给终端；
所述提取模块，用于接收终端发送的用户对验证码图片识别后输入的用户识别信息，从用户识别信息中取出图片片段包含的文本特征，作为所述图片片段的识别结果。
10、如权利要求9所述的装置，其特征在于，所述提取模块中包括验证码验证子模块和识别结果提取子模块；
所述验证码验证子模块，用于从用户识别信息中取出验证码信息，判断该取出的验证码信息与所产生的验证码片段中的原始的验证码是否相同，如果相同，则向识别结果提取子模块发送启动指定；
所述识别结果提取子模，用于在接收到启动指令后，从用户识别信息中取出图片片段包含的文本特征，作为所述图片片段的识别结果。
11、如权利要求9或10所述的装置，其特征在于，该装置进一步包括数据库和图片片段划分模块；
所述图片片段划分模块，用于从待识别的图像中抽取包含文本特征的图片区域，对图片区域进行分段及编号，得到各个待识别的包含文本特征的图片片段，存储于数据库中；
所述拼合模块从数据库中获取待识别的包含文本特征的图片片段。
12、如权利要求9所述的装置，其特征在于，所述提取模块进一步用于从用户识别信息中取出图片片段包含的文本特征，作为所述图片片段的识别结果之后，判断得到所述图片片段的识别结果的次数是否大于或等于设定值，如果是，则从各次得到的所述图片片段的识别结果中选取存在概率最大的识别结果，作为所述图片片段的最终识别结果。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有引用任何外部专利数据！

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN103186781A	2011-12-31	2011-12-31	文本识别方法无效专利	北京新媒传信科技有限公司
2	CN103210607A	2011-09-14	2011-09-14	对由WEB服务器提供的服务的安全注册失效专利	阿尔卡特朗讯公司
3	CN103312512A	2013-06-07	2013-06-07	一种图片验证码的生成方法及装置、身份验证方法及装置有效专利	深圳第七大道网络技术有限公司
4	CN102254355A	2011-07-05	2011-07-05	一种立体验证码的生成方法和装置失效专利	周圣云
5	CN102867025A	2012-08-23	2012-08-23	一种获取图片标注数据的方法和装置无效专利	百度在线网络技术(北京)有限公司
6	CN102254355B	2011-07-05	2011-07-05	一种立体验证码的生成方法和装置失效专利	周圣云
7	CN104090878B	2013-07-04	2013-07-04	一种多媒体查找方法、终端、服务器及系统有效专利	腾讯科技(深圳)有限公司
8	WO2015074474A1	2014-10-24	2014-10-24	验证方法、装置及系统公开	腾讯科技(深圳)有限公司
9	CN103312512B	2013-06-07	2013-06-07	一种图片验证码的生成方法及装置、身份验证方法及装置有效专利	深圳第七大道网络技术有限公司
10	CN102006163B	2009-09-01	2009-09-01	用户验证方法、装置及服务器有效专利	阿里巴巴集团控股有限公司
11	CN102737242A	2012-06-12	2012-06-12	应用于移动终端的票据自动识别方法和系统无效专利	丰豪盈彩(北京)科技有限公司
12	CN102467653A	2010-10-29	2010-10-29	一种图文识别方法及系统无效专利	方正国际软件(北京)有限公司;方正国际软件有限公司
13	CN104573469A	2013-10-18	2013-10-18	一种图形验证码识别的方法无效专利	镇江鼎拓科技信息有限公司
14	CN104079557A	2014-05-22	2014-05-22	一种CC攻击的防护方法及装置无效专利	汉柏科技有限公司
15	CN104090878A	2013-07-04	2013-07-04	一种多媒体查找方法、终端、服务器及系统有效专利	腾讯科技(深圳)有限公司
16	CN106599671A	2015-10-20	2015-10-20	一种基于用户填写验证码来进行图片识别的方法及装置有效专利	阿里巴巴集团控股有限公司
17	WO2017067398A1	2016-10-11	2016-10-11	一种基于用户填写验证码来进行图片识别的方法及装置公开	阿里巴巴集团控股有限公司
18	WO2015000433A1	2014-07-04	2014-07-04	一种多媒体查找方法、终端、服务器及系统公开	腾讯科技(深圳)有限公司

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供