著录项信息
专利名称 | 基于验证的文本识别的方法及装置 |
申请号 | CN200810167116.9 | 申请日期 | 2008-09-27 |
法律状态 | 驳回 | 申报国家 | 中国 |
公开/公告日 | 2009-03-18 | 公开/公告号 | CN101388078 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/62 | IPC分类号 | G;0;6;K;9;/;6;2;;;G;0;6;K;9;/;2;0查看分类表>
|
申请人 | 腾讯科技(深圳)有限公司 | 申请人地址 | 广东省深圳市福田区振兴路赛格科技园2栋东403室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 腾讯科技(深圳)有限公司 | 当前权利人 | 腾讯科技(深圳)有限公司 |
发明人 | 张程 |
代理机构 | 北京德琦知识产权代理有限公司 | 代理人 | 罗正云;宋志强 |
摘要
本发明公开了一种基于验证的文本识别的方法及装置,该方法包括:接收验证请求;将产生的验证码片段与待识别的包含文本特征的图片片段拼合为验证码图片,传送给终端;接收终端发送的用户对验证码图片识别后输入的用户识别信息,从用户识别信息中取出图片片段包含的文本特征,作为所述图片片段的识别结果。本发明方案提高了识别结果的正确识别率,解决了计算机识别的局限性。
1、一种基于验证的文本识别的方法,其特征在于,该方法包括:
接收验证请求;
将产生的验证码片段与待识别的包含文本特征的图片片段拼合为验证码图 片,传送给终端;
接收终端发送的用户对验证码图片识别后输入的用户识别信息,从用户识 别信息中取出图片片段包含的文本特征,作为所述图片片段的识别结果。
2、如权利要求1所述的方法,其特征在于,所述从用户识别信息中取出图 片片段包含的文本特征,作为所述图片片段的识别结果之后,该方法包括:
判断得到所述图片片段的识别结果的次数是否大于或等于设定值,如果是, 则从各次得到的所述图片片段的识别结果中选取存在概率最大的识别结果,作 为所述图片片段的最终识别结果。
3、如权利要求1所述的方法,其特征在于,所述从用户识别信息中取出图 片片段包含的文本特征,作为所述图片片段的识别结果之后,该方法包括:
判断得到所述图片片段的同一识别结果的次数是否大于或等于设定值,如 果是,则将该同一识别结果作为所述图片片段的最终识别结果。
4、如权利要求1所述的方法,其特征在于,所述将验证码片段与图片片段 拼合为验证码图片包括:
将验证码片段与图片片段按照固定的位置顺序或按照随机的位置顺序拼合 为验证码图片。
5、如权利要求1所述的方法,其特征在于,所述接收终端发送的用户对验 证码图片识别后输入的用户识别信息之后,该方法包括:
从用户识别信息中取出验证码信息,判断该取出的验证码信息与所产生的 验证码片段中的原始的验证码是否相同,如果相同,则执行所述从用户识别信 息中取出图片片段包含的文本特征的步骤。
6、如权权利要求1所述的方法,其特征在于,所述将产生的验证码片段与 待识别的包含文本特征的图片片段拼合为验证码图片包括:
提取所述图片片段的背景信息,根据该背景信息在所述验证码片段中加入 信息噪声,将所述图片片段与加入信息噪声后的验证码片段拼合为验证码图片。
7、如权利要求1至6中任一项所述的方法,其特征在于,获取所述待识别 的包含文本特征的图片片段的方法包括:从待识别的图像中抽取包含文本特征 的图片区域,对图片区域进行分段及编号,得到各个包含文本特征的图片片段, 存储于数据库中,从数据库中获取待识别的包含文本特征的图片片段。
8、如权利要求7所述的方法,其特征在于,所述从用户识别信息中取出图 片片段包含的文本特征,作为所述图片片段的识别结果之后,该方法包括:
将一幅图像的各个图片片段的识别结果按照各个图片片段的编号进行组 合,得到该图像的完整文本特征。
9、一种基于验证的文本识别的装置,其特征在于,该装置包括拼合模块和 提取模块;
所述拼合模块,用于接收验证请求,将产生的验证码片段与待识别的包含 文本特征的图片片段拼合为验证码图片,传送给终端;
所述提取模块,用于接收终端发送的用户对验证码图片识别后输入的用户 识别信息,从用户识别信息中取出图片片段包含的文本特征,作为所述图片片 段的识别结果。
10、如权利要求9所述的装置,其特征在于,所述提取模块中包括验证码 验证子模块和识别结果提取子模块;
所述验证码验证子模块,用于从用户识别信息中取出验证码信息,判断该 取出的验证码信息与所产生的验证码片段中的原始的验证码是否相同,如果相 同,则向识别结果提取子模块发送启动指定;
所述识别结果提取子模,用于在接收到启动指令后,从用户识别信息中取 出图片片段包含的文本特征,作为所述图片片段的识别结果。
11、如权利要求9或10所述的装置,其特征在于,该装置进一步包括数据 库和图片片段划分模块;
所述图片片段划分模块,用于从待识别的图像中抽取包含文本特征的图片 区域,对图片区域进行分段及编号,得到各个待识别的包含文本特征的图片片 段,存储于数据库中;
所述拼合模块从数据库中获取待识别的包含文本特征的图片片段。
12、如权利要求9所述的装置,其特征在于,所述提取模块进一步用于从 用户识别信息中取出图片片段包含的文本特征,作为所述图片片段的识别结果 之后,判断得到所述图片片段的识别结果的次数是否大于或等于设定值,如果 是,则从各次得到的所述图片片段的识别结果中选取存在概率最大的识别结果, 作为所述图片片段的最终识别结果。
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2011-12-31 | 2011-12-31 | | |
2 | | 2011-09-14 | 2011-09-14 | | |
3 | | 2013-06-07 | 2013-06-07 | | |
4 | | 2011-07-05 | 2011-07-05 | | |
5 | | 2012-08-23 | 2012-08-23 | | |
6 | | 2011-07-05 | 2011-07-05 | | |
7 | | 2013-07-04 | 2013-07-04 | | |
8 | | 2014-10-24 | 2014-10-24 | | |
9 | | 2013-06-07 | 2013-06-07 | | |
10 | | 2009-09-01 | 2009-09-01 | | |
11 | | 2012-06-12 | 2012-06-12 | | |
12 | | 2010-10-29 | 2010-10-29 | | |
13 | | 2013-10-18 | 2013-10-18 | | |
14 | | 2014-05-22 | 2014-05-22 | | |
15 | | 2013-07-04 | 2013-07-04 | | |
16 | | 2015-10-20 | 2015-10-20 | | |
17 | | 2016-10-11 | 2016-10-11 | | |
18 | | 2014-07-04 | 2014-07-04 | | |