文章分类 | 推荐文章 | 最新文章 | 热点文章 | 最新软件 | 精品软件 | 下载排行 | 推荐下载 | firefox | WPS | 杀毒软件 | Picasa
清风网络
首 页 软件下载 网络学院 数码学院
QQ 电脑入门 游戏 操作系统 图形图像 办公软件 媒体动画 精文荟萃 常用软件 网页编程 技术开发 网络技术 认证考试 网站建设 文章专栏
当前位置:清风网络学院专栏Baidu恶搞:突破百度贴吧的验证码限制
精品推荐
特别推荐
·新站如何被百度快速的收录
·网站让百度(Baidu)天天更新、收录的更多的方法
·新站注意:百度(Baidu)收录新站的研究
·baiduspider常见问题解答
·baidu给友情链接站长们的一些指南
·什么都能搜到 将Google和百度合二为一
·百度地图伴我走遍全天下
·百度主题封杀以下十四种特征行为
·上网了解知识:百度知道四大提问技巧
·用百度实现站内搜索的Javascript代码
·百度知道四大提问技巧 助你早早解决问题
·网站针对baidu优化的相关问题解答
·用模拟精灵解百度编程大赛试题
·10天内让google和baidu收录您的网站
·我的baidu优化经验
·百度推广全国代理名单
·实现百度站内搜索的代码
·用robots.txt探索Google Baidu隐藏的秘密
·百度主题推广服务代码完全解析
·百度主题推广和google adsense的比较
热点TOP10
·百度是这样清除黄色图片的
·百度在日本正式上线----www.baidu.jp
·自动发贴程序-百度贴吧验证码算法
·一网打尽:批量下载百度MP3歌曲
·一个都不能少 IE7 beta2中添加百度搜索引擎
·站长必备:优你客--不再“寻他百度”
·百度与工行签署《电子商务战略合作协议》
·教你轻松破解验证码 - 解读百度贴吧杀手v2.0源代码
·新站如何被百度快速的收录
·恶搞:突破百度贴吧的验证码限制
·百度竞价效果越来越差,抢钱、烧钱
·百度主题推广服务代码完全解析
·能让“百度” “google"收录和快速增加世界排名的提议
·百度即时通讯软件---百度HI图赏&下载
·百度IM名字与界面首度网络曝光
·网站SEO:使你的网站受百度欢迎
·站长来看:Baidu关于网页收录问题
·新站注意:百度(Baidu)收录新站的研究
·百度联盟—何种做法会被认为是作弊
·什么都能搜到 将Google和百度合二为一

恶搞:突破百度贴吧的验证码限制

日期:2007年7月6日 作者: 查看:[大字体 中字体 小字体]


  百度,作为国内搜索引擎的大户,为了进一步扩大自己的用户群,专门开设了“百度贴吧”(2003年11月百度贴吧 (http://post.baidu.com)自从诞生以来逐渐成为世界最大的中文交流平台!当用户在百度搜索引擎中搜索出需要搜索的关键字,点击“贴吧”即可进入以关键字为专题的相应贴吧)的服务。操作简单而又针对性,这是贴吧火极一时的重要原因,可正因为如此,百度贴吧的安全性又怎么样呢?这就是我们今天探讨的话题!

  相信大家都有在论坛灌水的经历吧?但是如果你连续发表统一内容的东西在论坛中,不久论坛的整个板块就全是你发表的信息了,其他信息全被挤在了后面。假设你发表的信息够多,版主都删不完时,那么这个论坛基本就报废了!其他的商业论坛也意识到了防止恶意灌水的重要性,纷纷使用了一些防止恶意灌水的措施,有发贴间隔时间的限制、同一IP地址的发贴数限制、内容不能重复等,但是这些都不是今天的重点,由于百度使用的是一个公用发贴表单,允许匿名发帖,需要突破唯一的难点是验证码。(为了防止某个黑客对某一个特定注册用户用特定程序暴力破解方式进行不断的登陆尝试或是防止不断提交某网络信息而采用的一种网络通行方式。随机生成字符信息放入图片中,防止计算机直接识别。比如招商银行的网上个人银行,腾讯的QQ社区等等)

  这时验证码在整个系统中就扮演了了一个至关重要的角色。如果我们能突破它,写一个自动发布的程序,那么我们来算一算:假设每两秒程序post一次,一分钟就是30次、 一小时就有30×60=1800次、 一天就有1800×24=43200次!如果我们把发贴程序或是密码穷举程序挂在很多肉鸡上,进行同时工作,那么结果可想而知!笔者曾亲目睹过国内某著名安全论坛就是验证码被人破解,导致被人恶意灌水,最后完全崩溃!当然还有某网络银行也因此类原因导致用户密码被盗等众多事件。笔者也作如下声明:下文介绍的方法并不是有意针某公司或是某机构,只是作为技术交流,如果部分读者利用本文介绍的方法进行破坏或是穷举他人密码,这已经违法了法律,那么责任由他自己承担,与笔者无关!

  好了,我们可以进入正题了(以下出现的代码为Delphi写的部分源码,为了防止任意利用,我以介绍方法为主,如果读者感兴趣,可以自己组合编写完整,在本文附带的程序中,笔者提供了一个验证码参数确定程序(附源码))。验证码分为如下几类:数字型、字符型、符号型、综合型。

  我们看了看百度贴吧的验证码如图: 是属于数字型的!不过其图片中生成了不少彩色和黑白的噪音点(指验证图片上的斑点)。那么我们应该怎么去识别呢?传统的验证码识别方式很简单,由于数字的位置是固定的,所以我们只需要提取每一幅数字的图片(没有噪音点的)然后把每一个特殊数字独有的象素位置记录下来,然后在网络上提取需要破解的特征码,祛除噪音点,对其位置和记录位置进行比对,那就是么就能确定相应的数字了。

  总结一下传统的就是:

  1.先分析验证码,前景颜色是否不定

  2.然后把验证码的宽度/验证码文字个数,比如一验证码下载后宽度为60,有4个数字,那么就60/4=15,然后保存每个字,如果只有数字保存0-9数字到位图文件,如果英文那更麻烦点,0-9,A-Z都要保存到位图,位图的前景色都不变,保持一种颜色,背景随便你改不改

  3.如果前景要变则将文字统一为同种颜色,每个数字0-9的点阵都有个公共点,取该公共点颜色然后把前景全部统一成一种颜色,比如白色{255,255,255},位图的结构是BGR,而不是RGB

  4.然后进行比较,如果验证码的一点为白色,第2步保存的位图同一点也是白色,那么频率增加1

  5.最后频率最高的就是验证码了!

  可是这种传统的识别方法却遇到了挑战!如果图片数字的位置也是随机出现,大小也是随机出现,那么这种识别方法也就失效了,百度贴吧的就是这样的验证码。

  笔者这里向大家引入一个专有名词:“hough变换”也许学习计算机图像学的朋友知道,笔者还是简要介绍一下:

  直线hough变换:直线Hough变换利用图像空间和Hough参数空间的点-线对偶性,把图像空间中的检测问题转换到参数空间。通过在参数空间里进行简单的累加统计,然后在Hough参数空间寻找累加器峰值的方法检测直线。例如,图1(a)中的九条线段对应于如图1(b)所示的其Hough参数空间的九个累加器峰值。图1(b)中,Hough参数空间的横纵坐标分别为直线极坐标方程:ρ=x×cos(θ) + y×sin(θ) 的两个参数ρ和θ。九个峰值的ρ和θ值唯一的确定其对应线段所在直线的两个参数。并且线段的长度决定坐标(ρ,θ)处的累加值的大小。

  1(a)

  1(b)

  没有明白的读者可以多读两遍(数学啊数学!),还是比较好理解。其实讲通俗一点,就是我们只要利用这个方程ρ=x×cos(θ) + y×sin(θ)统计出ρ出现的次数,就可以确定一条直线,比如说图片中我们计算出了某个方向(θ的大小)的ρ出现次数的最大值,那么这就是这个方向最长的直线了!

  好了,知道了hough变换检测直线的原理,那么我们就来写段代码

  var

  p: PByteArray;


[1] [2] [3] 下一页 




上一篇:Discuz!安装技巧(2):论坛安装步骤详解

下一篇:你的网站在搜索引擎中注册九大步骤

恶搞:突破百度贴吧的验证码限制 相关文章:
·恶搞:突破百度贴吧的验证码限制
恶搞:突破百度贴吧的验证码限制 相关软件:

特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。
[打印本页] [关闭窗口] 转载请注明来源:http://www.viphot.com
| 帮助(?) | 版权声明 | 友情连接 | 关于我们 | 信息发布
Copyright 2007 www.viphot.com All Rights Reserved. 鄂ICP备05000083号Powered by:vipcn