Referer等错误码处理-爬虫反扒机制处理

2022-12-12服务器
322

HTTP来源地址(Referer,或 HTTP Referer)是HTTP表头的一个字段,用来表示从哪儿链接到目前的网页,采用的格式是URL。换句话说,借着HTTP来源地址,目前的网页可以检查访客从哪里而来,这也常被用来对付伪造的跨网站请求。 网站里面常常会用到这个属性来对爬虫进行限制,比如之前我们尝试的爬虫案例中就有针对下载时的Referer处理

当你傻愣愣的去访问页面时,往往会返回这样的错误信息页面

这里因为有关键字Referer所以大家可能很快就能够判断出问题所在然后针对性做处理,但是更多时候往往会出现一些我们没遇到过的情况,,比如IP黑名单,Token防盗链等等,我们可以去CDN 默认错误码寻找常见的错误码信息,然后找到问题再针对解决, 这里举一些常见的错误对应CDN

比如之前的referer我们发现的错误所在,然后直接在对图片的下载过程中对referer进行设置即可(这里直接将当前链接赋给referer)
The End
Referer 错误码

相关推荐

教你突破基于HTTP_REFERER的防盗链的方法
其实防盗链这个技术并不复杂,目前基本就是在服务器端判断HTTP_REFERER的位置,如果不是来自本站自身,则拒绝输出详细。 那么如果考虑突破防盗链的措施,就需要考虑在HTTPREFERER上面做手脚了。PHP 脚本中对应的变量是$SERVER[HTTPREFERER] ,它存储了 HTTPRE...
2022-12-13 服务器
267

Referer等错误码处理-爬虫反扒机制处理
HTTP来源地址(referer,或 HTTP referer)是HTTP表头的一个字段,用来表示从哪儿链接到目前的网页,采用的格式是URL。换句话说,借着HTTP来源地址,目前的网页可以检查访客从哪里而来,这也常被用来对付伪造的跨网站请求。网站里面常常会用到这个属性来对爬...
2022-12-12 服务器
322

服务器错误码500 501 502 503 504 505 详解
这篇文章主要介绍了服务器错误码500 501 502 503 504 505 详解,需要的朋友可以参考下...
2016-09-25 服务器
18

使用referer指令配置Nginx服务器来防止图片盗链
这篇文章主要介绍了使用referer指令配置Nginx服务器来防止图片盗链的方法,文中也简单介绍了referer指令的一些语法和常用参数,需要的朋友可以参考下...
2016-09-25 服务器
9