当前位置: 首页 > news >正文

软文自助发稿平台济南优化网站的哪家好

软文自助发稿平台,济南优化网站的哪家好,网站建设实施,东莞最好的网站本文章仅供技术研究参考&#xff0c;勿做它用&#xff01; 5秒盾的特点 <title>Just a moment...</title> 返回的页面中不是目标数据&#xff0c;而是包含上面的代码&#xff1a;Just a moment... 或者第一次打开网页的时候&#xff1a; 这几个特征就是被Cloud…
本文章仅供技术研究参考,勿做它用!
  • 5秒盾的特点

<title>Just a moment...</title>

返回的页面中不是目标数据,而是包含上面的代码:Just a moment...

或者第一次打开网页的时候:

这几个特征就是被Cloudflare保护的网站,熟称5秒盾。

  • 免费版5秒盾的绕过方法

安装cloudscraper

pip3 install cloudscraper
import cloudscraper
scraper = cloudscraper.create_scraper()
resp = scraper.get('目标网站').text

将代码中的requests 替换成scraper即可,其他和requests一样正常使用。

  • 付费版5秒盾的绕过方法

如果网站部署的是付费版的5秒盾,用上述的cloudscraper就无法绕过,会返回下面的内容

Detected a Cloudflare version 2 (aptcha challengeeature is not available in the operce (free) version

付费版本绕过方法:docker 部署  flaresolverr 。

绕盾大致过程就是使用flaresolverr来代理我们的request请求,flaresolverr启动模拟浏览器绕盾成功之后我们保存好所需的cookies等参数,后续的requests就使用这些参数直接请求目标页面即可。如果请求的时候发现又被拒绝了,就重新启动绕盾步骤。

部署flaresolverr,本文章中的docker 和 flaresolverr  部署在爬虫程序同一台机器上。

linux 指令:

docker run -d --name=flaresolverr -p 8191:8191 -e LOG_LEVEL=info --restart unless-stopped ghcr.io/flaresolverr/flaresolverr:latest

 这里的代理端口设置的是 8191

部署完毕后使用curl 指令进行测试,不是本机部署请更换localhost 为flaresolverr 机器IP

curl -L -X POST 'http://localhost:8191/v1' -H 'Content-Type: application/json' --data-raw '{"cmd": "request.get","url":"https://你的目标网站/","maxTimeout": 160000}'

 这里有个注意点就是如果部署的机器性能比较差、目标网站性能差、或者网络通路不良等情况,maxTimeout 的值要设置 的足够大(ms),不然会失败,我在实测一个网站的时候最大一次绕盾过程用了两分钟,例子代码中设置了160秒超时。

 附上绕盾用的python代码:

    def 绕过5秒盾(self,xxxx):print("破盾中...")urlServer = "http://localhost:8191/v1"payload = json.dumps({"cmd": "request.get","url":'https://www.目标网站.com',"maxTimeout": 160000})headers = {'Content-Type': 'application/json'}response = requests.post(urlServer, headers=headers, data=payload)# print(response.status_code)# print(response.json()['solution']['cookies'])if response.status_code==200:userAgent = response.json()['solution']['userAgent']for item in response.json()['solution']['cookies']:self.cookies[item["name"]] = item["value"]self.UA = userAgentprint("破盾成功")return responseprint("绕过5秒盾错误!!!")

获取到绕盾成功的cookies ,之后的请求都使用requests 携带此cookie 直接请求即可,不需要每个请求都使用绕盾的方式。

因为flaresolverr启动绕盾浏览器会占用大量机器资源。

参考内容:

https://www.163.com/dy/article/HUM0G2U505561QYO.html

https://www.5axxw.com/wiki/content/df5u4r

http://www.ds6.com.cn/news/90421.html

相关文章:

  • 个人网站建设服务器九易建网站的建站流程
  • 想再算命网站上登广告怎么做列表网推广效果怎么样
  • 韩国企业网站设计职业培训机构管理系统
  • 龙岗营销型网站建设网站域名怎么查询
  • 上海汽车网站建设互联网营销培训课程
  • 电商网站建设需要百度推广客户端教程
  • 局网站建设情况汇报百度直播
  • 网站界面分析济南百度推广开户
  • 东莞网页设计公司排名seo入口
  • 深圳纯设计公司营口seo
  • 珠海门户网站建设宁波seo推广如何收费
  • 拓者吧室内设计效果图seo挂机赚钱
  • 企业三合一建站公司具体该怎么找新网域名注册
  • wordpress公司网站模板百度下载并安装
  • 自己做企业网站用哪个软件网站免费网站免费优化优化
  • 合肥金融网站设计优化二十条
  • wordpress db host冬镜seo
  • wordpress 一直崩溃关键词优化公司排行
  • 广州比较好的网站建设公司怎么免费创建网站
  • 深圳十大网站建设公司商丘网站seo
  • 做网站的一般步骤app推广接单
  • 建设银行网上营业厅贺州seo
  • 天津网站建设网页设计公司如何推广品牌知名度
  • 外贸自己做网站南昌seo优化公司
  • 学校网站建设成功案例网上卖产品怎么推广
  • 网站制作价格明细关系网站优化公司
  • 网站建设分几步网络营销理论包括哪些
  • 京东商城网站建设目标seo优化服务是什么
  • 浙江高端网站建设域名交易平台
  • 做网站获取手机号码北京网站建设公司优势