当前位置: 首页 > news >正文

物流网站建设图片播放量自助下单平台

物流网站建设图片,播放量自助下单平台,新网站seo,做网站可以临摹吗在采集网页信息的时候,经常需要伪造报头来实现采集脚本的有效执行 下面,我们将使用urllib2的header部分伪造报头来实现采集信息 方法1、 #!/usr/bin/python -- coding: utf-8 -- #encodingutf-8 #Filename:urllib2-header.py import urllib2 import…

在采集网页信息的时候,经常需要伪造报头来实现采集脚本的有效执行

下面,我们将使用urllib2的header部分伪造报头来实现采集信息

方法1、
#!/usr/bin/python

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

#抓取网页内容-发送报头-1
url= “https://www.jb51.net”
send_headers = {
‘Host’:‘www.jb51.net’,
‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’,
‘Accept’:‘text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8’,
‘Connection’:‘keep-alive’
}

req = urllib2.Request(url,headers=send_headers)
r = urllib2.urlopen(req)

html = r.read() #返回网页内容
receive_header = r.info() #返回的报头信息

sys.getfilesystemencoding()

html = html.decode(‘utf-8’,‘replace’).encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码

print receive_header

print ‘####################################’

print html

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

#抓取网页内容-发送报头-1
url= “https://www.jb51.net”
send_headers = {
‘Host’:‘www.jb51.net’,
‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’,
‘Accept’:‘text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8’,
‘Connection’:‘keep-alive’
}

req = urllib2.Request(url,headers=send_headers)
r = urllib2.urlopen(req)

html = r.read() #返回网页内容
receive_header = r.info() #返回的报头信息

sys.getfilesystemencoding()

html = html.decode(‘utf-8’,‘replace’).encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码

print receive_header

print ‘####################################’

print html
方法2、
#!/usr/bin/python

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

url = ‘https://www.jb51.net’

req = urllib2.Request(url)
req.add_header(‘Referer’,‘https://www.jb51.net/’)
req.add_header(‘User-Agent’,‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’)
r = urllib2.urlopen(req)

html = r.read()
receive_header = r.info()

html = html.decode(‘utf-8’).encode(sys.getfilesystemencoding())

print receive_header
print ‘#####################################’
print html

#!/usr/bin/python

http://www.ds6.com.cn/news/51664.html

相关文章:

  • 北京太阳宫网站建设金城武重庆森林经典台词
  • 做公众号的必备参考网站模拟搜索点击软件
  • 专做餐饮的网站情感营销的十大案例
  • 有没有做游戏评测的网站seo职业培训学校
  • 苏州做网站公司排名aso优化什么意思
  • 淄博学校网站建设公司网络营销策略内容
  • 小程序公众号seo论坛站长交流
  • 八年级信息网站怎么做随州seo
  • 做网站需要多少职务企业网络策划
  • 网站改版怎么做301重定向广告公司经营范围
  • 制作app的网站哪个好农产品推广方案
  • 海外美国服务器租用优化落实疫情防控新十条
  • 一个公司的管理流程seo页面内容优化
  • 网站建设主动型电话销售话术如何优化关键词提升相关度
  • 肥东住房和城乡建设部网站百度seo关键词怎么做
  • 教务管理系统下载重庆seo点击工具
  • 能免费做片头的网站seo公司厦门
  • 网站开发培训少儿seo教学视频教程
  • 德州网站优化百度客服人工在线咨询
  • 个人主页网站制作如何广告推广
  • 做免费网站教程最有效的恶意点击软件
  • 古董手表网站seo外包方案
  • 龙岗政府在线网站站长工具浪潮
  • 有一个做ppt的网站吗小程序开发流程
  • 企业设计网站公司排名广告推广怎么做最有效
  • wordpress按分类搜索贵阳网站优化公司
  • 有没有网站找人帮忙做图域名查询138ip
  • 光明随心订网站怎么做怎么建设自己的网站
  • 怎么做免费公司网站建设网站的步骤
  • 做一个商城网站需要什么流程公司做个网站多少钱