当前位置: 首页 > news >正文

企业如何在网站上做宣传百度官方网址

企业如何在网站上做宣传,百度官方网址,wordpress官网入口中文,wordpress添加价格安装scrapy pip install scrapy创建scrapy项目,需要在终端里创建 注意:项目的名字开头不能是数字,也不能包含中文 scrapy startproject 项目名称 示例: scrapy startproject scra_baidu_36创建好后的文件 3. 创建爬虫文件&…
  1. 安装scrapy
pip install scrapy
  1. 创建scrapy项目,需要在终端里创建
    注意:项目的名字开头不能是数字,也不能包含中文
scrapy startproject 项目名称
示例:
scrapy startproject scra_baidu_36

创建好后的文件
在这里插入图片描述
3. 创建爬虫文件:
要在spider文件里面创建爬虫文件
先在终端中cd到spider文件里
创建爬虫文件

scrapy genspider 爬虫文件名 要爬取的网页
示例:
scrapy genspider baidu http://www.baiud.com

创建的爬虫文件内容:
在这里插入图片描述
name 爬虫的名字,用于运行爬虫的时候使用的值
allowed_domains 允许访问的域名
start_urls 起始url地址,指的是第一次要访问的域名
parse 是执行了start_urls之后执行的方法,方法中的response就是返回的那个对象

  1. 运行爬虫文件
    写一个print()
    在这里插入图片描述

在终端输入

scrapy crawl 爬虫的名字
示例:
scrapy crawl baidu

但是运行完并没有给我们返回任何数据
在这里插入图片描述
这是因为有robots协议
解决办法:只需要在settings.py文件里把 ROBOTSTXT_OBEY = True 给注释掉就可以了(或者把True改成False也可以)
在这里插入图片描述
然后再重新运行一遍就可以获取到数据了
在这里插入图片描述

http://www.ds6.com.cn/news/55640.html

相关文章:

  • 阿里云 个人网站深圳谷歌seo推广
  • 十堰电商网站建设最新新闻摘抄
  • 南京网站制作价格鸡西seo顾问
  • 做网站郴州网站seo优化包括哪些方面
  • 商业网站建设知识点站长统计app软件大全
  • 企业网站建设专家网上商城网站开发
  • 网站运营合同百度图片搜索网页版
  • 北京免费建网站推广普通话手抄报内容文字
  • 视频网站开发源码兰州网络推广关键词优化
  • flash网站首页中国十大网络销售公司
  • 长沙 学校网站建设百度电脑版下载安装
  • 武汉网站建设兼职2017搜狐财经峰会
  • 南京高端网站制作公司系统开发
  • 怎么自己制作一个网站的书源cpa推广平台
  • 最火爆的国际贸易网站在线crm管理系统
  • 中山高端网站建设网络营销推广工具
  • wordpress cdn 规则seo站长网怎么下载
  • 淘宝上做网站行吗班级优化大师的功能
  • 天津七七一网站建设有限公司怎么样成都网站优化平台
  • 做网站济南35个成功的市场营销策划案例
  • 简洁企业网站模板百度公司推广电话
  • 海城做网站公司一级域名生成二级域名
  • 医疗网站建设讯息seo网站优化流程
  • wordpress怎么做论坛seo外链专员
  • 本地的唐山网站建设网络软文营销案例
  • 怎么做装修网站平台精准营销平台
  • 用ps怎么做网站背景云搜索app官网
  • 企业网站 合同合肥网站优化seo
  • 做的比较好的公司网站浏览器网址
  • 西安做企业网站排名完整企业网站模板