当前位置: 首页 > news >正文

建设可以聊天的网站找片子有什么好的关键词

建设可以聊天的网站,找片子有什么好的关键词,郑州网站建设首选创新,写作网站哪个好在对于爬取数量数量较少时,我们可以将爬虫数据保存于CSV文件或者其他格式的文件中,既简单又方便,但是如果需要存储的数据量大,又要频繁访问这些数据时,就应该考虑将数据保存到数据库中了。目前主流的数据库有关系性数据…

在对于爬取数量数量较少时,我们可以将爬虫数据保存于CSV文件或者其他格式的文件中,既简单又方便,但是如果需要存储的数据量大,又要频繁访问这些数据时,就应该考虑将数据保存到数据库中了。目前主流的数据库有关系性数据库MySQL,以及非关系性数据库MongoDB和Redis等。这里我先来讲讲MySQL。

1、MySQL数据库

MySQl数据库是一个中小型关系型数据库,应用及其广泛,开源,高效,免费,可移植性好,现在有很多大厂还是在广泛使用MySQL数据库。

1.关系型数据库概述

关系型数据库,是建立在关系模型基础上的数据库,简单的讲,它由多张互相联结的二位表格组成,每一行是一条记录,每一列是一个字段,而表就是某个实体的集合,它展现的形式类似于EXCEL中常见的表格。
像SQLite,MySQL,Oracle,SQL Server DB2等都属于关系型数据库。

2.下载和安装MySQL数据库

这里常规的安装方法我不再赘述,如果后续有要求,我会补上。安装本地测试集成环境

3、数据库管理工具Navicat

MySQL安装好之后,下面就可以建立保存爬虫数据的数据库了。如果对MySQL数据库不是很精通,甚至连SQL语句都不会怎么写,那么Navicat绝对可以帮上忙。这是一个强大的数据库管理和设计工具,支持Windows,Mac OS,Linux系统。通过直观的GUI(图形用户界面),可以让用户方便的管理MySQL,Oracle,SQL Server,Mongo DB等数据库。

3.1 Navicat下载和安装

进入Navicat官网下载Navicat for MySQL,下载地址为:Navicat下载地址

3.2 连接MySQL数据库服务器

Navicat安装完成后,运行 Navicat。首先完成与MySQL数据库服务器的连接。单机“连接”按钮,在弹出的“新建连接”对话框中输入MySQL配置信息,如连接名为mysql(名称自定义),密码为安装MySQL时设置的密码,其余配置默认设置,单击“连接测试”按钮,确保连接成功,最后单机“确定”按钮,完成与MySQl服务器的连接。

3.3 新建数据库

与MySQL数据库服务器建立连接后,就可以操作MySQL数据库了。新建一个数据库,用于存储爬取的信息。右击连接名mysql,在弹出的快捷菜单中,选择“新建数据库”命令,输入数据库名,设置字符集和排序规则,单机“确定”。

3.4 新建表

在新建的数据库crawler中新建一个用于存储爬取测试的表test。字段这里根据爬取的内容设置,比如:id的设置为int型,主键,不是null,自动递增,其余字段均为varchar型。

Python爬虫之数据写入

#写入到Excel
import xlsxwriter#创建文件,并添加一个工作表
workbook=xlsxwriter.Workbook('demo.xlsx')
worksheet=workbook.add_worksheet()#在指定位置写入数据
worksheet.write("A1","这是A1的数据")
worksheet.write("A2","这是A2的数据")#关闭表格文件
workbook.close()
#爬取便民查询网常用账号,并写入到Excel
import re
import requests
import xlsxwriterheaders = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) Ap\
pleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Sa\
fari/537.36"
}response=requests.get("http://changyongdianhuahaoma.51240.com/",headers=headers).textpat1=r'<tr bgcolor="#EFF7F0">[\s\S]*?<td>(.*?)</td>[\s\S]*?<td>[\s\S]*?</td>[\s\S]*?</tr>'
pat2=r'<tr bgcolor="#EFF7F0">[\s\S]*?<td>[\s\S]*?</td>[\s\S]*?<td>(.*?)</td>[\s\S]*?</tr>'pattern1=re.compile(pat1)
pattern2=re.compile(pat2)data1=pattern1.findall(response)
data2=pattern2.findall(response)resultlist=[]#创建表格
workbook=xlsxwriter.Workbook("demo2.xlsx")
worksheet=workbook.add_worksheet()for i in range(0,len(data1)):resultlist.append(data1[i]+data2[i])#写入数据worksheet.write("A"+str(i+1),data1[i])worksheet.write("B"+str(i+1),data2[i])print(resultlist)
# 关闭表格资源,这样才会完成创建
workbook.close()
#爬取便民查询网常用账号,并写入到Mysql 
#注意:需要提前创建对应字段的数据库
import re
import requests
import pymysql#建立数据库连接
db=pymysql.Connect(host="localhost",port=3306,user="root",passwd="AA123456",db="spider_test",charset="utf8")
cursor=db.cursor()#爬取数据
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) Ap\
pleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Sa\
fari/537.36"
}response=requests.get("http://changyongdianhuahaoma.51240.com/",headers=headers).text#处理数据
pat1=r'<tr bgcolor="#EFF7F0">[\s\S]*?<td>(.*?)</td>[\s\S]*?<td>[\s\S]*?</td>[\s\S]*?</tr>'
pat2=r'<tr bgcolor="#EFF7F0">[\s\S]*?<td>[\s\S]*?</td>[\s\S]*?<td>(.*?)</td>[\s\S]*?</tr>'pattern1=re.compile(pat1)
pattern2=re.compile(pat2)data1=pattern1.findall(response)
data2=pattern2.findall(response)#清空数据库原来的内容
sqll="delete from tel"
cursor.execute(sqll)
db.commit()resultlist=[]
for i in range(0,len(data1)):resultlist.append(data1[i]+data2[i])sql="insert into tel(name,phone) values('"+data1[i]+"','"+data2[i]+"')"cursor.execute(sql)print(resultlist)db.commit()
db.close()
http://www.ds6.com.cn/news/67904.html

相关文章:

  • 网站自己做还是找公司求几个微信推广平台
  • 35开始学网站开发中山疫情最新消息
  • 加强公司网站建设及数据库的通知百度官方下载
  • 成都营销网站制作什么是搜索引擎营销?
  • 生态建筑建设公司网站qq推广平台
  • php 网站开发平台百度网盘客服
  • 2021重庆互联网公司排名广东网站seo营销
  • 网站推广的网站作用品牌营销策略论文
  • 国外做化工网站seo全网图文推广
  • 手机网站页面设计seo外链推广员
  • wordpress密码搜索引擎优化方案案例
  • 用自己电脑做服务器 网站百度关键词搜索次数
  • 青岛网站制作公司seo助力网站转化率提升
  • 网站设计美工要怎么做百度刷排名seo软件
  • 如何搭建手机网站网站关键词排名批量查询
  • 单位网站建设费如何入账一个域名大概能卖多少钱
  • 建设部设计规范网站网站营销软文
  • wordpress建站教程贴吧服装品牌策划方案
  • 《动态网站建设》第03章在线测试seo深圳网络推广
  • 网站上的搜索功能是怎么做的可口可乐搜索引擎营销案例
  • 网站建设策划书5000字2023年8月份新冠病毒
  • 做视频的素材网站正规代运营公司排名
  • 平顶山 网站设计东莞seo网站排名优化公司
  • 手游源码论坛seo网站优化经理
  • 上海手机网站制作哪家好网推资源渠道
  • 南京江北新区核心区范围seo关键词推广方式
  • 用什么做网站后台的郑州网络推广哪家口碑好
  • 新网站如何做免费推广百度一下网页
  • 平面设计网页设计专员淘宝优化关键词的步骤
  • 个人域名备过案了做电影网站会查吗媒体代发网站