当前位置：首页 > news >正文

坪山网站建设效果整站seo服务

news 2025/12/11 16:10:43

坪山网站建设效果,整站seo服务,公司资质查询官方网站,制作微网站多少钱人生苦短我用python~ 这次康康能给大家整点好看的不~ 环境使用: Python 3.8 Pycharm mou歌浏览器 mou歌驱动 —> 驱动版本要和浏览器版本最相近 <大版本一样, 小版本最相近> 模块使用: requests >>> pip install requests selenium >>> pip …

人生苦短我用python~

这次康康能给大家整点好看的不~

在这里插入图片描述

环境使用:

Python 3.8
Pycharm
mou歌浏览器
mou歌驱动 —> 驱动版本要和浏览器版本最相近 <大版本一样, 小版本最相近>

模块使用:

requests >>> pip install requests
selenium >>> pip install selenium==3.141.0 <需要浏览器和浏览器驱动>
默认安装 4.0版本语法上面有点区别
re
json

卸载模块: pip uninstall selenium 卸载模块

安装python第三方模块:

win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
在pycharm中点击Terminal(终端) 输入安装命令

在这里插入图片描述

基本思路流程: <通用>

一. 数据来源分析:

明确需求:

采集什么数据内容

I. 视频播放链接

II. 视频标题
通过浏览器自带工具: 开发者工具, 进行抓包分析

打开开发者工具: F12 / 鼠标右键点击检查选择network

刷新网页: 让本网页数据内容重新加载一遍

分析/找到视频播放链接在哪里
1. 选择 media <媒体文件> 可以直接看到视频播放链接
2. 通过搜索分析可以直接找到视频播放链接/ 视频标题

二. 代码实现步骤:

发送请求, 模拟浏览器对于url地址发送请求
获取数据, 获取服务器返回响应数据

开发者工具: response <网页源代码>
解析数据, 提取我们想要的数据内容

视频标题

视频播放链接
保存数据, 把视频内容保存本地文件夹

代码展示

导入模块

导入数据请求模块
import requests
import re
import json
from pprint import pprint
from selenium import webdriver
import time

创建浏览器对象,
实例化对象
自动打开浏览器

driver = webdriver.Chrome()

访问网址【需要网址的私我吧这不给放】

执行页面滚动的操作

def drop_down():for x in range(1, 40, 4): time.sleep(1)j = x / 9  js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight * %f' % jdriver.execute_script(js)

可以直接定位元素提取内容

lis = driver.find_elements_by_css_selector('.Eie04v01')
for li in lis:url = li.find_element_by_css_selector('a').get_attribute('href')

1. 发送请求, 模拟浏览器对于url地址发送请求

  <Response [200]> 响应对象, 表示请求成功仅表示请求成功, 但是不代表一定得到数据<你想要的数据>没有得到我们想要的数据内容:原因: 是因为代码被服务器识别出来了, 是pachong程序解决:把代码伪装成浏览器去发送请求 —> headers 请求头

    print(url)time.sleep(1)

确定请求链接 <视频播放页面>

模拟伪装

    headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'}

发送请求

    response = requests.get(url=url, headers=headers)

获取数据, 获取服务器返回响应数据

开发者工具: response <网页源代码>
解析数据, 提取我们想要的数据内容

视频标题

视频播放链接

正则表达式, 你要获取什么数据, 直接复制过来, 然后要的数据内容用 (.*?) 表示, 会直接给返回相应的内容

.*? 表示可以匹配任意字符串, 除了\n换行符以外

提取标题

    title = re.findall('<title data-react-helmet="true">(.*?)</title>', response.text, re.S)[0]

替换一下特殊字符

title = re.sub(r'[\/:*?"<>|\n]', '', title)

提取视频信息

video_info = re.findall('<script id="RENDER_DATA" type="application/json">(.*?)</script', response.text)[0]

数据进行解码

html_data = requests.utils.unquote(video_info)

转换数据类型

json_data = json.loads(html_data)

键值对取值, 根据冒号左边的内容[键], 提取冒号右边的内容[值]

video_url = 'https:' + json_data['41']['aweme']['detail']['video']['bitRateList'][0]['playAddr'][0]['src']
print(title)
print(video_url)

4. 保存数据

    video_content = requests.get(url=video_url, headers=headers).contentwith open('video\\' + title + '.mp4', mode='wb') as f:f.write(video_content)

我是爱学python的蚂蚁，咱下篇文章再见啦(✿◡‿◡)

有更多建议或问题可以评论区或私信我哦！一起加油努力叭(ง •_•)ง

喜欢就关注一下博主，或点赞收藏评论一下我的文章叭！！！

在这里插入图片描述

查看全文

http://www.ds6.com.cn/news/60892.html

去哪个网站可以做写手机构类网站有哪些

营销型网站建设合同模板江苏搜索引擎优化

在线网站制作模拟百度风云排行榜

电脑做兼职找那个网站百度搜索引擎优化的养成良好心态

甘孜建设机械网站湖南网站建设加盟代理

WordPress整合whmcsseo推广软件下载

奢侈品网站建设方案南京seo排名优化公司

wordpress 编辑代码郑州seo顾问阿亮

有那个网站做简历模板千锋教育学费多少

软件开发的生命周期北京快速优化排名

论坛模板网站建设百度seo排名优化公司推荐

沈阳市建设工程质量检测中心网站抖音指数查询

网站建设实物实训目的网页设计主题推荐

jsp动态网站开发实践教程电子档重庆seo网站排名

域名解析站长工具seo最强

许嵩做的网站广告公司主要做什么

wordpress怎么上传视频教程seo行业网

惠州网站建设制作seo技术是干什么的

江门外贸网站推广方案百度站点

做网上夫妻去哪个网站今天重大新闻国内最新消息

自适应网站的图做多大怎么切app开发公司排名

前端开发简历承德seo

做网站月入过万十大嵌入式培训机构

tech域名可以做网站吗内江seo

图片轮播wordpress百度seo关键词排名优化软件

香河做网站seo全网优化指南

网站开发 c软文推广怎么做

塘沽网站建设线上宣传方式

枣庄市庄里水库建设管理处网站品牌营销策略论文

最权威的做网站的公司哪家好qq群排名优化软件官网

人生苦短 我用python~

环境使用:

模块使用:

基本思路流程: <通用>

代码展示

访问网址【需要网址的私我吧这不给放】

模拟伪装

发送请求

提取标题

我是爱学python的蚂蚁，咱下篇文章再见啦(✿◡‿◡)

相关文章：

人生苦短我用python~