当前位置: 首页 > news >正文

在家做十字绣兼职网站宁波seo整体优化公司

在家做十字绣兼职网站,宁波seo整体优化公司,专业网站设计师去哪找,wordpress 下载主题失败在爬学校安全教育题库的时候发现题库分页实际上执行了一段js代码,如下图所示 点击下一页时是执行了函数doPostBack,查看页面源码如下 点击下一页后这段js提交了一个表单,随后后端返回对应数据,一开始尝试分析获取对应两个参数&a…

在爬学校安全教育题库的时候发现题库分页实际上执行了一段js代码,如下图所示在这里插入图片描述
在这里插入图片描述
点击下一页时是执行了函数doPostBack,查看页面源码如下
在这里插入图片描述
点击下一页后这段js提交了一个表单,随后后端返回对应数据,一开始尝试分析获取对应两个参数,封装在data中通过POST请求获得新的一页,后面尝试了很久始终不成功…(肯定是因为太菜)

没办法只能使用神器selenium,缺点是要调用浏览器,肯定是比较慢的,但是python直接给你模拟浏览器的各种操作,而且不用抓包分析,比较方便。所以还是偷偷懒,注意,除了python要安装selenium之外,还需要安装对应浏览器的web驱动,这里我用的是谷歌浏览器,驱动下载地址:
镜像:https://registry.npmmirror.com/binary.html?path=chromedriver/
如果你谷歌版本新,镜像上可能没有对应版本。
官网:https://sites.google.com/chromium.org/driver/downloads(117以上在这里找:这里~)

下载好后就是正常的爬虫步骤,直接看代码吧:

import docx
from selenium import webdriver
import html2text
import timeidx = [4, 5, 9, 10, 11, 13, 14, 15, 16]
srcsel = 'xxxx/Web/userSingle.aspx?ID='  # 选择题
srcjg = 'xxxx/Web/userIs.aspx?ID='  # 判断题def remove_tags(text):h = html2text.HTML2Text()h.ignore_links = Truereturn h.handle(text)def process(url):driver = webdriver.Chrome()driver.get(url)res = driver.find_element("id", 'GridViewx').get_attribute('innerHTML')res = remove_tags(res)doc.add_paragraph().add_run(res)pages = int(driver.find_element("id", 'GridViewx_ctl13_lblPageCount').text)# pages = 2for i in range(pages - 1):time.sleep(1.5)driver.find_element("id", 'GridViewx_ctl13_btnNext').click()res = driver.find_element("id", 'GridViewx').get_attribute('innerHTML')res = remove_tags(res)doc.add_paragraph().add_run(res)driver.quit()doc = docx.Document('res.docx')
for pid in idx:process(srcsel + str(pid))time.sleep(3)process(srcjg + str(pid))
doc.save('res.docx')

为什么多此一举用html2text呢?因为发现这样写又能比较好看(和丑的比起来)还不用自己一条数据一条数据取出来排版。然后代码里我直接写进word文档里了,这里有个小坑,你的word文档(docx)中必须得有东西,不能是空的,要不然会报错…

懒得排版,凑合看看
http://www.ds6.com.cn/news/151.html

相关文章:

  • 如何制作网页图片素材百度seo搜索排名
  • 单页网站如何做排名培训机构哪家最好
  • 什么是响应式网站设计北京推广服务
  • 网站如何备案流程小红书怎么做关键词排名优化
  • 高端h5网站建设 上海跨境电商seo是什么意思
  • 北京做电商网站2024年新闻时事热点论文
  • 做网站的素材都在哪里下载视频号视频怎么看下载链接
  • 达州网站制作写一篇推广商品的软文
  • 专门做旅游的视频网站有哪些长春网站关键词推广
  • 广东移动网站bt蚂蚁磁力搜索天堂
  • 怎样创业白手起家开公司宁波seo关键词费用
  • 做网站维护要学些什么·江东seo做关键词优化
  • 南京网站制作费用网页模板代码
  • 刷赞网站怎么做的外贸网站建设推广
  • 做网站便宜网络广告图片
  • 做神马网站优化排名建站流程新手搭建网站第一步
  • 网站制作公司交接网站网站广告费一般多少钱
  • wordpress网站搭建教程微信营销模式
  • flash网站制作公司百度官方人工客服电话
  • 高要区公路建设规划局网站公司网站制作教程
  • 西宁设计网站建设网站运营推广
  • 浙江省工程建设协会网站女教师遭网课入侵直播录屏曝光se
  • 水利网站建设中国建设网官方网站
  • 长沙的最新疫情通报轨迹广州网站优化推广方案
  • 凯里网站制作网文推广怎么做
  • dede 管理多个网站网站建设的好公司
  • 杭州网站建设电话搜索引擎优化的核心是
  • phpcms做双语网站seo网站优化服务合同
  • 深圳好点的网站建设公司优化网哪个牌子好
  • 做网站 模板网络服务有哪些