当前位置: 首页 > news >正文

深圳有哪些网站是做餐饮沙龙的结构优化

深圳有哪些网站是做餐饮沙龙的,结构优化,做b2b_b2c型的混合网站,自己做网站用买域名吗通过输入搜索的关键字,和搜索页数范围,爬出指定文本内内容并存入到txt文档。代码逐行讲解。 使用re、res、BeautifulSoup包读取,代码已测,可以运行。txt文档内容不乱码。 import re import requests from bs4 import BeautifulS…

通过输入搜索的关键字,和搜索页数范围,爬出指定文本内内容并存入到txt文档。代码逐行讲解。

使用re、res、BeautifulSoup包读取,代码已测,可以运行。txt文档内容不乱码。

import re
import requests
from bs4 import BeautifulSouptitles = []                                                             #存放文档标题
urls = []                                                               #存放每个文档链接keyword = input("请输入想要查找的关键字:")                              
pagenum = input("请输入想要查找的页数:")                                        
txt_name = keyword + ":前" + pagenum + "页内容.txt"                        with open(txt_name,'w',encoding='utf-8') as f:                             # 创建txt文件f.write(txt_name + '\r')                                               # 将文件名写入f.close()# 每页内容单独爬取
for i in range(1, int(pagenum)+1):                               html = "http://www.ofweek.com/newquery.action?keywords="+keyword+"&type=1&pagenum=" + str(i)         # 根据关键词和页数生成链接resp = requests.get(html)                             # get获取数据,访问拼接后的url                                    resp.encoding = 'gb18030'                             # 读取中文时不会出现乱码content = resp.text                  # 拿到网站的数据,捕获到的网页内容给content变量# html文件解析,解析响应的文件内容,html.text 是 HTML 文档的源代码,# 'html.parser' 是解析器,用于指定如何解析 HTML 文档bs = BeautifulSoup(content,'html.parser')#每个标题都存在类名为no-pic的li标签里面for news in bs.select('div.zx-tl'): url = news.select('a')[0]['href']                     # 提取文章链接urls.append(url) title = news.select('a')[0].text                      # 提取文章标题titles.append(title)for i in range(len(urls)):                                    # 遍历每篇文章的链接resp = requests.get(urls[i])resp.encoding='gb18030'content = resp.textbs = BeautifulSoup(content,'html.parser')#文章的内容是存在类名为artical-content的div块里面page_content = bs.select('div.artical-content')[0].textwith open(txt_name,'a',encoding='utf-8') as f:            # 写入txt文件f.write("\n"+titles[i]+page_content)f.close()print("文件保存成功!")

http://www.ds6.com.cn/news/118135.html

相关文章:

  • 常德做网站网站的推广
  • 东营市住房和城乡建设委员会网站西安互联网推广公司
  • 哪里有做网站开发微信加人推码35一单
  • 设置一个好的网站导航栏seo准
  • 手机可以看的网站爱链接购买链接
  • 网站如何做聚合页面实时seo排名点击软件
  • 支付网站建设要求保定seo排名
  • 平顶山集团网站建设西安发布最新通知
  • 上海网站建设褐公洲司故事性营销软文
  • 网站建设的专业知识网站搜索系统
  • 页面设计优缺点北京seo招聘网
  • 精湛的中山网站建设seo排名资源
  • 静态网页做的网站怎么发到网上自己怎么免费做网站
  • 商城网站设计价格沈阳seo排名优化教程
  • 百度关键词规划师工具优化方法
  • 潜江做网站西安百度推广开户
  • java做的网站phpseo网站技术培训
  • 阿里云营销网站建设制作网站需要什么软件
  • 青海省建设厅报名网站搜索引擎优化的基本手段
  • 怎样做能让招聘网站记住密码十大新媒体平台有哪些
  • 潍坊百度网站建设搜一下百度
  • 软文网站有哪些百度知道推广软件
  • 企业3合1网站建设公司google关键词搜索技巧
  • 网站制作找哪个百度一下下载
  • 室内装修设计网站推荐seo测试工具
  • 网站建设个人网站怎么自己做网站
  • 广州网站建设网站制作app优化网站
  • html代码跟网站运营的关系搜索引擎营销的模式有哪些
  • 苏州个人网站建设百度手机网页版入口
  • 金华网站建设luopan上海网站推广服务公司