当前位置: 首页 > news >正文

如何做图片 网站 链接网络营销名词解释答案

如何做图片 网站 链接,网络营销名词解释答案,江苏高效网站制作机构,建设招标项目常挂网站有哪些利用 TableGeneration 生成多样化表格数据 TableGeneration 简介环境准备chrome浏览器(Linux下推荐)火狐浏览器(Mac下推荐) 生成表格生成表格 参数说明结论 在数据生成和处理领域,表格数据的生成是一个常见需求,尤其是在机器学习和数据分析领域。今天&am…

利用 TableGeneration 生成多样化表格数据

    • TableGeneration 简介
    • 环境准备
      • chrome浏览器(Linux下推荐)
      • 火狐浏览器(Mac下推荐)
    • 生成表格
      • 生成表格
    • 参数说明
    • 结论

在数据生成和处理领域,表格数据的生成是一个常见需求,尤其是在机器学习和数据分析领域。今天,我们将介绍一个名为 TableGeneration 的工具,它可以帮助我们生成具有多种配置参数的表格数据。这个工具不仅支持生成不同行列数的表格,还可以模拟真实世界中的表格特性,如合并单元格和着色单元格。

TableGeneration 简介

TableGeneration 是一个基于 Python 开发的工具,它利用浏览器渲染技术生成表格图像。这个工具的特点在于其高度的可配置性,用户可以根据需求自定义表格的多种属性。生成的表格可以用于各种场景,如数据分析和机器学习中的数据集构建。
GitHub 页面

环境准备

安装python包

pip3 install -r requirements.txt

目前支持使用chrome浏览器和火狐浏览器,使用方式分别如下

chrome浏览器(Linux下推荐)

  • 安装chrome浏览器和中文字体
wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome-stable_current_amd64.deb
apt-get update && sudo apt-get install libnss3
apt-get install xfonts-wqy
apt install ttf-wqy-zenhei
apt install fonts-wqy-microhei
# refresh fonts
fc-cache -fv
  • 安装chrome浏览器驱动 chromedriver

首先在官网下载适合自己系统的驱动文件。然后执行下列命令

unzip chromedriver_linux64.zip
cp chromedriver /usr/local/share/
ln -s /usr/local/share/chromedriver /usr/local/bin/chromedriver
ln -s /usr/local/share/chromedriver /usr/bin/chromedriver
  • 测试浏览器和chromedriver

使用如下命令测试chromedriver和chrome浏览器是否安装正确

from selenium import webdriveroptions = webdriver.ChromeOptions()
options.add_argument('--headless')
options.add_argument('--no-sandbox')
driver = webdriver.Chrome(chrome_options=options)
driver.get('https:www.baidu.com')
print(driver.title)
driver.close()

如果成功,会在终端看见如下输出

百度一下,你就知道

火狐浏览器(Mac下推荐)

  • 安装火狐浏览器和中文字体
apt-get -y install firefox
apt-get install xfonts-wqy
apt install ttf-wqy-zenhei
apt install fonts-wqy-microhei
# refresh fonts
fc-cache -fv
  • 安装火狐浏览器驱动 geckodriver

首先在官网下载适合自己系统的驱动文件。然后执行下列命令

tar -xf geckodriver-v0.31.0-linux64.tar.gz
cp geckodriver /usr/local/share/
ln -s /usr/local/share/geckodriver /usr/local/bin/geckodriver
ln -s /usr/local/share/geckodriver /usr/bin/geckodriver
  • 测试浏览器和geckodriver

使用如下命令测试geckodriver和火狐是否安装正确

from selenium import webdriveroptions = webdriver.FirefoxOptions()
options.add_argument('--headless')
driver = webdriver.Firefox(firefox_options=options)
driver.get('https:www.baidu.com')
print(driver.title)
driver.close()

如果成功,会在终端看见如下输出

百度一下,你就知道

生成表格

生成表格

使用如下命令可生成表格,ch_dict_pathen_dict_path
不指定时,将会使用默认的中英文语料。最终生成的表格图片,表格html文件和PP-Structure格式标注文件会保存在output指定路径下。

# 简单表格
python3 generate_data.py --output output/simple_table --num=1
# 单元格坐标为单元格内文字坐标的表格
python3 generate_data.py --output output/simple_table --num=1 --cell_box_type='text'
# 彩色单元格表格
python3 generate_data.py --output output/color_simple_table --num=1 --color_prob=0.3
# 清单类表格
python3 generate_data.py --output output/qd_table --num=1 --min_row=10 --max_row=80 --min_col=4 --max_col=8 --min_txt_len=2 --max_txt_len=10 --max_span_row_count=3 --max_span_col_count=3 --max_span_value=20 --color_prob=0 --brower_width=1920 --brower_height=5000
# 大单元格表格
python3 generate_data.py --output output/big_cell_table --num=1 --min_row=6 --max_row=10 --min_col=4 --max_col=8 --min_txt_len=2 --max_txt_len=10 --max_span_row_count=3 --max_span_col_count=3 --max_span_value=10 --color_prob=0 --cell_max_width=100 --cell_max_height=100 --brower_width=1920 --brower_height=1920

参数说明

让我们详细了解一下 TableGeneration 的一些关键参数:

  • --output output/qd_table:指定输出目录。这里我们设置输出目录为 output/qd_table
  • --num=1:指定生成表格的数量。这里我们只生成一个表格。
  • --min_row=10--max_row=80:设置表格的行数范围。表格将包含 10 到 80 行。
  • --min_col=4--max_col=8:设置表格的列数范围。表格将包含 4 到 8 列。
  • --min_txt_len=2--max_txt_len=10:设置单元格中文本长度的范围。文本长度将在 2 到 10 个字符之间。
  • --max_span_row_count=3--max_span_col_count=3:设置合并单元格的行数和列数范围。合并单元格将最多跨越 3 行和 3 列。
  • --max_span_value=20:设置合并单元格中的最大数值。这里我们设置最大数值为 20。
  • --color_prob=0:设置单元格着色的概率。这里我们设置为 0,即不使用颜色。
  • --browser_width=1920--browser_height=5000:设置生成表格的浏览器宽度和高度。这里我们分别设置为 1920 像素和 5000 像素。
    通过这些参数,我们可以生成具有特定行列数、文本长度、合并单元格特性以及尺寸的表格。

结论

TableGeneration 是一个强大且灵活的工具,可以用于生成各种类型的表格数据。它的可配置性使得用户能够根据特定需求生成表格,从而在数据分析和机器学习项目中模拟真实世界的表格数据。通过简单的命令行操作,我们可以生成具有不同行列数、文本长度、合并单元格和尺寸的表格,为我们的项目提供丰富的数据支持。
群内交流更多技术
130856474 <-- 在这里

http://www.ds6.com.cn/news/90139.html

相关文章:

  • 南阳网页制作公司东莞网站seo优化托管
  • 差异基因做聚类分析网站seo是什么意思蜘蛛屯
  • o2o电子商务网站建设138ip查询网域名解析
  • 南通科技网站建设南京百度seo排名
  • 做外贸的要有自己的网站吗郑州网络推广服务
  • 跨境电商网站 建设要求台州网络推广
  • 云南昆明网站建设公司武汉建站优化厂家
  • 企业网站怎么做软文接单平台
  • 复旦学霸张立勇做的有关寺庙网站上海网络公司seo
  • 做cpa色诱网站用什么域名空间建站搜索引擎优化中的步骤包括
  • 资源网站快速优化排名有什么好用的搜索引擎
  • 医疗网站 seo怎么做竞价培训
  • 嘉兴网页制作网站排名百度seo推广价格
  • 河北省建设网站锁安装什么驱动seo和sem哪个工资高
  • 预付网站制作费怎么做凭证长春网站建设公司哪家好
  • 建设平台公司公司seo是指什么意思
  • 网站运营开发托管海外推广渠道
  • 怎么优化推广自己的网站快排seo软件
  • 西宁疫情最新消息今天新增病例北京网优化seo公司
  • 可以做动效的网站必应搜索引擎网址
  • 平价网站平价网站建设建设什么都不懂能去干运营吗
  • 雷州网站开发公司网站如何做seo排名
  • 阻止网站查到访问者ip新郑网络推广
  • 网站开发网站制作报价国外网络推广
  • 低价网站建设哪家更好天津百度推广电话号码
  • wordpress参考书seo关键词查询
  • 渭南市网站建设企业网站托管
  • 丹东淘宝做网站谷歌sem和seo区别
  • 四六级查成绩网站怎么做手机网站自助建站系统
  • 局域网站建设电商广告