python将HTML转PDF
简介公司项目一个需求,需要将生成的html报告转换成PDF,于是想将这些网页都下载下来然后转成pdf保存。这里主要用到pdfkit包,前提是电脑安装了wkhtmltox软件。也就是说,HTML2PDF的工作是由wkhtmltox完成的,python只是调用了其接口而已。
pdfkit,把HTML+CSS格式的文件转换成PDF格式文档的一种工具。
公司项目一个需求,需要将生成的html报告转换成PDF,于是想将这些网页都下载下来然后转成pdf保存。
这里主要用到pdfkit包,前提是电脑安装了wkhtmltox软件。也就是说,HTML2PDF的工作是由wkhtmltox完成的,python只是调用了其接口而已。
pdfkit,把HTML+CSS格式的文件转换成PDF格式文档的一种工具。
1.安装wkhtmltox软件
通过http://wkhtmltopdf.org/index.html下载软件,注意版本对应,python 32位的对应wkhtmltox 32位版本。
2.将wkhtmltox的bin目录添加至path环境变量
3.转换方式
import pdfkit
# 有下面3中途径生产pdf
pdfkit.from_url('https://www.baidu.com', 'out.pdf') #将url网页转成pdf
pdfkit.from_file('test.html', 'out.pdf') #将html文件转成pdf
pdfkit.from_string('Hello!', 'out.pdf') #将字符串转成pdf
4、如果没有将wkhtmltox的bin目录添加至path环境变量
程序需要这样写:
#coding=utf-8
import pdfkit
path_wk = '/root/wkhtmltox/bin/wkhtmltopdf' #wkhtmltox路径
config = pdfkit.configuration(wkhtmltopdf = path_wk)
pdfkit.from_url('http://www.baidu.com', 'out.pdf', configuration=config)