python将HTML转PDF

xiaohai 2020-08-21 14:30:22 2087人围观 标签: Python 
简介公司项目一个需求,需要将生成的html报告转换成PDF,于是想将这些网页都下载下来然后转成pdf保存。这里主要用到pdfkit包,前提是电脑安装了wkhtmltox软件。也就是说,HTML2PDF的工作是由wkhtmltox完成的,python只是调用了其接口而已。 pdfkit,把HTML+CSS格式的文件转换成PDF格式文档的一种工具。

公司项目一个需求,需要将生成的html报告转换成PDF,于是想将这些网页都下载下来然后转成pdf保存。

这里主要用到pdfkit包,前提是电脑安装了wkhtmltox软件。也就是说,HTML2PDF的工作是由wkhtmltox完成的,python只是调用了其接口而已。

pdfkit,把HTML+CSS格式的文件转换成PDF格式文档的一种工具。

1.安装wkhtmltox软件

通过http://wkhtmltopdf.org/index.html下载软件,注意版本对应,python 32位的对应wkhtmltox 32位版本。

2.将wkhtmltox的bin目录添加至path环境变量
3.转换方式
import pdfkit # 有下面3中途径生产pdf pdfkit.from_url('https://www.baidu.com', 'out.pdf') #将url网页转成pdf pdfkit.from_file('test.html', 'out.pdf') #将html文件转成pdf pdfkit.from_string('Hello!', 'out.pdf') #将字符串转成pdf
4、如果没有将wkhtmltox的bin目录添加至path环境变量

程序需要这样写:

#coding=utf-8 import pdfkit path_wk = '/root/wkhtmltox/bin/wkhtmltopdf' #wkhtmltox路径 config = pdfkit.configuration(wkhtmltopdf = path_wk) pdfkit.from_url('http://www.baidu.com', 'out.pdf', configuration=config)