本文概述

与PHP不同, 没有很多可用的库可以用Python中的HTML创建PDF, 但是并不支持该库。在本文中, 你将学习如何在Django中使用wkhtmltopdf创建PDF。

wkhtmltopdf是一个命令行工具, 可使用Qt WebKit渲染引擎将HTML渲染为PDF和各种图像格式。它们完全”无头运行”, 不需要显示或显示服务。

要求

你需要wkhtmltopdf在系统中可用并且在命令提示符下可访问。

  • Windows:你可以在安装区域中下载每种体系结构(x86和x64)的安装程序。尽管你可以稍后在代码中更改wkhtmltopdf可执行文件的路径, 但是建议将wkhtmltopdf用作系统上的环境变量。你可以在本文中阅读如何在Windows中创建环境变量。
  • Debian / Ubuntu:你可以使用以下命令直接在控制台中从wkhtmltopdf安装发行版:
$ sudo apt-get install wkhtmltopdf

警告! debian / ubuntu仓库中的版本功能减少(因为它编译时未添加wkhtmltopdf QT补丁), 例如添加了轮廓, 页眉, 页脚, TOC等。要使用此选项, 应从wkhtmltopdf网站安装静态二进制文件, 或者可以使用此脚本。

在此处访问wkhtmltopdf的主页以获取更多信息。

实现

现在我们的环境中已经有wkhtmltopdf可用, 我们只需要使用它即可!但是, 使用PDFKit可以轻松地在Django中创建PDF, 而不是自己处理控制台命令。 PDFKit是一个Python包装器, 可使用Webkit呈现引擎(wkhtmltopdf)和qt将html转换为pdf, 你可以访问Github中的存储库以获取更多信息。

使用以下命令将PDFKit库包含到django项目中:

$ pip install pdfkit

由于wkhtmltopdf为你完成了艰苦的工作, 因此PDFKit的使用非常简单, 几乎涵盖了所有用例:

  • 从html字符串创建PDF。
  • 从Web网址(外部或项目网址)创建PDF。
#import pdfkit into your class
import pdfkit

# Generate PDF from a web URL (maybe only from your project)
pdfkit.from_url('http://google.com', 'out.pdf')
# Generate PDF from a html file.
pdfkit.from_file('file.html', 'out.pdf')
# Generate PDF from a plain html string.
pdfkit.from_string('Hello!', 'out.pdf')

# Save the PDF in a variable
myPdf = pdfkit.from_url('http://google.com', False)

你基本上可以轻松, 快速地动态生成PDF。

例子

使用Django和PDFKit生成PDF很容易, 请查看以下示例:

将PDF保存在服务器上

要在本地保存PDF, 请使用任何方法并提供将文件保存为第二个参数的路径和文件名。

import pdfkit
from django.http import HttpResponse

def index(request):
    pdf = pdfkit.from_url("http://ourcodeworld.com", "ourcodeworld.pdf")

    return HttpResponse("Everything working good, check out the root of your project to see the generated PDF.")

前面的示例将在Django项目的根目录中创建PDF。

传回PDF作为回应

你可以直接从PDFKit中检索文件, 而无需将其保存在系统中, 只需提供False作为目标参数即可。

你可以使用以下代码段返回PDF作为响应:

import pdfkit
from django.http import HttpResponse

def index(request):
    # Use False instead of output path to save pdf to a variable
    pdf = pdfkit.from_url('http://ourcodeworld.com', False)
    response = HttpResponse(pdf, content_type='application/pdf')
    response['Content-Disposition'] = 'attachment; filename="ourcodeworld.pdf"'

    return response

如果使用此功能导航至路线, 浏览器将开始下载由控制器生成的PDF。

从项目路线生成PDF

你可以从你的项目的路线(显然需要注册)生成PDF并使用pdf.from_url方法。

import pdfkit
from django.http import HttpResponse

def template(request):
    # Returns some HTML as response
    return HttpResponse("<h1>Hello World</h1>")

def pdf(request):

    # Create a URL of our project and go to the template route
    projectUrl = request.get_host() + '/template'
    pdf = pdfkit.from_url(projectUrl, False)
    # Generate download
    response = HttpResponse(pdf, content_type='application/pdf')
    response['Content-Disposition'] = 'attachment; filename="ourcodeworld.pdf"'

    return response

pdf输出将是Hello World的文档!作为内容。

注意:或者, 你可以在变量中将模板呈现为html, 然后使用pdfkit.from_string方法, 而不是向项目的端点创建请求。

其他设定

自定义wkhtmltopdf路径

如果要修改wkhtmltopdf所在的路径, 可以使用pdfkit的配置方法进行更改:

config = pdfkit.configuration(wkhtmltopdf='/opt/bin/wkhtmltopdf'))
pdfkit.from_string("<h1>Hello World</h1>", output_file, configuration=config)

PDF设置

你可以指定所有wkhtmltopdf选项。你可以在选项名称中添加” –”。如果选项没有值, 则对dict值使用None, False或”:

options = {
    'page-size': 'Letter', 'margin-top': '0.75in', 'margin-right': '0.75in', 'margin-bottom': '0.75in', 'margin-left': '0.75in', 'encoding': "UTF-8", 'no-outline': None
}

pdfkit.from_url('http://google.com', 'out.pdf', options=options)

wkhtmltopdf输出

默认情况下, PDFKit将显示所有wkhtmltopdf输出:

wkhtmltopdf输出

如果你不想要它, 则需要在所用方法的配置中设置静默选项:

options = {
    'quiet': ''
}

pdfkit.from_url('google.com', 'out.pdf', options=options)

基本故障排除

在Python中使用PDFKit时, 有两个已知的常见问题:

IOError-找不到wkhtmltopdf可执行文件

发生此错误的原因是你的系统中没有wkhtmltopdf分发。如果已经安装, 则在控制台中可能无法作为命令使用。打开系统控制台, 并验证wkhtmltopdf命令是否存在。

IOError-命令失败

wkhtmltopdf出了点问题, 无法实现该操作。尝试在控制台中执行plain命令, 并检查任何可能的错误(该网页不存在, 该文件不存在, 等等)。

玩得开心 !