UNIXwork

stapler - Ein Commandline PDF-Werkzeug

2. December 2019

Mein bevorzugtes Tool, um z.B. aus PDFs Seiten zu extrahieren oder Dokumente zusammenzufügen, war mal pdftk, was allerdings nicht mehr weiterentwickelt wird und da es auch auf gcj basiert, der auch Geschichte ist, kriegt man es auch nicht mehr wirklich zum laufen. Als Alternative habe ich stapler entdeckt, was ähnlich leicht zu benutzen ist. Das Tool gibts auch im Fedora-Repo, dort heißt es allerdings pdf-stapler und wird auch über diesen Namen aufgerufen. Bei Ubuntu gibts das Programm hingegen nicht im Repository.

Hier mal ein paar Beispiele:

Seiten extrahieren

stapler sel doc.pdf 1 out.pdf
stapler sel doc.pdf 4-6 out.pdf

Reihenfolge von Seiten umkehren

stapler sel doc.pdf 3-1 out.pdf

Seiten drehen

stapler sel doc.pdf 1D out.pdf
stapler sel doc.pdf 1L out.pdf
stapler sel doc.pdf 1R out.pdf

D steht für Down, L für Left und R für Right.

Dokumente zusammenfügen

stapler sel file1.pdf file2.pdf out.pdf

Es können nach dem Dateinamen auch Selektierungsanweisungen (siehe oben) angegeben werden:

stapler sel file1.pdf 1-2 file2.pdf 6-9 out.pdf

Dokument splitten

stapler split doc.pdf
Autor: Olaf | 0 Kommentare | Tags: pdf, shell

PDF-Dateien bearbeiten mit pdftk

21. November 2014

Um PDF-Dateien zu manipulieren, wie etwa Seiten zu extrahieren oder mehrere Dokumente zu einem zusammenzufügen, gibt es viele verschiedene Werkzeuge, und jeder hat vermutlich ein anderes Lieblingstool dafür. Ich benutze dafür das Kommandozeilenprogramm pdftk. Ein paar einfache Beispiele:

Seiten extrahieren:

pdftk input.pdf cat 1 output page1.pdf
pdftk input.pdf cat 2-3 output page2-3.pdf

Dokument komplett zerlegen:

pdftk input.pdf burst output page%03d.pdf

Dateien zusammenfügen:

pdftk doc1.pdf doc2.pdf cat output newdoc.pdf
pdftk A=doc1.pdf B=doc2.pdf cat A1 B2-5 output newdoc.pdf

Metadaten anzeigen:

pdftk input.pdf dump_data
Autor: Olaf | 0 Kommentare | Tags: pdf