Inhoud

Werken met afbeeldingen uit PDF en PostScript bestanden

Inleiding

Bestanden van het type “PDF” en “PostScript” (printbestanden) kunnen grafische afbeeldingen bevatten.
Deze afbeeldingen kunnen bestaan uit pixel-images (foto's, scans), maar ze kunnen ook opgebouwd zijn uit vectoren (tekeningen).
Dit document geeft informatie over de mogelijkheden om afbeeldingen uit “PDF” (.pdf) en “PostScript” (.ps) bestanden te extraheren, zodat deze verder bewerkt kunnen worden.

Extraheren van vector afbeeldingen

Indien de afbeeldingen opgebouwd zijn uit vectoren, is het in principe mogelijk deze afbeeldingen te bewerken in vector geori_e:nteerde tekenprogramma's.
Over het algemeen zijn deze programma's echter niet in staat om “PDF” of “PostScript” bestanden direct in te lezen.

Het conversie programma pstoedit kan hier uitkomst bieden.
Met “pstoedit” kunnen vector afbeeldingen uit “.pdf” of “.ps” bestanden worden omgezet naar diverse formaten, waaronder “DXF” formaat (CAD exchange format, geschikt voor bv. QCad en Autocad):

$ pstoedit [options]  -f "format[:options]"  PDF-file|PS-file  outfile

Voorbeeld: tekening van “PDF” omzetten naar “DXF”

$ pstoedit [-rotate 90] [-xscale 1.0] [-yscale 1.0] \
  -f "dxf_s: -mm -ctl -polyaslines -splineasnurb" \
  tekening.pdf tekening.dxf
pstoedit opties
-rotate 90 roteer 90 gr tegen de klok in
-xscale 1.0 schaal in X-as met factor 1.0
-xscale 1.0 schaal in Y-as met factor 1.0
-f “dxf_s: [dxf_s opties]” converteer naar DXF met splines
dxf_s opties
-mm gebruik co_o:rdinaten i.p.v. points in DXF (mm=pt/72*25.4)
-ctl map elke kleur naar een DXF layer
-polyaslines converteer polylines naar enkele lijnelementen (qcad)
-splineasnurb converteer splines naar type NURB (qcad)

Zie verder: man pstoedit

Extraheren van pixel-images

Met het foto- en beeldbewerkingsprogramma “gimp” kunnen “PDF” en “PostScript” bestanden direct worden ingelezen.
Een “.pdf” of “.ps” bestand kan echter afbeeldingen bevatten die uit meerdere lagen bestaan.

Het programma pdfimages kan gelaagde pixel-images uit een “PDF” bestand laag voor laag extraheren naar afzonderlijke bestanden 1):

$ pdfimages [options] PDF-file image-root

De afzonderlijke bestanden krijgen als basisnaam de gekozen “image-root” gevolgd door een streepje (-), een “image-number” (start met 000) en het bestandstype (.ppm, .pbm, .jpg).

Voorbeeld: afbeelding met gekleurde en zwart-wit lagen extraheren naar losse bestanden

$ pdfimages afbeelding.pdf afbeelding

Dit geeft als resultaat:

$ ls -1
afbeelding-000.ppm
afbeelding-001.pbm
afbeelding-002.pbm
..

Zie verder: man pdfimages

.

Copyright © 2012 Integrated Services; Tux4u.nl
Author: Marjan Waldorp; pdf-ps-image-extract 2012-02-14

1)
“PostScript” bestand: gebruik eerst ps2pdf om het “.ps” bestand in een “.pdf” bestand om te zetten.