Bestanden van het type “PDF” en “PostScript” (printbestanden) kunnen
grafische afbeeldingen bevatten.
Deze afbeeldingen kunnen bestaan uit pixel-images (foto's, scans),
maar ze kunnen ook opgebouwd zijn uit vectoren (tekeningen).
Dit document geeft informatie over de mogelijkheden om afbeeldingen
uit “PDF” (.pdf) en “PostScript” (.ps) bestanden te extraheren, zodat deze
verder bewerkt kunnen worden.
Indien de afbeeldingen opgebouwd zijn uit vectoren, is het in principe
mogelijk deze afbeeldingen te bewerken in vector geori_e:nteerde
tekenprogramma's.
Over het algemeen zijn deze programma's echter niet in staat om
“PDF” of “PostScript” bestanden direct in te lezen.
Het conversie programma pstoedit kan hier uitkomst bieden.
Met “pstoedit” kunnen vector afbeeldingen uit “.pdf” of “.ps”
bestanden worden omgezet naar diverse formaten, waaronder “DXF”
formaat (CAD exchange format, geschikt voor bv. QCad en Autocad):
$ pstoedit [options] -f "format[:options]" PDF-file|PS-file outfile
Voorbeeld: tekening van “PDF” omzetten naar “DXF”
$ pstoedit [-rotate 90] [-xscale 1.0] [-yscale 1.0] \ -f "dxf_s: -mm -ctl -polyaslines -splineasnurb" \ tekening.pdf tekening.dxf
pstoedit opties | |
---|---|
-rotate 90 | roteer 90 gr tegen de klok in |
-xscale 1.0 | schaal in X-as met factor 1.0 |
-xscale 1.0 | schaal in Y-as met factor 1.0 |
-f “dxf_s: [dxf_s opties]” | converteer naar DXF met splines |
dxf_s opties | |
-mm | gebruik co_o:rdinaten i.p.v. points in DXF (mm=pt/72*25.4) |
-ctl | map elke kleur naar een DXF layer |
-polyaslines | converteer polylines naar enkele lijnelementen (qcad) |
-splineasnurb | converteer splines naar type NURB (qcad) |
Zie verder: man pstoedit
Met het foto- en beeldbewerkingsprogramma “gimp” kunnen “PDF” en “PostScript”
bestanden direct worden ingelezen.
Een “.pdf” of “.ps” bestand kan echter afbeeldingen bevatten die uit meerdere
lagen bestaan.
Het programma pdfimages kan gelaagde pixel-images uit een “PDF” bestand laag voor laag extraheren naar afzonderlijke bestanden 1):
$ pdfimages [options] PDF-file image-root
De afzonderlijke bestanden krijgen als basisnaam de gekozen “image-root” gevolgd door een streepje (-), een “image-number” (start met 000) en het bestandstype (.ppm, .pbm, .jpg).
Voorbeeld: afbeelding met gekleurde en zwart-wit lagen extraheren naar losse bestanden
$ pdfimages afbeelding.pdf afbeelding
Dit geeft als resultaat:
$ ls -1 afbeelding-000.ppm afbeelding-001.pbm afbeelding-002.pbm ..
Zie verder: man pdfimages
Copyright © 2012 Integrated Services; Tux4u.nl
Author: Marjan Waldorp; pdf-ps-image-extract 2012-02-14