Bærbart dokumentformat

fra Wikipedia, den frie encyklopedi
Hopp til navigasjon Hopp til søk
Bærbart dokumentformat (PDF)
PDF -filikon
Adobe PDF -logo
Filutvidelse : .pdf
MIME -type : søknad / pdf
Magisk nummer : % PDF
Utviklet av: PDF -forening
Første utgivelse: 1993 av Adobe Inc.
Gjeldende versjon: 2.0 (fra juli 2017)
Standard (er) : ISO 32000 , Adobe: PDF -referanse (for 1.7 og eldre)
Nettsted : https://www.pdfa.org/


Det bærbare dokumentformatet (engelsk; kort for PDF ; tysk: (transport) bærbart dokumentformat ) er et plattformuavhengig filformat som ble utviklet og utgitt i 1993 av Adobe Inc. og for tiden videreutvikles av PDF Association .

Målet var å lage et filformat for elektroniske dokumenter, slik at de kan reproduseres tro mot originalen uavhengig av det opprinnelige applikasjonsprogrammet, operativsystemet eller maskinvareplattformen. Målet ble nådd og gjenspeiles i ISO 32000 -serien med standarder (ISO 15930 for PDF / X ). For dette formålet ble funksjonaliteten til PostScript -formatet hovedsakelig brukt. En leser av en PDF -fil skal alltid kunne se og skrive ut dokumentet i skjemaet som er angitt av forfatteren. De typiske konverteringsproblemene (for eksempel endrede sideskift eller feil skrifttyper) ved utveksling av et dokument mellom forskjellige programmer elimineres dermed.

I tillegg til tekst, bilder og grafikk, kan en PDF -fil også inneholde hjelpemidler som letter navigering i dokumentet. Dette inkluderer for eksempel klikkbare innholdsfortegnelser og miniatyriserte forhåndsvisninger av sider.

Oversikt

Grunnleggende og programvare

PDF -dokumenter og filer kan opprettes fra tekster , bilder og grafikk - blandet eller individuelt - med de riktige programmene (f.eks. Med gratis programmer som PDFCreator og kontorpakker LibreOffice / OpenOffice.org , gebyrbaserte programmer som Adobe Acrobat eller ganske enkelt via dialogboksen Skriv ut) og vis den med passende leseprogrammer (f.eks. Evince , Ghostscript , Okular , Adobe Reader , Foxit , Preview ). Skaperen av en PDF -fil kan beskytte den mot uønsket bruk på en rekke måter ved å aktivere PDF -sikkerhetsmekanismer. Kryptering brukes for å forhindre uautorisert tilgang. Avhengig av dine behov, kan det hende at det allerede er et passord å åpne filen, eller at kopiering av innhold fra filen eller utskrift ikke er tillatt. Imidlertid er beskyttelsesmekanismene implementert i PDF for dette ikke pålitelige; spesielt enklere former for kryptering er enkle å overvinne.

I oppstartsfasen ble Adobe Reader belastet. Bare gratis distribusjon av programvaren gjorde det mulig å distribuere formatet i den grad det er i dag. PDF har lenge vært et kommersielt ( proprietært ), men åpent filformat dokumentert i Adobes PDF -referansehåndbok. Adobe introduserte den for ISO-standardiseringsprosessen i begynnelsen av 2007, og med utgivelsen 1. juli 2008 er PDF versjon 1.7 som ISO 32000-1: 2008 en åpen standard .

Enkelte metoder for håndtering av PDF har blitt standardisert av ISO på forhånd for å lette datautveksling i prepress (som PDF / X ) og for langsiktig arkivering av PDF-filer (som PDF / A -1 i ISO 19005-1: 2005).

Generasjon og transformasjon

PDF er et vektorbasert sidebeskrivelsesspråk som gjør at skjermen kan fritt skaleres. PDF -filer beskriver oppsettet som ble opprettet med opprettelsesprogrammet i et skjema som er uavhengig av skriveren og standardinnstillingene, proporsjonalt og derfor så tro mot originalen som mulig i prinsippet. Det er her PDF -filen skiller seg vesentlig fra avanserte beskrivelses- og kodespråk som SGML eller HTML når det gjelder kravet om optimal layoutoppfyllelse. For å optimalisere en visning på utdataenheter med et lite visningsområde - for eksempel PDAer eller mobiltelefoner - kan markeringer (som HTML -tagger) lagres i en PDF -fil, slik at sideinnholdet kan brytes opp - deretter uunngåelig med begrensede layout troskap. Slike markeringer gjør det også mulig for et leserprogram å lese dokumentet for synshemmede brukere og gjøre det lettere å konvertere innholdet til andre formater.

Et populært program for å lage PDF -filer er Adobe Acrobat Distiller , som lager PDF -filer fra PostScript -filer. Acrobat Distiller er tilgjengelig som et skrivebordsprodukt for Windows og macOS . Serverversjoner og gratis Adobe Reader finnes også for andre plattformer. Ved hjelp av gratisprogramvaren Wine , kjører Acrobat Distiller også under Linux. Ulike kontor- og DTP -programmer fra andre produsenter tilbyr direkte PDF -eksport og er tilgjengelige på en rekke plattformer . Nå med mange verktøy og programmeringsbiblioteker, kan PDF -filer opprettes på forskjellige måter med forskjellige spesialiseringer. PDF -filer kan opprettes på nesten hvilken som helst plattform.

Adobe gir delvis utviklere retten til å utvikle egne applikasjoner for generering og redigering av PDF -dokumenter, men forbeholder seg opphavsretten til spesifikasjonene. [1] PDF som et sidebeskrivelsesspråk kan sees på som en videreutvikling av PostScript -grafikkmodellen, som også er avslørt. I slutten av februar 2007 kunngjorde Adobe at den ville innlemme versjon 1.7 av PDF -spesifikasjonen i ISO -standardiseringen og jobber med den amerikanske bransjeforeningen AIIM , som har sekretariatet for ISO -komiteen TC 171. Adobe truet Microsoft med antitrust -søksmål hvis den åpne PDF -standarden ble integrert.

Videre generasjonsmetoder behandles under Konvertering av andre formater til PDF .

Bruk og egenskaper

Generelle egenskaper

En PDF -fil kan gjengi dokumenter nøyaktig, inkludert alle farger, raster- og vektorgrafikk og fonter . En av styrkene til PDF er at det finnes visningsprogrammer for alle vanlige plattformer , slik at innholdet kan vises uavhengig av plattformen.

Etterfølgende redigering av PDF -filer er vanskelig. Imidlertid er det forskjellige programmer som du kan kutte ut individuelle sider og endre bestemt innhold med. Fra Microsoft Word versjon 2013 kan PDF -filer konverteres til Word -filer direkte i programmet. [2]

Dokumentets omfang

Størrelsessammenligning: kart over Europa og en PDF -dokumentside med den teoretisk maksimale sidestørrelsen på 381 km × 381 km

PDF -dokumenter kan inneholde flere hundre tusen sider. Sidestørrelsen er ikke begrenset av selve formatet. I Adobe Acrobat er det imidlertid implementeringsbegrensninger:

  • opptil versjon 3 til 45 tommer × 45 tommer (1.143 m × 1.143 m)
  • opptil versjon 6 til 200 tommer × 200 tommer (5,08 m × 5,08 m)
  • fra versjon 7 til 15.000.000 tommer × 15.000.000 tommer (381 km × 381 km)

Lagring av informasjon i dokumentet

All informasjon lagres som nummererte objekter i PDF -filer. Objekter er for eksempel skriftinformasjon, tegnbredder, tegnkoder som brukes (Mac / PC ...), sidebeskrivelser, parametere for dekodere, beskjæringsbokser, individuelle bokmerker, fargedefinisjoner, sideordrer, bitmaps, skjemaer, hoppemerker og alt annet som er lagret i PDF -filer kan være. En hundre siders PDF-fil kan enkelt inneholde 10 000 objekter.

PDF er basert på den samme grafiske modellen som PostScript -sidebeskrivelsesspråket, men tillater noen ekstra funksjoner sammenlignet med dette - spesielt interaktive elementer som bokmerker, kommentarer, skjemafelt og programmering med JavaScript er mulig. Sammenlignet med PostScript er den grafiske modellen for sideinnholdet også utvidet til å omfatte funksjoner som gjennomsiktighet eller valgfritt eller byttbart innhold (referert til som lag i Acrobat -brukergrensesnittet) eller støtte for ICC -profiler og OpenType -fonter.

Skrifter (med unntak av pikselfonter) og vektorgrafikk kan forstørres etter ønske uten tap av kvalitet. Under disse forholdene kan store nettverksplaner og datamodeller lagres på en PDF -side uten tap.

Tekstpassasjer, tabeller og grafikk (inkludert utdrag derav) fra PDF -dokumenter kan enkelt behandles videre i andre applikasjonsprogrammer ved å kopiere og lime inn de respektive elementene, hvis skaperen av dokumentet har gitt tillatelse. Tekst kan trekkes ut ikke bare for videre behandling i andre applikasjoner, men også for surfing eller for bruk med andre utskriftsmedier, for eksempel skjermlesere . Detaljert innhold er lett å finne ved hjelp av tekstsøk i individuelle dokumenter eller fulltekstforskning i en PDF-dokumentsamling. Dette fungerer til og med hvis teksten er grafisk forvrengt, for eksempel i form av en sirkel eller kurve.

Dokumentsikkerhet

Kryptering av PDF -dokumenter

En spesiell funksjon i PDF er den valgfrie dokumentbeskyttelsen med 40 eller 128 biters kryptering . Ved å tilordne et brukerpassord er det mulig å gjøre dokumentet bare tilgjengelig for en begrenset gruppe mennesker. Forfatteren kan også bruke et eget eierpassord for å spesifikt tildele rettigheter til det relevante dokumentet. Dette forhindrer brukere i å endre, skrive ut eller kopiere deler av dokumentet. Selv om du ikke kjenner eierpassordet, kan disse rettighetsbegrensningene imidlertid enkelt fjernes ved hjelp av forskjellige verktøy, spesielt hvis et eierpassord brukes, men åpning av dokumentet krever ikke et passord (dette betyr at det ikke er angitt et brukerpassord) . Bruksrestriksjonene knyttet til kryptering kan lett omgås ved å lagre skjermbilder som bitmaps og deretter bruke optisk tekstgjenkjenning .

Egnede verktøy kan også brukes til å tildele rettigheter som gjør det mulig å legge til notater, kommentarer og filvedlegg i PDF -dokumenter eller for å lagre skjemaoppføringer. Opprinnelig kunne disse funksjonene bare brukes med Adobe Acrobat, men fra versjon 7 er det også mulig med gratis Adobe Reader å legge til notater og kommentarer og fylle ut interaktive skjemafelt, forutsatt at det relevante dokumentet har fått de nødvendige autorisasjonene fra forfatter.

DRM -beskyttede PDF -filer finnes nå også. Disse kan blant annet leses med Adobe Digital Editions .

Sårbarheter forårsaket av menneskelige feil

PDF -filer kan utilsiktet inneholde konfidensiell informasjon som, selv om den ikke er synlig umiddelbart, kan finnes ved hjelp av tekstsøk. På den ene siden kan informasjon skjules av objekter eller plasseres utenfor sidevisningsområdet, på den andre siden kan en PDF -fil inneholde metadata som bare vises når de tilsvarende dialogene blir ringt opp og noen ganger går upåaktet hen. Spesielt når "svarting" av tekstpassasjer er det ikke tilstrekkelig å dekke den relevante tekstpassasjen; den må fjernes helt fra PDF -filen. Det er ikke alltid lett å unngå uønsket informasjon i en PDF -fil, spesielt ikke hvis du ikke bare har opprettet og redigert PDF -filen selv (og dokumentet den ble generert fra). Det er viktig at når du redigerer tekststykker, brukes et verktøy som fjerner det relevante innholdet fullstendig. Det er like viktig å sjekke metadataene (finnes i Acrobat via File / Properties). Acrobat Professional 8 tilbyr omfattende støtte her, spesielt gjennom en spesiell funksjon for å fjerne skjult informasjon.

Casestudier:

Hakk enkelt krypterte eller signerte PDF -dokumenter

I desember 2019 publiserte forskere fra Ruhr University Bochum og IT -sikkerhetsselskapet Hackmanit at det lett var mulig å gjøre endringer i signerte PDF -dokumenter uten at 21 av 22 PDF -lesere la merke til det. Selv Adobe Acrobat Reader markerte ikke senere endringer. Bevisene ble presentert på Chaos Communication Congress i Leipzig fra 27. til 30. desember 2019. Forskerne viste at det var mulig (a) å legge til sider og notater i signerte dokumenter uten å gjøre signaturen ugyldig, (b) å flytte opprinnelig signert innhold til en annen posisjon i dokumentet og skrive noe annet på det opprinnelige stedet, og ( c) å endre ("manipulere") metadataene til signaturen. De berørte PDF -leserne gjenkjente ikke endringen og indikerte fortsatt at signaturen var gyldig. Forskerne var i stand til å gjøre endringene ved hjelp av en enkel tekstredigerer. [3]

Forskerne var også i stand til enkelt å gjøre endringer i krypterte PDF -dokumenter. Selv uten å vite passordet, kunne de innlemme skjulte kommandoer i rollen som en angriper. Hvis angriperen videresender det til den faktiske mottakeren og skriver inn passordet, har angriperen automatisk tilgang til det komplette dekrypterte PDF -innholdet. Dette var mulig ved å bruke to metoder. Den første metoden drar fordel av funksjonen som delvis kan kryptere PDF -filer. Blant annet kan strukturen i PDF-filen endres og ikke-kryptert innhold kan legges til. Så snart dokumentet åpnes av en autorisert person, kan angriperen trekke ut ren tekst og dermed få tilgang til innholdet. Den andre metoden er basert på en sårbarhet i PDF -krypteringens spesifikasjoner. Dette gjør at kryptert innhold kan endres. 27 PDF -lesere ble undersøkt for kryptering. Alle testede PDF -lesere var utsatt for en av disse manipulasjonene. ISO -standarden inneholder ingen klare retningslinjer for utviklere om hvordan de skal implementere digitale signaturer og kryptering (fra januar 2020). For å oppnå en pålitelig signatur og kryptering av PDF -filer med alle PDF -lesere i fremtiden, er det nødvendig for ISO å videreutvikle standarden. [3]

Redigering av dokumenter

PDF ble designet som et utvekslingsformat for ferdige dokumenter. Det er nå en rekke programmer og utvidelser for Adobe Acrobat som kan brukes til å redigere PDF -filer. Imidlertid kan formatet ikke sammenlignes med filformatene til tekstbehandlingsprogrammer eller grafikkprogrammer, og er bortsett fra notat- og kommentarfunksjonen bare egnet for videre behandling av dokumenter i begrenset omfang. Imidlertid er det mulig, for eksempel innenfor visse grenser, å fjerne skrivefeil . Fordelene med desktop publishing for grafikere og designere er integrering av alle elementene for utskrift.

Avhengig av den enkelte saken kan PDF -dokumenter enten være større eller mindre enn filene i den opprinnelige applikasjonen. Størrelsen på et dokument avhenger av typen data det inneholder, effektiviteten til opprettingsprogrammet og om skrifter er innebygd. Skrifter kan enten være innebygd helt, som en undersett av tegnene som faktisk brukes i dokumentet, eller ikke i det hele tatt. Hvis et dokument skal vises pålitelig, uansett om fontene som brukes er installert på målplattformen, må minst de tegnene som faktisk brukes, være innebygd.

Skriver ut i batchmodus fra kommandolinjen

Utskrift utføres vanligvis i det grafiske brukergrensesnittet til en visning med Fil ▸ Skriv ut .... Acrobat Reader og Foxit Reader har delvis fjernet kommandolinjealternativet / t <fil> <skrivernavn> i de nyere versjonene (september 2015). I Acrobat kan du bare skrive ut på standardskriveren, mens med Foxit kan skriveren velges, men Foxit åpner programvinduet og lukker det ikke etter utskrift (brukeren må lukke det manuelt).

Linux

Om CUPS :

 lpr -P <skrivernavn> "file.pdf"

Windows

Buntutskrift er mulig med Ghostscript . [4] Ghostscript installerer seg selv ved hjelp av et installasjonsprogram under c: \ Program Files \ gs \ gs <Version> \ . Det er kjørbare filer i bin \ underkatalogen. Eksempel med DOS -vinduet i Windows 7:

 C: \ Program Files \ gs \ gs9.16 \ bin> gswin64c.exe \
  -dNOPAGEPROMPT \
  -dNOPROMPT \
  -dNOPAUSE \
  -dBATCH \
  [-dDEVICEWIDTHPOINTS = <Antall amerikanske poeng for papirstørrelsen>] \
  [-dDEVICEHEIGHTPOINTS = <Antall amerikanske poeng for papirstørrelsen>] \
  -sOutputFile = "% skriver% \\ <server> \ <skrivernavn>" \
  -sDEVICE = mswinpr2 \
  <myfile.pdf>

gswin64c.exe er 64-biters versjon uten et eget vindu med interaktiv modus på kommandolinjen.

dNO -alternativene slår av den interaktive modusen. Alternativene -dDEVICE kan brukes hvis skriveren bruker et uvanlig papirformat. -sOutputFile angir navnet på skriveren. -sDEVICE refererer til en intern modul i Ghostscript, der mswinpr2 en standardinnstilling. På slutten forventer kommandolinjen at filen skal skrives ut (kan mislykkes hvis rekkefølgen er annerledes). Under utskriften vises en avbrytingsdialogbok som lukker seg selv (kan -dNoCancel med -dNoCancel ).

Ghostscript for Windows viser også PDF -filen i sitt eget grafiske vindu hvis det ikke er kommandolinjeparametere. Denne skjermen viser piksler og trappeffekter. På den annen side er kvaliteten på de trykte dokumentene betydelig bedre.

Serialisering og komprimering

I løpet av utviklingen ble PDF flere ganger tilpasset spesielle krav til bruk på Internett . Opprinnelig måtte et dokument være helt tilgjengelig for å kunne vises. Det er nå mulig å serialisere PDF -dokumenter slik at deler av dem kan vises mens de lastes. Fra versjon 1.5 av PDF -spesifikasjonen kan flere objekter kombineres i en PDF og deretter komprimeres, noe som fører til betydelig bedre komprimering, spesielt med de mange små objektene som kreves for dokumentstrukturen (bildedata eller den faktiske beskrivelsen av en side har alltid blitt komprimert).

Når du arkiverer utskrevne dokumenter som PDF -filer, foretrekkes en blandet tilnærming for både å bevare originaldokumentet så mye som mulig og for å sikre søkbarhet. Ved smart å kombinere bildekomprimeringsmetodene som støttes av PDF, oppnås en veldig sterk komprimering (vanligvis 1: 200) ved å komprimere bakgrunnen (vanligvis flate strukturer og fargegradienter) og tekst (skarpe kanter, men bare noen få farger) med forskjellige, spesielt egnede metoder og deretter plassert oppå hverandre. Selve teksten blir trukket ut ved hjelp av OCR -prosessen og innebygd usynlig.

Navigasjon på skjermen

I motsetning til tidligere sidebeskrivelsesspråk som PostScript, er "forhåndsvisningen" på skjermen ikke lenger bare et hjelpemiddel for å unngå testutskrifter, men tilbyr praktiske funksjoner som ikke er mulige i utskriften: med kryssreferanser og litteraturreferanser, kan du trenger ikke å bla til målet, men kan hoppe direkte til målsiden ved å klikke på lenken. Navigering i dokumentet er også lettere ved hjelp av sideikoner eller visning av strukturtrær (i henhold til innholdsfortegnelsen). Hvis du klikker på eksterne lenker, vises måldokumentet i nettleseren . Disse funksjonene må imidlertid "bygges inn" av forfatteren (for eksempel med LaTeX og LaTeX -ekspansjonspakken hyperref, [5] se # TeX / DVI ) av forfatterprogramvaren og implementert av seeren .

Standard fonter

14 fonter ( standard 14 fonter ) er tilgjengelige som standard i PDF -lesere og trenger derfor ikke å være innebygd separat i PDF -dokumentet (unntatt PDF / A og PDF / X -dokumenter): [6]

PDF i operativsystemer

Med macOS -operativsystemet fra Apple ble PDF brukt som standardformat for både skjerm og utskrift for første gang. PDF -generasjonen kan utføres fra ethvert program som har en utskriftsdialog. Siden PDF også brukes til å generere utskriftsdata, er det mulig å skrive ut PostScript på ikke-Postscript-skrivere. Nesten alle typer dokumenter som kan skrives ut, kan konverteres til PDF. Denne muligheten eksisterer også under GNU / Linux. B. i utskriftsdialogboksen til skrivebordsmiljøet Gnome tilbys alternativet for generering av PDF -filer naturlig.

Gratis Adobe Reader / Acrobat Reader er tilgjengelig som PDF -visning under Windows , klassisk Mac OS og macOS, GNU / Linux og Unix -operativsystemene Solaris , HP / UX og AIX. Den integrerte Lucide viewer er tilgjengelig under eComStation . Siden Windows 8 har Windows nå også en integrert PDF -visning. [7] Windows 10 var også utstyrt med en PDF -skriver av Microsoft. [Åttende]

For Unix-baserte systemer er det også Xpdf- programmet, som er redusert til de mest grunnleggende funksjonene (visning på skjermen, søk i dokumentet, utskrift), samt noen få andre programmer ( Okular og Evince ) som er tilpasset din skrivebordsmiljø. Disse open source -programmene er også egnet for å omgå de antatte "sikkerhetsfunksjonene" i PDF -dokumenter - det er noen ganger mulig å skrive ut dokumenter selv om forfatteren faktisk ønsket å nekte seeren av dokumentet dette alternativet.

Detaljer om sidegeometrien

De forskjellige boksene i PDF -filen

Informasjon om sidegeometrien i et PDF -dokument er spesielt viktig i trykkeribransjen . De beskriver i hvilket område på en side innholdet ligger som svarer til den trimmede endelige formatet, og hvor en ytterligere behandling program (for eksempel for utskyting , dvs. monterings sider på et trykkark) kan forvente en trim kvote. Moderne DTP -programmer lagrer denne informasjonen i PDF når du eksporterer direkte til PDF. Hvis PDF -filer sendes ut via PostScript, er den tilhørende informasjonen vanligvis ikke inkludert. For PostScript -utdata fra visse programmer kan Adobe Acrobat Distiller hente nettsidearealet fra beskjæringsmerkene, forutsatt at disse også ble skrevet ut.

MediaBox (medieramme)

Den definerer størrelsen på utmatningsmediet til PDF -dokumentet. Dokumentet er ennå ikke trimmet og inneholder vanligvis PostScript -sidestørrelsen som er angitt i PDF -generatoren. MediaBox må alltid være den største av alle bokser, siden den må inneholde alle de andre boksene, og det er den eneste boksen som alltid må inkluderes i en PDF.

CropBox (trimboks)

CropBox (noen ganger referert til som maskerammen) beskriver området på en PDF -side som skal skrives ut på skjermen eller på skriveren. Verdiene til MediaBox er forhåndsinnstilte.

BleedBox (bleed frame)

En utluftingsboks inneholder informasjon om blødningsrammen , som definerer størrelsen på det endelige formatet pluss tiltenkt trim (overfyll). I trykkeribransjen er det vanligvis nødvendig med en blødning på 3 til 5 mm per side. Et applikasjonseksempel er bilder som er i blødningen (dvs. direkte på kanten av siden) eller bilder som faller av og er trimmet i kanten av siden. For en A4 -side som skal leveres til en skriver, resulterer en uttømmingsboks på 3 mm i en bredde på 210 mm + 6 mm og en lengde på 297 mm + 6 mm, dvs. 216 mm × 303 mm. Verdiene til CropBox er forhåndsinnstilte.

TrimBox (trimboks)

TrimBox er det endelige formatet på dokumentet uten trim.

ArtBox (objektramme)

ArtBox (også kalt begrensningsboks ) beskriver sideseksjonen som skal brukes når PDF -siden plasseres i et annet program; kan sammenlignes med størrelsesspesifikasjonen for import av en EPS -fil.

Form prosesser

I tillegg til tekst og grafiske elementer kan PDF -dokumenter inneholde interaktive skjemaelementer for skjemaprosesser. Fullstendige skjemaer kan dermed settes sammen i ett PDF -dokument; Dataene som er registrert i dokumentet kan sendes tilbake til utgiveren av skjemaet på forskjellige måter.

  • Skriv ut og fyll ut: Det håndfylte skjemaet kan sendes på konvensjonelle måter med post eller faks.
  • Fullføring og utskrift: Det elektronisk fullførte dokumentet kan skrives ut og sendes på konvensjonelle måter.
  • Fyll ut og send via en HTTP -tilkobling: Det elektronisk utfylte skjemaet kan sendes elektronisk via nettleseren eller fra Adobe Acrobat.
  • Fyll ut og send det elektronisk utfylte skjemaet via e -post.

Konvertering av andre formater til PDF

XML

PDF -dokumenter kan opprettes fra XML -data i to trinn:

  • Transformasjon ved hjelp av et XSLT- stilark til XSL-FO- format
  • Ein PDF-Prozessor (zum Beispiel Apache FOP , Altsoft Xml2PDF ) erzeugt daraus das fertige PDF-Dokument.

Ein leicht nachzuvollziehendes Beispiel ist die Transformation/Formatierung von invitation.xml [9] in PDF (das Beispiel zeigt auch die Transformation in XHTML und WordML ).

HTML

Aus einer HTML -Datei können PDF-Dokumente mit dem Programm HTMLDOC [10] erzeugt werden. Dieses Programm verfügt sowohl über eine Konsolenschnittstelle als auch über eine grafische Benutzeroberfläche. Damit ist es sowohl auf einem Client zur direkten Bedienung durch den Benutzer als auch zum Servereinsatz, z. B. zur On-the-fly-Generierung von PDF-Dokumenten, geeignet.

Ein Perl -Modul HTML::HTMLDoc erleichtert Perl-Entwicklern die Schnittstelle zur Kommandozeile .

Das Programm wkhtmltopdf [11] ermöglicht die Generierung von mehreren PDF-Dokumenten gleichzeitig, ggf. inklusive Inhaltsverzeichnis. Durch die Verwendung des Webkit-Browser-Pakets [12] werden qualitativ sehr hochwertige Dokumente, z. B. zur Dokumentation kompletter Websites, erzeugt. [13] wkhtmltopdf ist ein Konsolenprogramm und kann ggf. auch über das Perl -Modul WKHTMLTOPDF bedient werden.

Auch PDF.js wandelt PDF-Dateien (temporär) in HTML-Code um, um die Anzeige dieser im Browser zu ermöglichen.

TeX/DVI

  • Aus DVI -Dateien (das Format wurde 1979 entworfen), die von den Satzprogrammen TeX und groff (ua) erzeugt werden, können auf verschiedene Weisen PDF-Dateien erzeugt werden:
    1. Man erzeugt aus der .dvi -Datei mithilfe des Gerätetreibers dvips eine PostScript-Datei ( .ps ) und aus dieser mit dem Adobe Distiller oder dem Ghostscript -Teilprogramm ps2pdf [14] [15] ein .pdf – kurz dvi→ps→pdf .
    2. Eine „partielle Abkürzung“ dieser Methode stellen Programme wie dvipdfm oder dvipdfmx dar, die DVI „direkt“ in PDF umwandeln.
  • pdfTeX und LuaTeX sind Weiterentwicklungen von TeX , die „direkt“, ohne das Zwischenformat DVI, PDF-Dateien erzeugen. Diese Erweiterungen von TeX erlangten zu Beginn des 21. Jahrhunderts Bedeutung.

Vielen TeX-Nutzern genügen die angegebenen Alternativen zur zuerst genannten Methode dvi→ps→pdf . Andere TeX-Nutzer betten jedoch PostScript in einem Maße in den Quellcode ein, dass diese Methoden versagen. Dies trifft vor allem zu, wenn das TeX-Paket PSTricks verwendet wird. Die Zusatzpakete pst-pdf, auto-pst-pdf und pdftricks bieten in diesem Fall Erleichterungen. Insgesamt verbleiben jedoch Fälle, in denen die „traditionelle“ Methode dvi→ps→pdf unersetzbar ist. Eine weitere Alternative bietet aber

  • XeTeX , das nach pdfTeX und etwas früher als LuaTeX erschien. Es erzeugt ein Zwischenformat XDV und daraus (vom Anwender kaum bemerkt) mit dem Treiber xdvipdfmx PDF. [16] Dadurch soll PostScript im Dokumentquellcode vollständig verarbeitet werden. [17] [18] Für die Verwendung von PStricks wird noch ein Paket xetex-pstricks angeboten.

3D-Daten

Beispiel für eine 3D-PDF-Datei

3D-PDF-Dokumente sind PDF-Dokumente, die entweder ein U3D -Flächenmodell oder ein BREP/Flächenmodell PRC [19] enthalten. Sie dienen vorwiegend der Visualisierung von CAD -Daten, kommen aber auch zunehmend in wissenschaftlichen Veröffentlichungen zur Anwendung. [20]

Der kostenlose Adobe Reader kann ab der Version 8.1 beide Formate anzeigen, animieren, schneiden und messen. Mit Acrobat 3D V7 ließen sich 3D-Daten aus 40 CAD-Formaten in 3D-PDF-Dateien konvertieren; jedoch hat 2010 Adobe Entwicklung, Vertrieb und Support der 3D-PDF-Konverter-Technologie an Tech Soft 3D [21] und die PROSTEP AG [22] übergeben. Ab Acrobat X [23] ist die Konvertierung nur noch als kostenpflichtiges 3D-PDF-Converter-Plugin [24] des Unternehmens Tetra 4D verfügbar.

Einige CAD-Programme wie Allplan oder SolidWorks [25] haben einen 3D-PDF-Export; Allplan bietet auch einen 3D-PDF-Import. [26] Auch Werkzeuge wie Deep Exploration von SAP, [27] Pages3D von QuadriSpace [28] und 3DVIA Composer von Dassault Systèmes [29] können 3D-CAD-Modelle als 3D-PDF abspeichern.

Neben den 3D-Daten als Visualisierung können auch andere relevanten Informationen zu einem CAD-Modell in ein PDF eingefügt werden. So können beispielsweise für die Herstellung eines Blechteils [30] die Daten des fertigen Modells als 3D-Visualisierung gezeigt werden.

Videoformate

Kombination von SWF- und 3D-Daten in einer 3D-PDF

Ab Acrobat 9 lassen sich diverse in Shockwave Flash (SWF) konvertierte Videoformate in Adobe PDF einbetten. Dadurch können Videos, Animationen und Anwendungen auf vielen Plattformen genutzt werden. Aufgrund der Adobe-Flash-Unterstützung in Adobe Reader ab Version 9 ist kein zusätzlicher Player für die Wiedergabe erforderlich. Seit dem letzten Patch von Adobe Acrobat und Adobe Reader 9 hat Adobe bei 3D-PDF das Standardverhalten geändert, unter anderem wurde der Flashplayer aus Adobe Acrobat 9 und Adobe Reader 9 entfernt – Flashinhalte greifen auf den Flashplayer im Betriebssystem zu. Adobe Acrobat X und Adobe Reader X sind nicht betroffen, da dort fast keine Angriffe erfolgen. 3D-Daten, SWF-Funktionen und SWF-Videoformate können auch kombiniert werden; so ist es möglich, Teilflächen des Modells mit SWF-Videos und Funktionen zu belegen.

Dateien aus Büroanwendungen

Viele aktuelle Programmpakete wie Apple iWork , Microsoft Office , LibreOffice , OpenOffice.org und Softmaker Office bieten einen PDF-Export an.

Versionen von PDF

Jahr PDF-Version Adobe-Version Charakteristika
1993 1.0/PDF 1 optisch attraktive Textdarstellung, Einbettung von Lesezeichen und dateiinternen Querverweisen, Reader heißt Carousel
1994 1.1 2 externe Querverweise, Einbettung von Multimedia-Dateien in mittlerweile obsoleten Sound- und Video-Formaten, Dokumente können durchsucht werden, 40-Bit-Verschlüsselung
1996 1.2 3 Möglichkeit der Verwendung des CMYK-Farbmodells , direktes Öffnen im Browserfenster durch Implementierung von Browser-Erweiterungen (sog. Plugins), Zugänglichkeits-Plugin für Blinde für den Acrobat Reader 3, interaktive Elemente wie Checkboxen und Radiobuttons sind möglich
1999 1.3 4 Unterstützung asiatischer Schriften, verbessertes Accessibility Plugin für den Acrobat Reader, weiterhin 40-Bit-Verschlüsselung, digitale Signaturen, JavaScript -Elemente möglich
2001 1.4 5 Wegfall des Zugänglichkeits-Plugin, dafür Unterstützung von MSAA (Microsoft Active Accessibility) durch den Acrobat Reader, RC4 -Verschlüsselung mit 40–128 Bit, Beschreibung des logischen Dokumentaufbaus mit Tags
2003 1.5 6 Einbettung von Bildern im Format JPEG 2000 , Filmen im Format MPEG und Audiodateien im Format MP3 möglich, Public Key-Verschlüsselung PKCS#7 ; Leseprogramm heißt ab jetzt Adobe Reader, keine Unterstützung mehr für DOS-basierte Windows-Versionen ( Windows 9x )
2004 1.6 7 Unterstützung für das Universal-3D -Dateiformat, Einbettung von OpenType -Fonts, Unterstützung für XFA-2.2-Rich-Text-Elemente und -Attribute, AES -Verschlüsselung, PKCS#7-Verschlüsselung mit SHA256 , DSA bis zu 4096 Bit, unzugängliche PDF-Dokumente können mit Tags versehen werden, bessere Unterstützung für mehrspaltige Dokumente, Formularfelder können mit Hilfe der Sprachausgabefunktionen vorgelesen werden, PDF-Creator mit Ausgabehilfeassistent: unterstützt beim Optimieren für Screenreader und Bildschirmvergrößerungsprogramme
2006 1.7 8 weitere Verbesserung der 3D-Darstellungsoptionen, stärkere Verschlüsselungsalgorithmen (PKCS#7 mit SHA384, SHA512 und RIPEMD-160 , 256-Bit AES)
2008 1.7 9 weitere Verbesserung
2010 1.7 X weitere Verbesserung
2012 1.7 XI weitere Verbesserung
2017 2.0 DC Unterstützung für das PRC -Dateiformat, 3D-Messwerkzeuge, verbesserte Sicherheitsfunktionen [31]

Normen und Standards

In verschiedenen Gremien der ISO werden seit dem Jahr 1997 Normen auf der Grundlage von PDF erarbeitet und verabschiedet. Dabei werden, basierend auf bestimmten PDF-Versionen, Mindestanforderungen sowie Einschränkungen definiert. Adobe Systems hat in diesem Zusammenhang den betreffenden Gremien der ISO das Recht übertragen, die jeweils nötigen Spezifikationen zeitlich unbegrenzt zum Herunterladen bereitzustellen.

Diese Normen entsprechen in grober Näherung als Basis den unterschiedlichen Versionen von PDF:

ISO Jahr Typ Version Bezeichnung / Bemerkung
15930 2001 PDF/X 1.3 Format für die Übermittlung von Druckvorlagen
15930-1 2001 PDF/X-1a 1.3 siehe PDF/X
15930-5 2003 PDF/X-2 1.4 siehe PDF/X
15930-4 2003 PDF/X-1a 1.4 siehe PDF/X
15930-3 2002 PDF/X-3 1.3 siehe PDF/X
15930-6 2003 PDF/X-3 1.4 siehe PDF/X
15930-7 2008 PDF/X-4 1.6 siehe PDF/X
15930-8 2008 PDF/X-5 1.6 siehe PDF/X
19005-1 2005 PDF/A-1 1.4 Format für die elektronische Archivierung
19005-1 2007 PDF/A-1 1.4 Korrektur PDF/A-1
19005-2 2011 PDF/A-2 1.7 siehe PDF/A-1
19005-3 2012 PDF/A-3 1.7 siehe PDF/A-1
24517 2008 PDF/E 1.6 Format für technische Dokumente aus den Bereichen Ingenieurwesen, Architektur und Geo-Informationssysteme (PDF Engineering)
2008 PDF/H Format für Dokumente im Gesundheitswesen (PDF Healthcare)
14289 2008 PDF/UA 1.7 Richtlinien zum Aufbau eines barrierefreien Dokuments im Format PDF (Universal Accessability)
16612-2 2010 PDF/VT 1.6 Format für den Einsatz im hochvolumigen und Transaktionsdruck (PDF Variable and Transactional Printing)
32000-1 2008 PDF 1.7 1.7
32000-2 2017 PDF 2.0 2.0[32]

Literatur

Weblinks

Commons : Portable Document Format – Sammlung von Bildern, Videos und Audiodateien
Wiktionary: PDF – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

  1. Jim Meehan, Ed Taft, Stephen Chernicoff, Caroline Rose, Ron Karr: PDF Reference, fifth Edition, Section 1.5 Intellectual Property. (PDF; 8,1 MB) (Nicht mehr online verfügbar.) Adobe Systems, November 2004, S. 7 , archiviert vom Original am 16. Juni 2015 ; abgerufen am 3. November 2010 (englisch).
  2. PDF . Wiki von Ubuntuusers.de
  3. a b Chaos Communication Congress: Glauben Sie nicht alles, was in einem PDF-Dokument steht . Zeit Online , Dezember 2019; abgerufen am 4. Januar 2020.
  4. ghostscript.com ( Memento vom 13. September 2015 im Internet Archive )
  5. Paket hyperref. Comprehensive TeX Archive Network ; abgerufen am 2. Januar 2018.
  6. PDF Reference (Sixth Edition, version 1.7) – 5.5.1 Standard Type 1 Fonts ( Memento vom 6. Juli 2015 im Internet Archive ) (PDF, 31 MB, 1.310 S.)
  7. netzwelt.de
  8. giga.de
  9. Stefan Mintert: invitation.xml – Transform a single source XML file to several output formats. In: Website der Linkwerk GmbH. Abgerufen am 3. November 2010 (englisch).
  10. HTMLDOC Open Source Home Page. (Nicht mehr online verfügbar.) Michael R Sweet, 16. Januar 2017, archiviert vom Original am 21. Februar 2016 ; abgerufen am 16. Januar 2017 (englisch).
  11. wkhtmltopdf. Open Source Project, abgerufen am 30. Dezember 2011 (englisch).
  12. Webkit Open Source Projekt. Open Source Project, abgerufen am 30. Dezember 2011 (englisch).
  13. Website als PDF mit Inhaltsverzeichnis. Innovate Webdoc Services, abgerufen am 30. Dezember 2011 .
  14. ps2pdf: PostScript-to-PDF converter auf ghostscript .com
  15. PStricks-Seite über PDF-Export. tug.org.
  16. xetex auf CTAN.
  17. Am höchsten bewertete Antwort von Herbert Voß zu Frage 8413 auf tex.stackexchange.com.
  18. Antwort von „egreg“ (Enrico Gregorio) zu Frage 19966 auf tex.stackexchange.com.
  19. PRC Format Specification ( Memento vom 2. Dezember 2008 im Internet Archive ) bei Adobe
  20. Axel Newe: Enriching scientific publications with interactive 3D PDF: an integrated toolbox for creating ready-to-publish figures . In: PeerJ Computer Science . Band   2 , 20. Juni 2016, ISSN 2376-5992 , doi : 10.7717/peerj-cs.64 ( peerj.com [abgerufen am 28. Juni 2016]).
  21. Acrobat Pro Bundle ( Memento vom 11. Mai 2012 im Internet Archive ) bei Tech Soft 3D
  22. PDF Generator 3D der PROSTEP AG
  23. Acrobat X Pro bei Adobe
  24. 3D PDF Converter-Plug-in bei Tetra 4D
  25. official help-documentation. DassaultSystemes Solidworks, abgerufen am 27. Juni 2019 (englisch).
  26. Datenaustauschformate . allplan.com
  27. Deep Exploration ( Memento vom 7. September 2012 im Webarchiv archive.today ) von Right Hemisphere, seit 2012 SAP
  28. Pages3D, QuadriSpace
  29. 3DVIA Composer ( Memento vom 25. Mai 2013 im Webarchiv archive.today ) bei Dassault Systèmes
  30. 3D-PDF Beispiel bei UNITEC Informationssysteme
  31. Taking Documents to the Next Level with PDF 2.0. (PDF) Adobe, abgerufen am 11. September 2017 (englisch).
  32. ISO 32000-2:2017. ISO Org, abgerufen am 11. September 2017 (englisch).