Bærbart dokumentformat
Bærbart dokumentformat (PDF) | |
---|---|
![]() | |
![]() | |
Filudvidelse : | .pdf |
MIME -type : | ansøgning / pdf |
Magisk nummer : | |
Udviklet af: | PDF Association |
Første udgivelse: | 1993 af Adobe Inc. |
Nuværende version: | 2.0 (fra juli 2017) |
Standard (er) : | ISO 32000 , Adobe: PDF Reference (for 1.7 og ældre) |
Hjemmeside : | https://www.pdfa.org/ |
Det bærbare dokumentformat (engelsk; kort for PDF ; tysk: (transport) bærbart dokumentformat ) er et platformuafhængigt filformat, der blev udviklet og udgivet i 1993 af Adobe Inc. og i øjeblikket videreudvikles af PDF Association .
Målet var at oprette et filformat til elektroniske dokumenter, så de kan gengives tro mod originalen uanset det originale applikationsprogram, operativsystem eller hardware platform. Målet blev nået og afspejles i ISO 32000 -serien af standarder (ISO 15930 til PDF / X ). Til dette formål blev PostScript -formatets funktionalitet hovedsageligt brugt. En læser af en PDF -fil skal altid kunne se og udskrive dokumentet i den form, som forfatteren har angivet. De typiske konverteringsproblemer (f.eks. Ændrede sideskift eller forkerte skrifttyper) ved udveksling af et dokument mellem forskellige programmer elimineres således.
Ud over tekst, billeder og grafik kan en PDF -fil også indeholde hjælpemidler, der letter navigation i dokumentet. Dette omfatter f.eks. Indholdsfortegnelser, der kan klikkes på, og forhåndsvisninger med miniaturer.
Oversigt
Grundlæggende og software
PDF -dokumenter og filer kan oprettes fra tekster , billeder og grafik - blandet eller individuelt - med de relevante programmer (f.eks. Med gratis programmer som PDFCreator og kontorpakker LibreOffice / OpenOffice.org , gebyrbaserede programmer som Adobe Acrobat eller simpelthen via dialogboksen Udskriv), og vis den med passende læseprogrammer (f.eks. Evince , Ghostscript , Okular , Adobe Reader , Foxit , Preview ). Oprettelsen af en PDF -fil kan beskytte den mod uønsket brug på mange forskellige måder ved at aktivere PDF -sikkerhedsmekanismerne. Kryptering bruges til at forhindre uautoriseret adgang. Afhængigt af dine behov kræver åbning af filen muligvis allerede en adgangskode, eller kopiering af indhold fra filen eller udskrivning er muligvis ikke tilladt. De beskyttelsesmekanismer, der er implementeret i PDF til dette, er imidlertid ikke pålidelige; især enklere former for kryptering er lette at overvinde.
I opstartsfasen kunne Adobe Reader betales. Kun den gratis distribution af softwaren gjorde det muligt at distribuere formatet i det omfang, det er i dag. PDF har længe været et kommercielt ( proprietært ), men åbent filformat dokumenteret i Adobes PDF Reference Manual. Adobe introducerede det til ISO-standardiseringsprocessen i begyndelsen af 2007, og med offentliggørelsen den 1. juli 2008 er PDF-version 1.7 som ISO 32000-1: 2008 en åben standard .
Visse metoder til håndtering af PDF er på forhånd standardiseret af ISO for at lette dataudveksling i prepress (som PDF / X ) og til langsigtet arkivering af PDF-filer (som PDF / A -1 i ISO 19005-1: 2005).
Generering og transformation
PDF er et vektorbaseret sidebeskrivelsessprog, der tillader visningen at være frit skalerbar. PDF -filer beskriver det layout, der er oprettet med oprettelsesprogrammet , i en form, der er uafhængig af printeren og standardindstillingerne, proportionelt og derfor så tro mod originalen, som det er muligt i princippet. Det er her, PDF'en adskiller sig markant fra avancerede beskrivelses- og markupsprog som SGML eller HTML, når det kommer til kravet om optimal layoutfidelity. For at optimere en visning på outputenheder med et lille displayområde - f.eks. PDA'er eller mobiltelefoner - kan markeringer (ligner HTML -tags) gemmes i en PDF -fil, som gør det muligt at bryde sideindholdet - derefter uundgåeligt med begrænsede layout troskab. Sådanne markeringer gør det også muligt for et læserprogram at læse dokumentet for synshandicappede brugere og gøre det lettere at konvertere indholdet til andre formater.
En populær applikation til oprettelse af PDF -filer er Adobe Acrobat Distiller , som opretter PDF -filer fra PostScript -filer. Acrobat Distiller fås som desktop -produkt til Windows og macOS . Serverversioner og den gratis Adobe Reader findes også til andre platforme. Ved hjælp af den gratis software Wine kører Acrobat Distiller også under Linux. Forskellige kontor- og DTP -programmer fra andre producenter tilbyder direkte PDF -eksport og er tilgængelige på en række platforme . Nu med mange værktøjer og programmeringsbiblioteker kan PDF -filer oprettes på forskellige måder med forskellige specialiseringer. PDF -filer kan oprettes på næsten enhver platform.
Adobe giver delvist udviklere ret til at udvikle deres egne applikationer til generering og redigering af PDF -dokumenter, men forbeholder sig ophavsretten til specifikationerne. [1] PDF som et sidebeskrivelsessprog kan ses som en videreudvikling af PostScript -grafikmodellen, som også afsløres. I slutningen af februar 2007 annoncerede Adobe, at det ville indarbejde version 1.7 af PDF -specifikationen i ISO -standardiseringen og arbejder sammen med den amerikanske brancheforening AIIM , der har sekretariatet for ISO -udvalget TC 171. Adobe truede Microsoft med kartelsager, hvis den åbne PDF -standard blev integreret.
Yderligere generationsmetoder behandles under Konvertering af andre formater til PDF .
Anvendelse og egenskaber
Generelle egenskaber
En PDF -fil kan gengive dokumenter nøjagtigt, herunder alle farver, raster- og vektorgrafik og skrifttyper . En af styrkerne ved PDF er, at der findes displayprogrammer til alle almindelige platforme , så indholdet kan vises uanset platformen.
Efterfølgende redigering af PDF -filer er vanskelig. Der er dog forskellige programmer, som du kan skære enkelte sider ud med og ændre bestemt indhold. Fra Microsoft Word version 2013 kan PDF -filer konverteres til Word -filer direkte i programmet. [2]
Omfang af dokumenter
PDF -dokumenter kan indeholde flere hundrede tusinde sider. Sidestørrelsen er ikke begrænset af selve formatet. I Adobe Acrobat er der imidlertid implementeringsbegrænsninger:
- op til version 3 til 45 tommer × 45 tommer (1.143 m × 1.143 m)
- op til version 6 til 200 tommer × 200 tommer (5,08 m × 5,08 m)
- fra version 7 til 15.000.000 tommer × 15.000.000 tommer (381 km × 381 km)
Opbevaring af oplysninger i dokumentet
Alle oplysninger gemmes som nummererede objekter i PDF -filer. Objekter er f.eks. Skrifttypeoplysninger, tegnbredder, anvendte tegnkodninger (Mac / PC ...), sidebeskrivelser, parametre til dekodere, beskæringsbokse, individuelle bogmærker, farvedefinitioner, sideordrer, bitmaps, formularer, springmærker og alt andet, der er gemt i PDF -filer, kan være. En hundrede sider PDF-fil kan let indeholde 10.000 objekter.
PDF er baseret på den samme grafiske model som PostScript -sidebeskrivelsessproget, men tillader nogle ekstra funktioner i forhold til dette - især interaktive elementer såsom bogmærker, kommentarer, formularfelter og deres programmering med JavaScript er mulige. Sammenlignet med PostScript er den grafiske model for sideindholdet også blevet udvidet til at omfatte funktioner såsom gennemsigtighed eller valgfrit eller skifteligt indhold (kaldet lag i Acrobat -brugergrænsefladen) eller understøttelse af ICC -profiler og OpenType -skrifttyper.
Skrifttyper (med undtagelse af pixel skrifttyper) og vektorgrafik kan forstørres efter ønske uden tab af kvalitet. Under disse forhold kan store netværksplaner og datamodeller gemmes på en PDF -side uden tab.
Tekstpassager, tabeller og grafik (inklusive uddrag heraf) fra PDF -dokumenter kan let behandles yderligere i andre applikationsprogrammer ved at kopiere og indsætte de respektive elementer, hvis dokumentets skaber har givet tilladelse. Tekst kan udtrækkes ikke kun til videre behandling i andre applikationer, men også til browsing eller til brug med andre outputmedier, f.eks. Skærmlæsere . Detaljeret indhold kan meget let findes ved hjælp af tekstsøgning i individuelle dokumenter eller fuldtekstforskning i en PDF-dokumentsamling. Dette virker endda, hvis teksten er grafisk forvrænget, for eksempel i form af en cirkel eller kurve.
Dokumentsikkerhed
Kryptering af PDF -dokumenter
En særlig egenskab ved PDF er den valgfri dokumentbeskyttelse med 40 eller 128 bit kryptering . Ved at tildele en brugeradgangskode er det muligt at gøre dokumentet kun tilgængeligt for en begrænset gruppe mennesker. Forfatteren kan også bruge en separat ejeradgangskode til specifikt at tildele rettigheder til det relevante dokument. Dette forhindrer brugere i at ændre, udskrive eller kopiere dele af dokumentet. Selv uden at kende ejeradgangskoden kan disse rettighedsbegrænsninger dog let fjernes ved hjælp af forskellige værktøjer, især hvis der bruges en ejeradgangskode, men åbning af dokumentet kræver ikke en adgangskode (det betyder, at der ikke er angivet en brugeradgangskode) . Brugerestriktionerne forbundet med kryptering kan let omgås ved at gemme skærmbilleder som bitmaps og derefter bruge optisk tekstgenkendelse .
Egnede værktøjer kan også bruges til at tildele rettigheder, der gør det muligt at tilføje noter, kommentarer og vedhæftede filer til PDF -dokumenter eller til at gemme formularposter. Oprindeligt kunne disse funktioner kun bruges med Adobe Acrobat, men fra version 7 er det også muligt med gratis Adobe Reader at tilføje noter og kommentarer og udfylde interaktive formularfelter, forudsat at det relevante dokument har fået de nødvendige autorisationer af forfatter.
DRM -beskyttede PDF -filer findes nu også. Disse kan blandt andet læses med Adobe Digital Editions .
Sårbarheder forårsaget af menneskelige fejl
PDF -filer kan uforvarende indeholde fortrolige oplysninger, som, selvom de ikke umiddelbart er synlige, kan findes ved hjælp af tekstsøgninger. På den ene side kan oplysninger sløres af objekter eller placeres uden for sidevisningsområdet, på den anden side kan en PDF -fil indeholde metadata, der kun vises, når de tilsvarende dialoger åbnes, og nogle gange går ubemærket hen. Især når "mørklægning" af tekstpassager er det ikke tilstrækkeligt at dække den relevante tekstpassage, skal den fjernes helt fra PDF -filen. Det er ikke altid let at undgå uønskede oplysninger i en PDF, især ikke hvis du ikke kun selv har oprettet og redigeret PDF'en (og det dokument, som den blev genereret fra). Det er vigtigt, at når der redigeres tekststykker, bruges et værktøj, der helt fjerner det relevante indhold. Det er lige så vigtigt at kontrollere metadataene (findes i Acrobat via File / Properties). Acrobat Professional 8 tilbyder omfattende support her, især gennem en særlig funktion til fjernelse af skjult information.
Casestudier:
- En sag om død af den italienske agent Nicola Calipari , som befriede journalisten Giuliana Sgrena fra irakisk gidsel i marts 2005. Amerikanske soldater skød ham kort efter denne aktion. Den offentliggjorte rapport blev censureret. De redaktionelle revisioner blev imidlertid fundet i den publicerede fil ved at kopiere teksten og gemme den i en ny fil.
- Washington White House offentliggjorde George W. Bushs tale om "Plan for sejr i Irak". Filoplysningerne afslørede ghostwriteren , nemlig Peter Feaver , professor i statskundskab ved Duke University i North Carolina , der har rådgivet National Security Council siden juni 2005.
- Efter angrebet på køretøjskonvoien til den libanesiske politiker Rafiq Hariri blev de tidligere slettede henvisninger til navnene på syriske embedsmænd, der mistænkes for at være ansvarlige for angrebet, fundet i en offentligt offentliggjort PDF af FN (se Mehlis -rapport ).
- I 2007, som en del af formel 1 -spionsagen , kom fortrolige data om Scuderia Ferrari -bilen til offentligheden, efter at dens centrale tekniske værdier blot var markeret med en sort bjælke i et PDF -dokument, der tjente som bevis, men teksten var var stadig til stede og udtrækkelig.
Hack let krypterede eller signerede PDF -dokumenter
I december 2019 offentliggjorde forskere fra Ruhr University Bochum og it -sikkerhedsvirksomheden Hackmanit, at det let var muligt at foretage ændringer i signerede PDF -dokumenter, uden at 21 ud af 22 PDF -læsere lagde mærke til det. Selv Adobe Acrobat Reader markerede ikke efterfølgende ændringer. Beviserne blev fremlagt på Chaos Communication Congress i Leipzig fra den 27. til den 30. december 2019. Forskerne viste, at det var muligt (a) at tilføje sider og noter til underskrevne dokumenter uden at gøre signaturen ugyldig, (b) at flytte oprindeligt underskrevet indhold til en anden position i dokumentet og skrive noget andet på det originale sted, og ( c) at ændre ("manipulere") metadataene til signaturen. De berørte PDF -læsere genkendte ikke ændringen og angav stadig, at signaturen var gyldig. Forskerne var i stand til at foretage ændringerne ved hjælp af en simpel tekstredigerer. [3]
Forskerne var også i stand til let at foretage ændringer i krypterede PDF -dokumenter. Selv uden at kende adgangskoden kunne de inkorporere skjulte kommandoer i rollen som en angriber. Hvis angriberen videresender den til den faktiske modtager, og han indtaster adgangskoden, har angriberen automatiseret adgang til det komplette dekrypterede PDF -indhold. Dette var muligt ved hjælp af to metoder. Den første metode drager fordel af den funktion, der delvist kan kryptere PDF -filer. Blandt andet kan PDF-strukturen ændres og ikke-krypteret indhold kan tilføjes. Så snart dokumentet åbnes af en autoriseret person, kan angriberen udtrække almindelig tekst og dermed få adgang til indholdet. Den anden metode er baseret på en sårbarhed i PDF -krypteringens specifikationer. Dette gør det muligt at ændre krypteret indhold. 27 PDF -læsere blev undersøgt for kryptering. Alle testede PDF -læsere var modtagelige for en af disse manipulationer. ISO -standarden indeholder ingen klare retningslinjer for udviklere om, hvordan de skal implementere digitale signaturer og kryptering (fra januar 2020). For at opnå en pålidelig signatur og kryptering af PDF -filer med alle PDF -læsere i fremtiden er det nødvendigt for ISO at videreudvikle standarden. [3]
Redigering af dokumenter
PDF blev designet som et udvekslingsformat for færdige dokumenter. Der er nu en række programmer og udvidelser til Adobe Acrobat, der kan bruges til at redigere PDF -filer. Formatet kan dog ikke sammenlignes med filformaterne i tekstbehandlingsprogrammer eller grafikprogrammer og er bortset fra note- og kommentarfunktionen kun i begrænset omfang egnet til videre behandling af dokumenter. Det er dog muligt inden for visse grænser at fjerne tastefejl f.eks. Fordelene ved desktop publishing for grafikere og designere er integrationen af alle elementer til udskrivning.
Afhængigt af den enkelte sag kan PDF -dokumenter enten være større eller mindre end filerne i den originale applikation. Størrelsen af et dokument afhænger af typen af data, det indeholder, effektiviteten af oprettelsesprogrammet og om skrifttyper er blevet integreret. Skrifttyper kan enten integreres fuldstændigt som en delmængde af de tegn, der faktisk bruges i dokumentet, eller slet ikke. Hvis et dokument skal vises pålideligt, uanset om de anvendte skrifttyper er installeret på målplatformen, skal mindst de tegn, der faktisk bruges, være integreret.
Udskrivning i batch -tilstand fra kommandolinjen
Udskrivning udføres normalt inden for den grafiske brugergrænseflade for en fremviser med Fil ▸ Udskriv… . Acrobat Reader og Foxit Reader har delvist fjernet kommandolinjemuligheden / t <fil> <printernavn> i de nyere versioner (september 2015). I Acrobat kan du kun udskrive på standardprinteren, mens printeren med Foxit kan vælges, men Foxit åbner programvinduet og lukker det ikke efter udskrivning (brugeren skal lukke det manuelt).
Linux
Om CUPS :
lpr -P <printernavn> "file.pdf"
Windows
Batchudskrivning er mulig med Ghostscript . [4] Ghostscript installerer sig selv ved hjælp af et installationsprogram under c: \ Program Files \ gs \ gs <Version> \ . Der er eksekverbare filer i bin \ undermappen. Eksempel med DOS -vinduet i Windows 7:
C: \ Program Files \ gs \ gs9.16 \ bin> gswin64c.exe \ -dNOPAGEPROMPT \ -dNOPROMPT \ -dNOPAUSE \ -dBATCH \ [-dDEVICEWIDTHPOINTS = <Antal amerikanske punkter for papirstørrelsen>] \ [-dDEVICEHEIGHTPOINTS = <Antal amerikanske punkter for papirstørrelsen>] \ -sOutputFile = "% printer% \\ <server> \ <printernavn>" \ -sDEVICE = mswinpr2 \ <myfile.pdf>
gswin64c.exe
er 64-bit versionen uden et separat vindue med interaktiv tilstand på kommandolinjen.
dNO
deaktiverer den interaktive tilstand. Indstillingerne -dDEVICE
kan bruges, hvis printeren bruger et usædvanligt papirformat. -sOutputFile
angiver printerens navn. -sDEVICE
refererer til et internt modul i Ghostscript, hvor mswinpr2
en standardindstilling. I slutningen forventer kommandolinjen, at filen udskrives (mislykkes muligvis, hvis rækkefølgen er en anden). Under udskrivning vises en annulleringsdialog, der lukker sig selv (kan -dNoCancel
med -dNoCancel
).
Ghostscript til Windows viser også PDF -filen i sit eget grafiske vindue, hvis der ikke er kommandolinjeparametre. Dette display viser pixels og trappeeffekter. På den anden side er kvaliteten af de udskrevne dokumenter væsentligt bedre.
Serialisering og komprimering
I løbet af udviklingen blev PDF flere gange tilpasset særlige krav til brug på Internettet . Oprindeligt skulle et dokument være helt tilgængeligt for at blive vist. Det er nu muligt at serialisere PDF -dokumenter, så dele af dem kan vises, mens de indlæses. Fra version 1.5 af PDF -specifikationen kan flere objekter kombineres i en PDF og derefter komprimeres, hvilket fører til betydeligt bedre komprimering, især med de mange små objekter, der kræves til dokumentstrukturen (billeddata eller den faktiske beskrivelse af en side har altid blevet komprimeret).
Ved arkivering af udskrevne dokumenter som PDF -filer foretrækkes en blandet tilgang for både at bevare det originale dokument så meget som muligt og for at sikre søgbarhed. Ved smart at kombinere de billedkomprimeringsmetoder, der understøttes af PDF, opnås en meget stærk komprimering (typisk 1: 200) ved at komprimere baggrunden (typisk flade strukturer og farveforløb) og tekst (skarpe kanter, men kun få farver) med forskellige, specielt egnede metoder og derefter placeret oven på hinanden. Den egentlige tekst udtrækkes ved hjælp af OCR -processen og indlejres usynligt.
I modsætning til tidligere sidebeskrivelsessprog som PostScript er "forhåndsvisningen" på skærmen ikke længere kun et hjælpemiddel til at undgå testudskrifter, men tilbyder praktiske funktioner, der ikke er mulige i udskriften: med krydsreferencer og litteraturreferencer, du behøver ikke at rulle til målet, men kan hoppe direkte til målsiden ved at klikke på linket. Navigering i dokumentet letter også ved hjælp af sideikoner eller visning af strukturtræer (i henhold til indholdsfortegnelsen). Hvis du klikker på eksterne links, vises måldokumentet i webbrowseren . Disse funktioner skal imidlertid "indbygges" af forfatteren (f.eks. Med LaTeX og LaTeX -udvidelsespakken hyperref, [5] se # TeX / DVI ) af redigeringssoftwaren og implementeres af seeren .
Standard skrifttyper
14 skrifttyper ( standard 14 skrifttyper ) er tilgængelige som standard i PDF -læsere og behøver derfor ikke at være integreret separat i PDF -dokumentet (undtagen PDF / A- og PDF / X -dokumenter): [6]
- Courier (i varianterne standard, fed, kursiv, fed-kursiv)
- Helvetica (i varianterne standard, fed, kursiv, fed-kursiv)
- symbol
- Times New Roman (i varianterne standard, fed, kursiv, fed-kursiv)
- Zapf dingbats
PDF i operativsystemer
Med macOS -operativsystemet fra Apple blev PDF brugt som standardformat for både skærm og udskrift for første gang. PDF -genereringen kan udføres fra ethvert program, der har en udskrivningsdialog. Da PDF også bruges til at generere udskriftsdata, er det muligt at sende PostScript på ikke-Postscript-printere. Næsten enhver form for dokument, der kan udskrives, kan konverteres til PDF. Denne mulighed findes også under GNU / Linux. B. i udskrivningsdialogen i skrivebordsmiljøet Gnome tilbydes muligheden for PDF -generering indbygget.
Den gratis Adobe Reader / Acrobat Reader er tilgængelig som PDF -fremviser under Windows , klassisk Mac OS og macOS, GNU / Linux og Unix -operativsystemerne Solaris , HP / UX og AIX. Den integrerede Lucide viewer er tilgængelig under eComStation . Siden Windows 8 har Windows nu også en integreret PDF -fremviser. [7] Windows 10 var også udstyret med en PDF -printer af Microsoft. [8.]
For Unix-baserede systemer er der også Xpdf- programmet, som reduceres til de mest grundlæggende funktioner (visning på skærmen, søgning i dokumentet, udskrivning), samt et par andre programmer ( Okular og Evince ), der er tilpasset din skrivebordsmiljø. Disse open source -programmer er også velegnede til at omgå de formodede "sikkerhedsfunktioner" i PDF -dokumenter - det er undertiden muligt at udskrive dokumenter, selvom forfatteren faktisk ønskede at nægte seeren af dokumentet denne mulighed.
Detaljer om sidegeometrien
Information om sidegeometrien i et PDF -dokument er særlig vigtig i trykindustrien . De beskriver i hvilket område af en side indholdet er placeret, der svarer til det trimmede endelige format, og hvor et yderligere behandlingsprogram (f.eks. Til pålæggelse , dvs. montering af sider på et udskriftsark) kan forvente en trimningsgodtgørelse . Moderne DTP -programmer gemmer disse oplysninger i PDF, når de eksporteres direkte til PDF. Hvis PDF -filer udsendes via PostScript, er de tilsvarende oplysninger normalt ikke inkluderet. For PostScript -output fra visse programmer er Adobe Acrobat Distiller i stand til at udlede netto -sideområdet fra beskæringsmærkerne, forudsat at disse også blev output.
MediaBox (medieramme)
Det definerer størrelsen på outputmediet i PDF -dokumentet. Dokumentet er endnu ikke blevet beskåret og indeholder normalt PostScript -sidestørrelsen, der er angivet i PDF -generatoren. MediaBox skal altid være den største af alle bokse, da den skal indeholde alle de andre bokse, og det er den eneste boks, der altid skal inkluderes i en PDF.
CropBox (trimboks)
CropBox (undertiden benævnt maskerammen) beskriver området på en PDF -side, der skal udskrives på skærmen eller på printeren. Værdierne i MediaBox er forudindstillede.
BleedBox (udluftningsramme)
En udluftningsboks indeholder oplysninger om udluftningsrammen , som definerer størrelsen på det endelige format plus den påtænkte trim (overfyldning). I trykkeribranchen er det generelt nødvendigt med en blødning på 3 til 5 mm pr. Side. Et applikationseksempel er billeder, der er i blødningen (dvs. direkte på kanten af siden) eller billeder, der falder af og er beskåret ved kanten af siden. For en A4 -side, der skal leveres til en printer, resulterer en udluftningsboks på 3 mm i en bredde på 210 mm + 6 mm og en længde på 297 mm + 6 mm, dvs. 216 mm × 303 mm. CropBox -værdierne er forudindstillede.
TrimBox (trimbox)
TrimBox er dokumentets endelige format uden trim.
ArtBox (objektramme)
ArtBox (også kaldet afgrænsningsboks ) beskriver den sidesektion, der skal bruges, når PDF -siden placeres i et andet program; kan sammenlignes med størrelsesspecifikationen for import af en EPS -fil.
Form processer
Ud over tekst og grafiske elementer kan PDF -dokumenter indeholde interaktive formelementer til formprocesser. Fuldstændige formularer kan således bundtes i ét PDF -dokument; De data, der er registreret i dokumentet, kan sendes tilbage til udgiveren af formularen på forskellige måder.
- Udskriv og udfyld: Den håndfyldte formular kan sendes på konventionelle måder med post eller fax.
- Afslutning og udskrivning: Det elektronisk udfyldte dokument kan udskrives og sendes på konventionelle måder.
- Udfyld og send via en HTTP -forbindelse: Den elektronisk udfyldte formular kan sendes elektronisk via webbrowseren eller fra Adobe Acrobat.
- Udfyld og send den elektronisk udfyldte formular via e -mail.
Konvertering af andre formater til PDF
XML
PDF -dokumenter kan oprettes ud fra XML -data i to trin:
- Transformation ved hjælp af et XSLT- stilark til XSL-FO- format
- Ein PDF-Prozessor (zum Beispiel Apache FOP , Altsoft Xml2PDF ) erzeugt daraus das fertige PDF-Dokument.
Ein leicht nachzuvollziehendes Beispiel ist die Transformation/Formatierung von invitation.xml [9] in PDF (das Beispiel zeigt auch die Transformation in XHTML und WordML ).
HTML
Aus einer HTML -Datei können PDF-Dokumente mit dem Programm HTMLDOC [10] erzeugt werden. Dieses Programm verfügt sowohl über eine Konsolenschnittstelle als auch über eine grafische Benutzeroberfläche. Damit ist es sowohl auf einem Client zur direkten Bedienung durch den Benutzer als auch zum Servereinsatz, z. B. zur On-the-fly-Generierung von PDF-Dokumenten, geeignet.
Ein Perl -Modul HTML::HTMLDoc erleichtert Perl-Entwicklern die Schnittstelle zur Kommandozeile .
Das Programm wkhtmltopdf [11] ermöglicht die Generierung von mehreren PDF-Dokumenten gleichzeitig, ggf. inklusive Inhaltsverzeichnis. Durch die Verwendung des Webkit-Browser-Pakets [12] werden qualitativ sehr hochwertige Dokumente, z. B. zur Dokumentation kompletter Websites, erzeugt. [13] wkhtmltopdf ist ein Konsolenprogramm und kann ggf. auch über das Perl -Modul WKHTMLTOPDF bedient werden.
Auch PDF.js wandelt PDF-Dateien (temporär) in HTML-Code um, um die Anzeige dieser im Browser zu ermöglichen.
TeX/DVI
- Aus DVI -Dateien (das Format wurde 1979 entworfen), die von den Satzprogrammen TeX und groff (ua) erzeugt werden, können auf verschiedene Weisen PDF-Dateien erzeugt werden:
- Man erzeugt aus der
.dvi
-Datei mithilfe des Gerätetreibers dvips eine PostScript-Datei (.ps
) und aus dieser mit dem Adobe Distiller oder dem Ghostscript -Teilprogramm ps2pdf [14] [15] ein.pdf
– kurzdvi→ps→pdf
. - Eine „partielle Abkürzung“ dieser Methode stellen Programme wie dvipdfm oder dvipdfmx dar, die DVI „direkt“ in PDF umwandeln.
- Man erzeugt aus der
- pdfTeX und LuaTeX sind Weiterentwicklungen von TeX , die „direkt“, ohne das Zwischenformat DVI, PDF-Dateien erzeugen. Diese Erweiterungen von TeX erlangten zu Beginn des 21. Jahrhunderts Bedeutung.
Vielen TeX-Nutzern genügen die angegebenen Alternativen zur zuerst genannten Methode dvi→ps→pdf
. Andere TeX-Nutzer betten jedoch PostScript in einem Maße in den Quellcode ein, dass diese Methoden versagen. Dies trifft vor allem zu, wenn das TeX-Paket PSTricks verwendet wird. Die Zusatzpakete pst-pdf, auto-pst-pdf und pdftricks bieten in diesem Fall Erleichterungen. Insgesamt verbleiben jedoch Fälle, in denen die „traditionelle“ Methode dvi→ps→pdf
unersetzbar ist. Eine weitere Alternative bietet aber
- XeTeX , das nach pdfTeX und etwas früher als LuaTeX erschien. Es erzeugt ein Zwischenformat XDV und daraus (vom Anwender kaum bemerkt) mit dem Treiber xdvipdfmx PDF. [16] Dadurch soll PostScript im Dokumentquellcode vollständig verarbeitet werden. [17] [18] Für die Verwendung von PStricks wird noch ein Paket xetex-pstricks angeboten.
3D-Daten
3D-PDF-Dokumente sind PDF-Dokumente, die entweder ein U3D -Flächenmodell oder ein BREP/Flächenmodell PRC [19] enthalten. Sie dienen vorwiegend der Visualisierung von CAD -Daten, kommen aber auch zunehmend in wissenschaftlichen Veröffentlichungen zur Anwendung. [20]
Der kostenlose Adobe Reader kann ab der Version 8.1 beide Formate anzeigen, animieren, schneiden und messen. Mit Acrobat 3D V7 ließen sich 3D-Daten aus 40 CAD-Formaten in 3D-PDF-Dateien konvertieren; jedoch hat 2010 Adobe Entwicklung, Vertrieb und Support der 3D-PDF-Konverter-Technologie an Tech Soft 3D [21] und die PROSTEP AG [22] übergeben. Ab Acrobat X [23] ist die Konvertierung nur noch als kostenpflichtiges 3D-PDF-Converter-Plugin [24] des Unternehmens Tetra 4D verfügbar.
Einige CAD-Programme wie Allplan oder SolidWorks [25] haben einen 3D-PDF-Export; Allplan bietet auch einen 3D-PDF-Import. [26] Auch Werkzeuge wie Deep Exploration von SAP, [27] Pages3D von QuadriSpace [28] und 3DVIA Composer von Dassault Systèmes [29] können 3D-CAD-Modelle als 3D-PDF abspeichern.
Neben den 3D-Daten als Visualisierung können auch andere relevanten Informationen zu einem CAD-Modell in ein PDF eingefügt werden. So können beispielsweise für die Herstellung eines Blechteils [30] die Daten des fertigen Modells als 3D-Visualisierung gezeigt werden.
Videoformate
Ab Acrobat 9 lassen sich diverse in Shockwave Flash (SWF) konvertierte Videoformate in Adobe PDF einbetten. Dadurch können Videos, Animationen und Anwendungen auf vielen Plattformen genutzt werden. Aufgrund der Adobe-Flash-Unterstützung in Adobe Reader ab Version 9 ist kein zusätzlicher Player für die Wiedergabe erforderlich. Seit dem letzten Patch von Adobe Acrobat und Adobe Reader 9 hat Adobe bei 3D-PDF das Standardverhalten geändert, unter anderem wurde der Flashplayer aus Adobe Acrobat 9 und Adobe Reader 9 entfernt – Flashinhalte greifen auf den Flashplayer im Betriebssystem zu. Adobe Acrobat X und Adobe Reader X sind nicht betroffen, da dort fast keine Angriffe erfolgen. 3D-Daten, SWF-Funktionen und SWF-Videoformate können auch kombiniert werden; so ist es möglich, Teilflächen des Modells mit SWF-Videos und Funktionen zu belegen.
Dateien aus Büroanwendungen
Viele aktuelle Programmpakete wie Apple iWork , Microsoft Office , LibreOffice , OpenOffice.org und Softmaker Office bieten einen PDF-Export an.
Versionen von PDF
Jahr | PDF-Version | Adobe-Version | Charakteristika |
---|---|---|---|
1993 | 1.0/PDF | 1 | optisch attraktive Textdarstellung, Einbettung von Lesezeichen und dateiinternen Querverweisen, Reader heißt Carousel |
1994 | 1.1 | 2 | externe Querverweise, Einbettung von Multimedia-Dateien in mittlerweile obsoleten Sound- und Video-Formaten, Dokumente können durchsucht werden, 40-Bit-Verschlüsselung |
1996 | 1.2 | 3 | Möglichkeit der Verwendung des CMYK-Farbmodells , direktes Öffnen im Browserfenster durch Implementierung von Browser-Erweiterungen (sog. Plugins), Zugänglichkeits-Plugin für Blinde für den Acrobat Reader 3, interaktive Elemente wie Checkboxen und Radiobuttons sind möglich |
1999 | 1.3 | 4 | Unterstützung asiatischer Schriften, verbessertes Accessibility Plugin für den Acrobat Reader, weiterhin 40-Bit-Verschlüsselung, digitale Signaturen, JavaScript -Elemente möglich |
2001 | 1.4 | 5 | Wegfall des Zugänglichkeits-Plugin, dafür Unterstützung von MSAA (Microsoft Active Accessibility) durch den Acrobat Reader, RC4 -Verschlüsselung mit 40–128 Bit, Beschreibung des logischen Dokumentaufbaus mit Tags |
2003 | 1.5 | 6 | Einbettung von Bildern im Format JPEG 2000 , Filmen im Format MPEG und Audiodateien im Format MP3 möglich, Public Key-Verschlüsselung PKCS#7 ; Leseprogramm heißt ab jetzt Adobe Reader, keine Unterstützung mehr für DOS-basierte Windows-Versionen ( Windows 9x ) |
2004 | 1.6 | 7 | Unterstützung für das Universal-3D -Dateiformat, Einbettung von OpenType -Fonts, Unterstützung für XFA-2.2-Rich-Text-Elemente und -Attribute, AES -Verschlüsselung, PKCS#7-Verschlüsselung mit SHA256 , DSA bis zu 4096 Bit, unzugängliche PDF-Dokumente können mit Tags versehen werden, bessere Unterstützung für mehrspaltige Dokumente, Formularfelder können mit Hilfe der Sprachausgabefunktionen vorgelesen werden, PDF-Creator mit Ausgabehilfeassistent: unterstützt beim Optimieren für Screenreader und Bildschirmvergrößerungsprogramme |
2006 | 1.7 | 8 | weitere Verbesserung der 3D-Darstellungsoptionen, stärkere Verschlüsselungsalgorithmen (PKCS#7 mit SHA384, SHA512 und RIPEMD-160 , 256-Bit AES) |
2008 | 1.7 | 9 | weitere Verbesserung |
2010 | 1.7 | X | weitere Verbesserung |
2012 | 1.7 | XI | weitere Verbesserung |
2017 | 2.0 | DC | Unterstützung für das PRC -Dateiformat, 3D-Messwerkzeuge, verbesserte Sicherheitsfunktionen [31] |
Normen und Standards
In verschiedenen Gremien der ISO werden seit dem Jahr 1997 Normen auf der Grundlage von PDF erarbeitet und verabschiedet. Dabei werden, basierend auf bestimmten PDF-Versionen, Mindestanforderungen sowie Einschränkungen definiert. Adobe Systems hat in diesem Zusammenhang den betreffenden Gremien der ISO das Recht übertragen, die jeweils nötigen Spezifikationen zeitlich unbegrenzt zum Herunterladen bereitzustellen.
Diese Normen entsprechen in grober Näherung als Basis den unterschiedlichen Versionen von PDF:
ISO | Jahr | Typ | Version | Bezeichnung / Bemerkung |
---|---|---|---|---|
15930 | 2001 | PDF/X | 1.3 | Format für die Übermittlung von Druckvorlagen |
15930-1 | 2001 | PDF/X-1a | 1.3 | siehe PDF/X |
15930-5 | 2003 | PDF/X-2 | 1.4 | siehe PDF/X |
15930-4 | 2003 | PDF/X-1a | 1.4 | siehe PDF/X |
15930-3 | 2002 | PDF/X-3 | 1.3 | siehe PDF/X |
15930-6 | 2003 | PDF/X-3 | 1.4 | siehe PDF/X |
15930-7 | 2008 | PDF/X-4 | 1.6 | siehe PDF/X |
15930-8 | 2008 | PDF/X-5 | 1.6 | siehe PDF/X |
19005-1 | 2005 | PDF/A-1 | 1.4 | Format für die elektronische Archivierung |
19005-1 | 2007 | PDF/A-1 | 1.4 | Korrektur PDF/A-1 |
19005-2 | 2011 | PDF/A-2 | 1.7 | siehe PDF/A-1 |
19005-3 | 2012 | PDF/A-3 | 1.7 | siehe PDF/A-1 |
24517 | 2008 | PDF/E | 1.6 | Format für technische Dokumente aus den Bereichen Ingenieurwesen, Architektur und Geo-Informationssysteme (PDF Engineering) |
– | 2008 | PDF/H | Format für Dokumente im Gesundheitswesen (PDF Healthcare) | |
14289 | 2008 | PDF/UA | 1.7 | Richtlinien zum Aufbau eines barrierefreien Dokuments im Format PDF (Universal Accessability) |
16612-2 | 2010 | PDF/VT | 1.6 | Format für den Einsatz im hochvolumigen und Transaktionsdruck (PDF Variable and Transactional Printing) |
32000-1 | 2008 | PDF 1.7 | 1.7 | |
32000-2 | 2017 | PDF 2.0 | 2.0 | [32] |
Literatur
- Philipp Mayr: Das Dateiformat PDF im Web – eine statistische Erhebung. In: NFD – Nachrichten für Dokumentation. Jg. 53, 2002, S. 475–481.
- Thomas Merz, Olaf Drümmer : Die PostScript- & PDF-Bibel. 2. Auflage. Kopublikation PDFlib / dpunkt Verlag, 2002, ISBN 3-935320-01-9 .
Die PostScript- & PDF-Bibel ( Memento vom 2. März 2013 im Internet Archive ; ZIP) von PDFLib - Betsy A. Fanning:Technology Watch Report, Preserving the Data Explosion: Using PDF (PDF; 136 kB), Digital Preservation Coalition, April 2008.
- Ralf Benzmüller, Karsten Tellmann: PDF: Potentially Dangerous Files, Angriffs- und Abwehrmechanismen bei PDF-Dateien. <kes>, Nr. 1, Februar 2010, S. 61–65; ähnlich bei security-zone.info (PDF; 3,1 MB).
- Hans Peter Schneeberger: PDF in der Druckvorstufe 1. Auflage. Rheinwerk Verlag, 2014, ISBN 978-3-8362-1750-7 .
Weblinks
- Linkkatalog zum Thema PDF bei curlie.org (ehemals DMOZ )
- PDF-Spezifikationen bei Adobe Systems (englisch)
- Technische Betrachtung der PDF-Dateiverschlüsselung
- ISO 19005-1 stützt sich auf das Portable Document Format Meldung auf heise online
- PDF mit dem W3C-Standard XSL-FO erzeugen
- Peter Zschunke, Ben Schwan: PDF wird 20 Jahre alt. (PDF) In: heise online. Abgerufen am 17. Oktober 2013 (Zum Wesen und Werdegang von PDF anlässlich des 20 Jahrestages).
- pst-pdf
- auto-pst-pdf
- pdftricks
- convert-pdfs.com
Einzelnachweise
- ↑ Jim Meehan, Ed Taft, Stephen Chernicoff, Caroline Rose, Ron Karr: PDF Reference, fifth Edition, Section 1.5 Intellectual Property. (PDF; 8,1 MB) (Nicht mehr online verfügbar.) Adobe Systems, November 2004, S. 7 , archiviert vom Original am 16. Juni 2015 ; abgerufen am 3. November 2010 (englisch).
- ↑ PDF . Wiki von Ubuntuusers.de
- ↑ a b Chaos Communication Congress: Glauben Sie nicht alles, was in einem PDF-Dokument steht . Zeit Online , Dezember 2019; abgerufen am 4. Januar 2020.
- ↑ ghostscript.com ( Memento vom 13. September 2015 im Internet Archive )
- ↑ Paket hyperref. Comprehensive TeX Archive Network ; abgerufen am 2. Januar 2018.
- ↑ PDF Reference (Sixth Edition, version 1.7) – 5.5.1 Standard Type 1 Fonts ( Memento vom 6. Juli 2015 im Internet Archive ) (PDF, 31 MB, 1.310 S.)
- ↑ netzwelt.de
- ↑ giga.de
- ↑ Stefan Mintert: invitation.xml – Transform a single source XML file to several output formats. In: Website der Linkwerk GmbH. Abgerufen am 3. November 2010 (englisch).
- ↑ HTMLDOC Open Source Home Page. (Nicht mehr online verfügbar.) Michael R Sweet, 16. Januar 2017, archiviert vom Original am 21. Februar 2016 ; abgerufen am 16. Januar 2017 (englisch).
- ↑ wkhtmltopdf. Open Source Project, abgerufen am 30. Dezember 2011 (englisch).
- ↑ Webkit Open Source Projekt. Open Source Project, abgerufen am 30. Dezember 2011 (englisch).
- ↑ Website als PDF mit Inhaltsverzeichnis. Innovate Webdoc Services, abgerufen am 30. Dezember 2011 .
- ↑ ps2pdf: PostScript-to-PDF converter auf ghostscript .com
- ↑ PStricks-Seite über PDF-Export. tug.org.
- ↑ xetex auf CTAN.
- ↑ Am höchsten bewertete Antwort von Herbert Voß zu Frage 8413 auf tex.stackexchange.com.
- ↑ Antwort von „egreg“ (Enrico Gregorio) zu Frage 19966 auf tex.stackexchange.com.
- ↑ PRC Format Specification ( Memento vom 2. Dezember 2008 im Internet Archive ) bei Adobe
- ↑ Axel Newe: Enriching scientific publications with interactive 3D PDF: an integrated toolbox for creating ready-to-publish figures . In: PeerJ Computer Science . Band 2 , 20. Juni 2016, ISSN 2376-5992 , doi : 10.7717/peerj-cs.64 ( peerj.com [abgerufen am 28. Juni 2016]).
- ↑ Acrobat Pro Bundle ( Memento vom 11. Mai 2012 im Internet Archive ) bei Tech Soft 3D
- ↑ PDF Generator 3D der PROSTEP AG
- ↑ Acrobat X Pro bei Adobe
- ↑ 3D PDF Converter-Plug-in bei Tetra 4D
- ↑ official help-documentation. DassaultSystemes Solidworks, abgerufen am 27. Juni 2019 (englisch).
- ↑ Datenaustauschformate . allplan.com
- ↑ Deep Exploration ( Memento vom 7. September 2012 im Webarchiv archive.today ) von Right Hemisphere, seit 2012 SAP
- ↑ Pages3D, QuadriSpace
- ↑ 3DVIA Composer ( Memento vom 25. Mai 2013 im Webarchiv archive.today ) bei Dassault Systèmes
- ↑ 3D-PDF Beispiel bei UNITEC Informationssysteme
- ↑ Taking Documents to the Next Level with PDF 2.0. (PDF) Adobe, abgerufen am 11. September 2017 (englisch).
- ↑ ISO 32000-2:2017. ISO Org, abgerufen am 11. September 2017 (englisch).