Scannen aus der jeweiligen Anwendung
Acrobat Pro DC
- Datei > Erstellen > PDF über den Scanner
- Man kann den Ausgabe-Modus wählen zwischen
- Durchsuchbares Bild (Bildebene vor Textebene, Erkennungsfehler nicht sichtbar)
- Bearbeitbare Texte und Bilder (Textebene vor Bildebene, Erkennungsfehler sichtbar)
- Die Dokumentsprache, leider ist nur eine wählbar
FineReader
- Es sind weitere OCR-Sprachen wählbar
- Scannen > In PDF scannen
- Scannen > Für den OCR-Editor scannen
- Einstellungen für durchsuchbare PDFs
- Text unter dem Seitenbild
- Text über dem Seitenbild
- (x) Lesezeichen in Kopfzeilen platzieren (Ausprobieren)
- (x) PDF Tags erstellen (Ausprobieren)
Eingebetteten Suchindex verwalten
Acrobat Pro DC
Werkzeuge > Index > Eingebetteten Index verwalten
Index einbetten, Index entfernen, Index aktualisieren
Problemstellen bei der Texterkennung suchen und korrigieren
Acrobat Pro DC
Werkzeuge > Scans verbessern > Text erkennen > Erkannten Text korrigieren
Meldung z.B.: Das Dokument enthält keine Problemstellen
Rechtschreibprüfung
Acrobat Pro DC
- Voreinstellung > Rechtschreibung
Hier kann man weitere Wörterbücher hinzufügen - Bearbeiten > Rechtschreibprüfung > Rechtschreibung in Kommentaren und Feldern überprüfen …
Findet man nicht über die Hilfe
Anscheinend wirklich nicht für normalen Text
Text in PDF-Dateien bearbeiten
Acrobat Pro DC
Sie können Text nur bearbeiten, wenn die für diesen Text verwendete Schrift auf Ihrem System installiert ist.
Wenn die Schriftart nicht auf Ihrem System installiert ist, aber in der PDF-Datei eingebettet ist, können Sie nur die Farbe oder die Schriftgröße ändern.
Wenn die Schrift weder installiert noch eingebettet ist, können Sie den Text nicht bearbeiten.
Text in PDF-Dateien bearbeiten:
https://helpx.adobe.com/de/acrobat/using/edit-text-pdfs.html
Links in PDF-Dateien bearbeiten
Acrobat Pro DC
Links in PDF-Dateien bearbeiten:
https://helpx.adobe.com/de/acrobat/using/links-attachments-pdfs.html
Prüfen auf PDF/A Konformität, PDF/A erzeugen
PDF/A-Standards
Siehe auch Wikipedia:
https://de.wikipedia.org/wiki/PDF/A
- 1 = älteste Version
- 2 = Version 2
- 3 = wie 2 aber Anhänge z.B. Originale in beliebigen Formaten sind erlaubt
- a = Accessible getaggtes PDF
- b = Basic muss nicht getaggt sein
- u = Unicode wie b nur mit Unicode
Acrobat Pro DC continuous
Preflight Bibliothek = Starterkit
- Werkzeuge > Druckproduktion > Preflight > PDF/A-Standard
- Nach PDF/A-1b konvertieren
- Nach PDF/A-2b konvertieren
Acrobat Pro DC classic
Acrobat Pro DC continuous
Preflight Bibliothek = PDF-Standards
Preflight Bibliothek = Acrobat Pro DC 2015-Profile
- Werkzeuge > Druckproduktion > Preflight > PDF/A-Standard
- Konformität mit PDF/A-1a prüfen
- Konformität mit PDF/A-1b prüfen
- Konformität mit PDF/A-2a prüfen
- Konformität mit PDF/A-2b prüfen
- Konformität mit PDF/A-2u prüfen
- Konformität mit PDF/A-3a prüfen
- Konformität mit PDF/A-3b prüfen
- Konformität mit PDF/A-3u prüfen
- Nach PDF/A-1a konvertieren
- Nach PDF/A-1b konvertieren
- Nach PDF/A-2a konvertieren
- Nach PDF/A-2b konvertieren
- Nach PDF/A-2u konvertieren
- Nach PDF/A-3a konvertieren
- Nach PDF/A-3b konvertieren
- Nach PDF/A-3u konvertieren
Prüfen auf Barrierefreiheit und Dokument taggen
Acrobat Pro DC
- Werkzeuge > Barrierefreiheit
- Dokument automatisch taggen
automatisch taggen zerstört schon vorhandene Tags - Lesereihenfolge
Zum Taggen Rahmen um Elemente ziehen Button Überschrift, Formel, Text, Abbildung anklicken
- Dokument automatisch taggen
- Werkzeuge > Druckproduktion > Preflight > PDF/UA-Standard
- Werkzeuge > Aktionsassistent > Barrierefrei machen
Sieht eigentlich ganz gut aus, leider ist kein Copy & Paste aus dem selben Dokument möglich wenn Felder wie Alternativ Text ausgefüllt werden müssen. Sogar die Lesezeichen blieben erhalten.
Barrierefreiheitsbericht erstellen und speichern
Acrobat Pro DC
- Werkzeuge > Barrierefreiheit > Vollständige Prüfung
Fenster: Barrierefreiheitsprüfung > Optionen >Bericht anzeigen
Fenster: Barrierefreiheitsprüfung > Optionen> Bericht an Dokument anhängen
Fenster: Anhänge > Optionen > Anlage speichern
Mit Webbrowser gespeicherte Anlage (HTML-Datei) öffnen.
- Acrobat: Werkzeuge > PDF-Datei bearbeiten > Bearbeiten (x) Begrenzungsrahmen anzeigen
- Acrobat: Werkzeuge > Barrierefreiheit > Leserichtung > Reihenfolge-Fenster anzeigen (x) Seiteninhaltsgruppen anzeigen
- PDF Accessibility Checker (PAC 2)
Dialogfeld „Texterkennung – Allgemeine Einstellungen“
Alle Informationen unter:
https://helpx.adobe.com/de/acrobat
- Primäre OCR-Sprache
- Über die „Primäre OCR-Sprache“ legen Sie fest, in welcher Sprache die OCR-Software die Zeichen lesen soll.
- PDF-Ausgabestil
- Legt fest, welche Art von PDF-Datei erstellt wird. Bei allen Optionen ist eine Eingangsauflösung von mindestens 72 ppi (Pixel pro Zoll) (empfohlen) erforderlich. Alle Formate wenden die optische Zeichenerkennung (OCR) sowie die Schrift- und Seitenerkennung auf die Textbilder an und konvertieren sie in normalen Text.
- Durchsuchbares Bild
- Stellt sicher, dass der Text durchsucht und ausgewählt werden kann. Diese Option erhält das Originalbild, entfernt ggf. eine Verzerrung und platziert darüber eine unsichtbare Textebene. Die Auswahl für „Bilder neu berechnen auf“ im selben Dialogfeld entscheidet darüber, ob das Bild neu berechnet wird und in welchem Ausmaß dies geschieht.
- Durchsuchbares Bild (exakt)
- Stellt sicher, dass der Text durchsucht und ausgewählt werden kann. Diese Option erhält das Originalbild und platziert darüber eine unsichtbare Textebene. Sie ist zu empfehlen, wenn das Originalbild beibehalten werden muss.
- ClearScan (Bearbeitbare Texte und Bilder bei Acrobat Pro DC)
- Synthetisiert eine neue Typ 3-Schriften, die dem Original nahe kommt, und erhält den Seitenhintergrund mit geringer Auflösung.
- Neuberechnen auf
- Durch diese Einstellung wird die Anzahl der Pixel in Farb-, Graustufen- und Schwarzweißbildern nach Abschluss der Zeichenerkennung reduziert. Wählen Sie den gewünschten Grad der Neuberechnung. Je höher die Anzahl der DPI, desto geringer ist der Grad der Neuberechnung und desto höher die Auflösung der PDF-Dateien.
Welche Schriften sind eingebettet
Acrobat Pro DC
- Datei > Eigenschaften > Schriften
Das ist die einfachere Variante
Es muss dort eingebettet oder eingebettete Untergruppe stehen, alle anderen sind nicht eingebettet. - Werkzeuge > Druckproduktion > Preflight > PDF/A-Standard
z.B. PDF/A-2b Prüfen
Übersicht > Zeichensätze
Versucht man das Dokument zu konvertieren, so werden alle nicht eingebetteten Schriften, die auf dem lokalen Rechner nicht installiert sind als Warnung angezeigt.
Microsoft Word
Eventuell kann man damit Formeln aus PDF-Dokumenten nachbearbeiten und für das PDF-Formel-Tag in lineare Form bringen. Falls ein Delta-Zeichen gebraucht wird müsste das mit Symbol gehen.
- Einfügen > Formel > Professionell
- Einfügen > Formel > Linear
- Einfügen > Symbol
-
MS Office Word: UTF-8-Kodierung einstellen
http://praxistipps.chip.de/ms-office-word-utf-8-kodierung-einstellen_34640