Created
April 26, 2022 04:19
-
-
Save jojomi/d83f23868ed7e75a588123939804baa3 to your computer and use it in GitHub Desktop.
Schufa-Datenkopie in durchsuchbares PDF umwandeln
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
| #!/bin/sh | |
| set -ex | |
| NAME=schufaselbstauskunft | |
| convert *.jpg "${NAME}.pdf" | |
| alias docker_ocrmypdf='docker run --rm -i jbarlow83/ocrmypdf' | |
| docker_ocrmypdf - - <"${NAME}.pdf" >"${NAME}-scan.pdf" |
Author
Danke für die nützlichen Hinweise zum Skript, @gsauthof, so soll es sein. Jeder darf und soll ich dann herauspicken, was in seinem Usecase am besten passt bzw. verfügbar ist, Vielfalt ist hilfreich :).
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Danke für den Hinweis dass unter dem Link zur elektronischen Datenkopie im Schufa Auskunftsbrief keine zusätzlichen Informationen gibt!
Hatte ich mich immer gefragt, denn ich hatte die letzten Jahre den Brief jedes Mal zu lange im Eingang herumliegen lassen und bei Öffnung war der Link dann jeweils schon abgelaufen ... m(
Kommentare zum Script:
Imagemagick (convert) ist leider nicht so gut geeignet um jpgs nach PDF umzuwandeln, weil es den Input re-komprimiert, obwohl das nicht notwendig ist.
Das Kommando img2pdf schafft die Umwandlung ohne weitere Verluste: https://pypi.org/project/img2pdf/
Eine Alternative zu Docker ist eine Linux Distribution wie Fedora, wo ocrmypdf im Hauptrepository verfuegbar ist,
also die Dependency-Hölle dann darüber eingefangen wird.
FWIW, falls man einen Einzugsscanner hat, kann man auch mein Tool https://pypi.org/project/adf2pdf/ verwenden um den Schufa Brief zu digitalisieren. Das fügt auch ein OCR Text Layer dem finalen PDF hinzu. Wenn man es schon installiert hat kommt man ggf. sogar schneller an's Ziel als mit dem Schufa-Download herumzukämpfen ... ;-)