Autor Thema: [Erfahrungen] Digitalisierung alter Rollenspielen - Wer kennt sich mit OCR aus?  (Gelesen 470 mal)

0 Mitglieder und 1 Gast betrachten dieses Thema.

Offline King Grayskull

  • Bloody Beginner
  • *
  • Beiträge: 30
  • Username: King Grayskull
Hi, ich bin gerade dabei meine alte MERS Sammlung zu digitalisieren. Ich habe schon einige meiner deutschen Bände gescannt und als PDFs umgewandelt. Trotz Optimierung sind die PDFs natürlich sehr groß. Hat von euch jemand Erfahrung mit OCR Texterkennungsprogrammen? Gibts einen einfachen Weg wie ich meine PDFs in Texte umwandeln kann um die Dateigrößen noch kleiner zu bekommen oder ist das ein riesen Aufwand und geht gar nicht so einfach wie ich mir das vorstelle?

Wer hat damit Erfahrung?

Offline Flamebeard

  • Resident Car Mechanic
  • Legend
  • *******
  • Beiträge: 4.694
  • Geschlecht: Männlich
  • Username: Flamebeard
Selbst noch nicht ausprobiert, aber Bekannte schwören auf

https://sourceforge.net/projects/gimagereader/
(Klicke zum Anzeigen/Verstecken)

Mein Biete-Thread

Offline JS

  • Titan
  • *********
  • Ich war es nicht!
  • Beiträge: 13.115
  • Geschlecht: Männlich
  • Username: JS
Probier mal Mircosoft Lens. Allgemein ist es aber mit OCR nicht so einfach, komplexe Layouts befriedigend zu übertragen.
Wer gern sagt, was er denkt, sollte vorher etwas gedacht haben.

Offline schneeland

  • Moderator
  • Mythos
  • *****
  • Cogito ergo possum
  • Beiträge: 11.576
  • Username: schneeland
Ich mache so eine Übung gerade mit alten Shadowrun-Büchern - als Scanner kommt ein CZUR Shine Ultra zum Einsatz, was zwar in der Praxis doch recht aufwendig ist, aber den Vorteil hat, dass die Software einigermaßen gut darin ist, die Buchseiten zu entzerren (klappt aber auch nicht immer gut und auch sonst gibt es da ein paar Macken).
Anschließend dann Zusammenfüge und OCR mit Acrobat Pro (bedauerlicherweise nur für Schüler und Studenten halbwegs bezahlbar). Ich lasse selber dann die meisten PDFs mit den Bildern wie sie aus dem Scanner fallen stehen. Testweise habe ich mal für ein PDF nachträglich runterkomprimiert (auch mit dem Acrobat) - das sorgt dann für akzeptable Größen im Bereich von 20-30MB.
« Letzte Änderung: 14.10.2021 | 22:26 von schneeland »
Brothers of the mine rejoice!
Swing, swing, swing with me
Raise your pick and raise your voice!
Sing, sing, sing with me