1. DC
  2. Forum
  3. Weitere Geräte
  4. Scanner
  5. Unterschiede bei CCD-Scannern beim Scannen von Frakturschrift?

Unterschiede bei CCD-Scannern beim Scannen von Frakturschrift?

Dieses Thema ist inaktiv: weitere Antworten sind nicht mehr möglich. Sie können jedoch ein neues Thema erstellen.

von
Hallo,

experimentiere seit einiger Zeit mit dem Scannen von Frakturschrift. Ich benutze dazu einen Epson V37 (CCD). Im Gegensatz zu einem Buchscanner scheint die Fehlerquote deutlich geringer zu sein.

Mein Vorgehen:

1. Scannen mit Abbyy Finereader 12
2. Speichern als TIFF
3. Bearbeitung mit ScanTailor
4. Erkennung mit Tesseract (gimagereader)

Jetzt ist der V37 ja ein älteres Einsteigermodell von Epson. Denkt ihr, ein teureres Modell (von Epson oder einem anderen Anbieter) mit CCD würde mir hier helfen, die Fehlerquote zu senken?

Dankeschön!

Vergnuegt
von
Wie scannst du denn die ganze Sache ein? (Bitrate, Modus Farbe oder S/W, Dpi) Die meisten Texterkennungsprogramme müssen unbekannte Schriftarten erst "lernen" das heisst mit der Zeit wird die Erkennung besser. Besonders hohe Anforderungen werden nicht an die Scanner gestellt. Was Probleme bereiten kann sind schräge Zeilen u.ä. die gerne durch den Buchrücken entstehen, da haben reine Buchscanner häufig bessere Filter. Aber das muss man in der Software sehen.
von
Hallo,

scannst du plane Blätter ein, oder Bücher?

Bei einem "einfachen" S/W-Scan, kann ich mir kaum vorstellen, dass ein anderer Scanner riesige Fortschritte mit sich bringt. Der V37 hat ja auch schon 4.800 dpi optisch, selbst wenn da nur ein Viertel übrig bleibt wäre das mehr als ausreichend - außer die Schrift ist extrem klein.

Gruß,

Ronny Budzinske
www.druckerchannel.de
von
Hallo zusammen,

danke für Eure Antworten.

Ich scanne Heftnachdrucke aus den 20ern ein. Diese sind mit Klammern gebunden, lassen sich also gut auf das Scannerglas auflegen. Allerdings ist die Qualität der Nachdrucke unterschiedlich: manche sind sehr gut, manche weniger, manche haben vergibltes Papier, manche weißes, ...

Ich scanne mit 300 dpi Graustufen ein. Zur Verfügung hätte ich neben Finereader auch Vuescan bzw. andere Bildbearbeitungsprogramme. Da es aber eine Menge an Heften sind, habe ich gedacht, dass Finereader vielleicht hier schon einige gute Voreinstellungen leistet. Außerdem kann man Finereader so einstellen, dass er automatisch alle X Sekunden einen Scan durchführt. Ich lasse aber nicht die Texterkennung von Finereader drüberlaufen, sondern speichere das Ganze als Graustufen-TIFFs ab, um die TIFFs mit Scantailor zu säubern, auszurichten und mit 600 dpi auszugeben.

Diese Ausgabe-TIFFs von Scantailor (600dpi, sw) lese ich dann in gimagereader ein. Gimagereader ist ein Frontend für Tesseract, so dass ich den Text danach rauskopieren kann.

Da die Schrift normal groß ist, müßte 300 dpi für OCR ausreichen. 1200dpi bringt nach meinen Tests gar nichts. Es ist die Frage, ob es sinnvoller ist, die Hefte s/w anstatt in Graustufen einzuscannen? Oder ob eine andere Art von Vorverarbeitung hier mehr bringt? Allerdings fürchte ich auch, dass Tesseract nicht immer die beste Lösung bietet - wobei der Recognition Server von Abbyy für Frakturschriften kostenpflichtig ist.

Im Vergleich zwischen gimagereader und FreeOCR sehe ich auch noch einige Unterschiede, so dass nicht alles an Tesseract hängen muss.

Bin über Eure Tips sehr dankbar! Wenn es Fragen gibt, die ich zum Frakturscannen beantworten kann - jederzeit gerne.

vergnuegt
Beitrag wurde am 22.10.16, 09:47 Uhr vom Autor geändert.
von
Hmm...

Ich frage mich gerade, ob es sinnvoll ist mit 300 dpi reinzugehen und dann über eine Bearbeitung wieder auf 600 dpi hochzurechnen, auch wenn es als Ziel von 8 bit auf 1 bit geht und das halbwegs klappen könnte ...

Ich kenne die Programme eigentlich alle nicht, es ist schön möglich, dass Scantailor hier etwas besser ist, als die Epson-Routine. Aber hast du mal probiert vom Scan direkt mit 600 dpi (oder auch etwas höher) 1 bit zu scnnen? Die Papierfarbe wird ja nicht soo dunkel sein, dass hier kein ordentlicher Schwellenwert einstellbar ist.

Gruß,

Ronny Budzinske
www.druckerchannel.de
von
300dpi sollte reichen beim Scannen, wenn es nicht gerade sehr kleine Schrift ist, Upscaling auf 600dpi liefert keine neuen Informationen. Hilfreich wäre es, wenn das OCR-Modul eine Lernfunktion hätte, was bei seltenen Schriften hilfreich sein kann, aber Finereader bietet das m.W. nicht. Hilfreich sind Grafikfunktionen wie lokale Kontrastanhebung und Smoothing , um kleine Lücken auszugleichen, die häufig die Erkennung beeinträchtigen, aber auch das habe ich nur bei kommerziellen Dokumentmanagementprogrammen gesehen. Und sonst das Übliche wie Spot Removal und weitere 'Putz'-Funktionen. Manchmal helfen auch andere Tricks , wenn man farbig scannt, und dann nur z.B. den Blaukanal weiterverwendet, wenn Papier stark vergilbt ist, das hängt von der Vorlage ab, und der Software, die zur Verfügung steht.
Beitrag wurde am 22.10.16, 12:05 Uhr vom Autor geändert.
von
Danke!

ScanTailor verbessert das Bild deutlich, da es die Möglichkeit gibt, die Seiten aufzuteilen, Kontraste besser herauszuarbeiten, schief gescannte Seiten gerade auszurichten, Schmutz zu entfernen, etc. Ich glaube, dass die native Epson-Software hier nicht mithalten kann.

Finereader hat eine Lernfunktion: das ist auch ein Weg, den einige mit Frakturscans gehen. Andere tippen die Sachen ab. Ist halt sehr aufwendig und da einige Frakturzeichen (z. B. s und f) sich sehr ähnlich sehen, hängt es immer stark von der Vorlage ab. Mein Ziel ist es, ein halbwegs gutes Ergebnis zu erhalten - muss nicht perfekt sein, sollte aber auch nicht im Buchstabensalat enden :-)

Ich werde es mal mit 300dpi bei ScanTailor ausprobieren, mal sehen, ob es was bringt.

Hat jemand noch eine Idee, ob es eine bessere GUI für Tesseract als gimagereader (für Win) gibt? Oder gibt es hier für Linux bessere Lösungen?

Danke.

vergnuegt
von
ich würde auf jeden Fall Graustufen verwenden stat S/W. Hierbei ist die Fehlerrate geringer, da eine genauere Abstuffung zwischen Schwarz und Weiss erfolgt.

Haripon
1

Offenlegung - Provisionslinks

Wir erhalten bei einer Vermittlung zum Kauf oder direkt beim Klick eine Provision vom Anbieter.

Alle Preise enthalten die derzeit gültige MwSt. und verstehen sich zzgl. Versandkosten. Der Preis sowie die Verfügbarkeit können sich mittlerweile geändert haben. Weiß hinterlegte Preise gelten für ein baugleiches Gerät. Alle Angaben ohne Gewähr.

Forum Aktuell
15:57
14:30
12:10
11:44
11:19
25.3.
25.3.
Artikel
22.03. Roland DG: Brother bietet für Großformat-​ und Industriedruckerhersteller
21.03. HP Instant Ink Platinum (Spanien): Weiteres Abo mit Druckermiete wird pilotiert
20.03. IDC Marktzahlen Q4/2023: Weltweite Druckerauslieferung schwach, lediglich Brother und Epson steigern Marktanteile
11.03. Epson Printer-​Cashback 2024: Bis zu 50 Euro beim Kauf eines Epson-​Tintendruckers zurückerhalten
09.03. HP Color Laserjet Pro 3202-​ und MFP 3302-​Serie: Neue Einstiegs-​Farblaser von HP in Sicht
08.03. Quo vadis Canon Pixma?: Günstigster "Single Ink"-​Multifunktionsdrucker TS6350a abgekündigt
07.03. Canon Pixma TR7650: Da issa ja wieder! Fotodrucker mit Fax und ADF neu aufgelegt
02.03. HP All-​In Plan (USA): Ein Leihdrucker zum "Instant Ink"-​Abo
27.02. HP Officejet und Laserjet: Probleme mit "Scan-​to-​Email" bei HP-​Druckern über Strato-​Mail
23.02. HP Laserjet, Pagewide und Scanjet: Schwachstelle bei Druckern und Scannern mit "FutureSmart"-​Firmware sowie der neuen 4202/4302-​Serie
19.02. Brother DCP-​C1210N "Picocharge": Tintendrucker mit Vorausbezahlung der Seiten
15.02. HP Officejet Pro 9730e und 9720e: Erste A3-​Bürotintendrucker von HP mit Abo-​Option
Themen des Tages
Beliebte Drucker
ab 599,00 €1 Canon Maxify GX7050

Multifunktionsdrucker (Pigmenttinte)

ab 338,97 €1 Epson Ecotank ET-4850

Multifunktionsdrucker (Tinte)

ab 147,46 €1 Kyocera MA2001w

S/W-Multifunktionsdrucker (Laser/LED)

ab 164,90 €1 Canon Maxify MB5150

Multifunktionsdrucker (Pigmenttinte)

ab 739,99 €1 Epson Ecotank ET-5850

Multifunktionsdrucker (Pigmenttinte)

ab 385,49 €1 Canon Maxify GX4050

Multifunktionsdrucker (Pigmenttinte)

ab 72,90 €1 Epson Expression Home XP-3200

Multifunktionsdrucker (Tinte)

ab 266,56 €1 Canon Maxify GX3050

Multifunktionsdrucker (Pigmenttinte)

ab 265,99 €1 Brother MFC-J5740DW

Multifunktionsdrucker, A3 (Pigmenttinte)

ab 189,90 €1 HP Officejet Pro 9022e

Multifunktionsdrucker (Pigmenttinte)

Merkliste

×
Drucker vergleichen