Handschrifterkennung

Handschrifterkennung ist eine Form der Mustererkennung, bei der handschriftlich geschriebene Zeichen oder Wörter erkannt werden sollen. Dabei wird zwischen online und offline Handschrifterkennung unterschieden.[1][2] Bei der Online-Handschrifterkennung kann die Information, wie ein Wort geschrieben wurde, also in welcher Reihenfolge die Striche gezogen wurden, zur Erkennung benutzt werden. Bei der Offline-Handschrifterkennung liegt dagegen nur das Endprodukt als Bild vor. Daher ist die Offline-Handschrifterkennung ein Teilgebiet der Texterkennung, die Online-Handschrifterkennung jedoch nicht.

Allgemeine Funktionsweise

Ein Handschrifterkenner kann verschiedene Schritte zur Schrifterkennung nutzen:

  • Vorverarbeitung: Das Entfernen von überflüssigen (zu hohe Auflösung) oder sogar fehlerhaften Informationen (Bildfehler)
  • Segmentierung: Das Zerlegen der Eingabe in kleinere Teile, wie z. B. das Zerlegen von Wörter in Buchstaben oder von Zahlen in Ziffern
  • Feature-Extraktion bzw. Generierung: Aus den vielen kleinen Informationen werden weniger, wichtigere Informationen generiert. So kann in der online Handschrifterkennung aus den vielen Informationen, wo zu welchem Zeitpunkt der Stift war die Information generiert werden, welche Krümmung die Schriftkurve in verschiedenen Punkten hat.

In einem weiteren Schritt werden dann mit Techniken des maschinellen Lernens die Zeichen erkannt. Dieser Schritt kann z. B. auch fehlende Zeichen oder falsche Zeichen und Zeichenreihenfolgen in den Zeichen in der Schreibweise erkennen, z. B. Schrebweise", "Schriebweise" oder "Schreipweise" (siehe auch N-Gramm angewendet für einzelne Zeichenketten).

Entwicklungsgeschichte

Eines der ersten entwickelten Handschrifterkennungsverfahren ist parallel mit der Entwicklung einer der ersten Convolutional Neural Networks entstanden und diente ursprünglich für Erkennung von Postleitzahlen der US Postal Service. LeNet,[3] entwickelt von Yann LeCun, wurde jedoch rasch von neueren CNN’s abgelöst, wie zum Beispiel AlexNet, wegen ihrer Einschränkung bei der Anzahl von Output Variablen.[4]

Online Handschrifterkennung

Online Handschrifterkennung benötigt bereits beim Schreiben einen Touchbildschirm oder ein anderes digitales Gerät zum Aufzeichnen der Schrift. Dabei können verschiedenste Eingabegeräte wie Smartphones und Tablets mit Fingern bzw. Eingabestiften oder auch Grafiktabletts zum Einsatz kommen. Diese Eingabegeräte liefern die Information, wo sich der Eingabestift befindet. Manche Geräte liefern diese Information auch dann, wenn sich der Stift nicht auf dem Touchscreen befindet, sondern nur darüber ist. Je nach verwendeter Technologie wird zusätzlich zu den Koordinaten der Eingabe auch noch die Information geliefert, wie viel Druck ausgeübt wurde.

Online-Handschrifterkennung ist momentan noch deutlich weniger verbreitet als Offline-Handschrifterkennung.

Online-Handschrifterkennung wird seit den 1950er Jahren wissenschaftlich untersucht.[5] (1958 wurde mit dem „Stylator“ das erste Gerät vorgestellt, mit dem die Aufnahme von On-line-Informationen bzgl. der Handschrifterkennung möglich war.[6])

Die Vorverarbeitung in der Online-Handschrifterkennung kann eine Fülle von verschiedenen Schritten beinhalten:[7]

  • Das Finden und Eliminieren „wilder Punkte“, also von Punkten die durch Hardwarefehler entstehen.
  • Das Interpolieren der gemessenen Punkte sowie damit verbunden das Neuberechnen von Punkten.
  • Das Skalieren und Verschieben der Eingabe.
  • Das Finden einer Basislinie und gegebenenfalls das Korrigieren der Schrift, sodass sie auf einer geraden Basislinie liegt.
  • Das Finden und gegebenenfalls das Korrigieren der Neigung der Buchstaben.

Offline-Handschrifterkennung

Die Offline-Handschrifterkennung hat zahlreiche Anwendungsgebiete wie beispielsweise die Schrifterkennung auf Formularen, Überweisungsbelegen und Adressen auf Briefen.

Forschung

Die Handschrifterkennung hat eine aktive Gemeinschaft, welche diese studiert. Es gibt verschiedene Konferenzen wie die ICFHR oder die ICDAR, welche dieser dienen.

Siehe auch

Einzelnachweise

  1. Brakensiek, A. and Kosmala, A. and Willett, D. and Rigoll, G.: Vergleich verschiedener statistischer Modellierungsverfahren für die On- und OffLine Handschrifterkennung. 1. Auflage. Springer Berlin Heidelberg, Berlin 1999, ISBN 978-3-540-66381-2, S. 70–77.
  2. Joachim Schenk, Gerhard Rigoll: Mensch-Maschine-Kommunikation. 1. Auflage. Springer Berlin Heidelberg, Berlin 2010, ISBN 978-3-642-05456-3, S. 151–164.
  3. Yann Lecun, Léon Bottou, Yoshua Bengio, Patrick Haffner: Gradient-based learning applied to document recognition (= IEEE [Hrsg.]: Proceedings of the IEEE. Band 86, Nr. 11). 1998, S. 2278–2324, doi:10.1109/5.726791 (englisch, hal.science [PDF; 960 kB; abgerufen am 7. Juni 2024] alternativ online).
  4. Jerry Wei: AlexNet: The Architecture that Challenged CNNs. In: towardsdatascience.com. Towards Data Science, 3. Juli 2019, abgerufen am 6. Juni 2024 (englisch).
  5. Tappert, C. C. and Suen, C. Y. and Wakahara, T.: The State of the Art in Online Handwriting Recognition. In: IEEE Trans. Pattern Anal. Mach. Intell. Band 12, Nr. 8, 1990, S. 787–808, doi:10.1109/34.57669 (englisch).
  6. T. L. Dimond: Devices for Reading Handwritten Characters. In: Papers and Discussions Presented at the December 9–13, 1957, Eastern Joint Computer Conference: Computers with Deadlines to Meet. 1958, S. 232–237, doi:10.1145/1457720.1457765 (englisch).
  7. Martin Thoma: On-line Recognition of Handwritten Mathematical Symbols. Bachelor’s Thesis. Hrsg.: Department of Informatics, Institute for Anthropomatics and Robotics – IAR, Karlsruhe Institute of Technology – KIT; School of Computer Science, Interactive Systems Lab – ISL, Carnegie Mellon University – CMU. 29. November 2015, doi:10.5445/IR/1000048047, arxiv:1511.09030 (englisch, arxiv.org [PDF; 3,2 MB] alternativ online oder hier).