David Kriesel

David Kriesel (* 1984 in Bonn) ist ein deutscher Informatiker.

Ausbildung und berufliche Tätigkeit

Nach eigenen Angaben absolvierte Kriesel ein Studium der Informatik mit Nebenfach Biologie an der Rheinischen Friedrich-Wilhelms-Universität Bonn, das er 2009 mit einer Diplomarbeit über Schwarmevolution abschloss.[1]

Er ist nach eigenen Angaben in den Bereichen Prozessingenieurwesen und Datenwissenschaft bei Procter & Gamble beschäftigt.[1]

Fehlerhafte Zeichenersetzung beim Scannen zu PDF-Dateien mit Xerox-Scankopieren

Kriesel wurde im Jahr 2013 von einem Unternehmen, für das er während seiner Studienzeit tätig war, darauf aufmerksam gemacht, dass es bei einem von diesem eingesetzten Xerox-Scankopierer beim Scannen von Dokumenten zu PDF-Dateien zu einer fehlerhaften Abbildung von Zeichen in den PDF-Dateien kam.[2][3]

Nachdem Kriesel dazu den Xerox-Support angefordert hatte, veröffentlichte er die Angelegenheit auf seiner Website, als es Xerox auch durch Onsite-Support am ursächlichen Scankopierer des vogenannten Unternehmens innerhalb einer Woche nicht gelang Abhilfe zu schaffen.[2]

Weil es dadurch zu medialer Berichterstattung kam, sah sich Xerox zu PR-Mitteilungen veranlasst. Xerox machte dabei zum einen darauf aufmerksam, dass sowohl in Bedienungsanleitung als auch Menüführung betreffender Geräte darauf hingewiesen wird, dass beim Scannen zu PDF-Dateien Zeichenersetzung resultieren kann. Zum anderen wies Xerox darauf hin, dass beim Scannen zu PDF-Dateien keine Zeichenersetzung erfolgen würde, wenn unter Verwendung der Werkseinstellungen der Geräte gescannt wird. Zweiteres stellte sich im Weiteren jedoch als eine unwissentlich unrichtige Aussage heraus.[4]

Betreffende Xerox-Scankopierer erlaubten beim Scannen zu Dateien drei Auswahlmöglichkeiten beim Parameter "Quality / File size": "normal", "higher" und "high". Die Werkseinstellung war "higher". Aufgrund einer fehlerhaften Implementierung bzw. Parametrierung des JBIG2-Dateiformates durch Xerox, das für die Einbettung von Scan-Bilddaten in PDF-Dateien verwendet wurde, war jedoch bei betreffenden Xerox-Geräten auch in den Modi "higher" und "high" die Zeichenersetzung aktiviert, wodurch es mit diesen Geräten nicht verlässlich möglich war beim Scannen zu PDF-Datei eine exakte Repräsentation des Originals anzufertigen, da bei aktiver Zeichenersetzung insbesondere bei kleinen Zeichen, geringer Qualität des zu scannenden Dokumentes oder niedrig gewählter dpi-Auflösung des angefertigten Scans mit fehlerhafter Zeichenersetzung gerechnet werden musste.[4][5]

Xerox begegnete dem mit der Bereitstellung von Software-Updates für betreffende Geräte etwa vier Wochen nachdem Kriesel die Angelegenheit auf seiner Website veröffentlicht hatte.[6]

Herauszustellen ist, dass es beim Kopieren mit betroffenen Xerox-Geräten zu keiner Zeichenersetzung kam, weil hierbei nicht das JBIG2-Dateiformat zur Einsatz kam, und dass diese Zeichenersetzung auch nicht mit OCR in Verbindung zu bringen ist.

Im Zuge der Übernahme von Xerox durch Fujifilm im Jahr 2018 gab es erneut Xerox-Geräte, bei denen es zu fehlerhafter Zeichenersetzung kam.[7]

Vorträge

Kriesel ist nebenberuflich als Vortragsredner und Interviewpartner zu IT-Themen tätig.[1][8]

Dabei trat er im Jahr 2014 erstmalig öffentlich in Erscheinung, als er auf dem 31. Chaos Communication Congress des Chaos Computer Clubs einen Vortrag zur fehlerhaften Zeichenersetzung beim Scannen zu PDF-Dateien mit Xerox-Scankopieren hielt.[9][10]

Im Jahr 2016 stellte er die Ergebnisse seiner Datenanalyse von rund 80.000 Spiegel-Online-Artikel auf dem 33. Chaos Communication Congress vor.[11][12]

Im Jahr 2019 präsentierte er die Ergebnisse seiner Datenanalyse der Pünktlichkeit von Zugverbindungen der Deutschen Bahn auf dem 36. Chaos Communication Congress.[13][14][15]

Veröffentlichungen

Auf seiner Website veröffentlicht Kriesel unregelmäßig zu datenanalytischen Themen wie z. B. der Sonntagsfrage,[16] dem Wahl-O-Mat[17] oder der COVID19-Pandemie.[18]

Einzelnachweise

  1. a b c Person. D. Kriesel, abgerufen am 13. Januar 2020 (Blog).
  2. a b Xerox-Scankopierer verändern geschriebene Zahlen. 5. September 2017, abgerufen am 16. April 2026.
  3. D. Kriesel: Xerox scanners/photocopiers randomly alter numbers in scanned documents. Abgerufen am 16. April 2026.
  4. a b Xerox: Pressemitteilung zum Bug und angekündigtem Patch. In: realbusinessatxerox.blogs.xerox.com. Xerox Corporation, 7. August 2013, archiviert vom Original (nicht mehr online verfügbar) am 4. November 2013; abgerufen am 14. Januar 2020 (englisch).  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/realbusinessatxerox.blogs.xerox.com
  5. Möglicher Workaround für Zeichenersetzungen in Xerox Scankopierern. 5. September 2017, abgerufen am 17. April 2026.
  6. First Wave of Scanning Software Patches Ready | Real Business at Xerox. Archiviert vom Original (nicht mehr online verfügbar) am 31. August 2013; abgerufen am 18. April 2026.
  7. Christoph Jehle: Xerox-Software verändert eingescannte Zahlen. 7. Februar 2018, abgerufen am 17. April 2026.
  8. Every breath you take – Datenspuren im Internet - Diskussion. (PDF) Hochschule Bonn-Rhein-Siegen, Mai 2019, abgerufen am 10. Oktober 2023.
  9. David Kriesel: Xerox-Scankopierer verändern geschriebene Zahlen. In: dkriesel.com. 2013, abgerufen am 10. Oktober 2023.
  10. Felix Aust: #31c3: Traue keinem Scan, den du nicht selbst gefälscht hast. Netzpolitik.org, 21. Januar 2015, abgerufen am 10. Oktober 2023.
  11. Alle SpiegelMining-Artikel. D. Kriesel, abgerufen am 13. Dezember 2020 (Blog).
  12. Video und Folien meines 33C3-Vortrags "SpiegelMining". D. Kriesel, abgerufen am 13. Dezember 2020 (Blog).
  13. Lisa Hegemann: "ICEs haben die höchste Ausfallquote". Zeit Online, 31. Dezember 2019, abgerufen am 10. Oktober 2023.
  14. Andrea Diener: Chaos Communication Congress: Wie pünktlich ist die Bahn wirklich? In: FAZ. 29. Dezember 2019, ISSN 0174-4909 (Online [abgerufen am 14. Januar 2020]).
  15. Stefan Krempl: 36C3: BahnMining offenbart die nackte Wahrheit hinter der DB-Pünktlichkeitsquote. In: heise online. Abgerufen am 14. Januar 2020.
  16. Sonntagsfrage zur Bundestagswahl, laufend aktualisiert. D. Kriesel, abgerufen am 13. Januar 2020 (Blog).
  17. Findet den Unterschied. D. Kriesel, abgerufen am 13. Januar 2020 (Blog).
  18. David Kriesel: Corona-Plots und Interpretationshilfen, garantiert unaufgeregt. 29. März 2020, abgerufen am 9. Juni 2021.