Akustischer Fingerabdruck

Ein akustischer Fingerabdruck ist ein digitaler Code zur Charakterisierung eines Klangs oder einer Audioaufnahme unter Berücksichtigung spezieller akustischer Gegebenheiten.

Spektrogramm einer weiblichen Stimme

Die Berechnung eines akustischen Fingerabdrucks stellt eine ähnliche Herausforderung dar wie die Audiodatenkompression, die WAV-zu-MIDI-Konvertierung oder insbesondere die Stimmerkennung: Da es sich bei natürlichen Klängen um ein komplexes Gemisch aus Frequenzen und Phasenlagen handelt, ist die Erkennung und Extraktion der spezifischen Anteile des akustischen Signals – der Nutzdaten – eine wesentliche Vorbedingung. Akustische Fingerabdrücke können sehr einfach gehaltene oder auch mit komplexen Algorithmen erzeugte Hashwerte sein. Sie können in Form von Metadaten vorliegen, die z. B. Aussagen über das Genre eines digital gespeicherten Musikstücks zulassen.

Akustische Fingerabdrücke können in Datenbanken gespeichert werden, von wo sie zur Identifikation (wie bei der Stimmerkennung oder der Erkennung einzelner Musikstücke) und Klassifizierung von neuen, unbekannten Signalen bzw. ihrer Abdrücke herangezogen werden. Der Musik-Identifikationsdienst Shazam basiert auf dem Abgleich von akustischen Fingerabdrücken und wurde speziell für Mobiltelefone und Smartphones entwickelt.

Kommerzielle Verfahren der Fingerabdruckerzeugung für Musikdaten sind u. a. TRM[1] und AudioID.[2] Als kostenlose Alternative dazu gibt es MAFP,[3] sowie als freie Open-Source-Alternative dazu AcoustID.[4]

Einzelnachweise

  1. Relatable : TRM™: The Barcode for Digital Music (Memento des Originals vom 8. November 2007 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.relatable.com, abgerufen am 6. Januar 2014.
  2. mufin GmbH: audio identification & music recommendation
  3. Peter Lorenz: Mediapurge/MediaArchive - Medienverwaltung und mehr... Abgerufen am 8. August 2017.
  4. AcoustID!

Weblinks

Auf dieser Seite verwendete Medien

Spectrogram - motángo mwa basodá.png

Spectrogram of Lingala "motángo mwa basodá". Standard lingala, pronounced by a female speaker.

  • light blue line = pitch
  • dark blue lines = pulses
  • red dots = formants