nanocamp Audio-Modifikation
Wie entstand Oversampling?

In Prospekten der Hersteller aus den 80-er Jahren liest man häufig, dass Oversampling aus technischen Gründen notwendig war und zudem die Klangqualität steigere. Aber wie entstand es wirklich?

Es war Zufall. Ohne den hätte die Geschichte des CD-Standards theoretisch ganz anders ausgehen können. Schon sehr früh hatte die britische BBC-Rundfunkanstalt eine Digital-Analog-Wandlung mit 13 Bit propagiert. Philips entwickelte bereits in den 70-er Jahren eine digitale Bildschallplatte, die aber erfolglos blieb. Die Geräte waren viel zu teuer, nur 400 Stück wurden verkauft, die Niederländer stellten die Produktion rasch wieder ein. Aber immerhin - das Know how aus diesem Bildplattenspieler floss bei Philips in einen Digital-Analogwandler mit 14 Bit für Audiozwecke ein. Auch diese Entwicklung hatte natürlich viel Geld verschlungen. Nun kam Sony als Partner für die CD-Einführung ins Spiel. Die Japaner empfahlen einen 16-Bit-Standard im Hinblick auf die Kompatibiltät mit der (sich damals abzeichnenden) Computer-Entwicklung. Nach vielen Versuchen und einigem Hin und Her einigten sich Philips und Sony schließlich auf den künftigen CD-Standard von 16 Bit und 44,1kHz.

Aber Philips hatte gar keinen fertigen 16-Bit-Wandler. Was tun? Die Markteinführung der CD-Technik verzögern? Niemand kennt die Hintergründe solcher Geschichten besser als die Leute, die damals beteiligt waren. Kees A. Schouhamer Immink war Mitentwickler dieses ersten CD-Spielers von Philips, dem CD 100. Die Entstehung des Oversamplings schilderte er in einem Bericht, hier aus dem Englischen übersetzt: "Wir bei Philips argumentierten, dass es unmöglich sei, in kurzer Zeit den fertigen 14-Bit-Wandler auf 16 Bit umzukonstruieren. Aber mein Kollege Karel Dijkmans meinte: Kein Problem, ich kenne einen kleinen Trick, um unseren 14-Bit-Konverter in einen mit 16 Bit zu verwandeln. Der Trick heißt Oversampling". Und tatsächlich ist die einzige technische Notwendigkeit des Oversamplings in den ersten Philips CD-Spielern das 16 Bit Digitalsignal für den 14 Bit Wandler umzurechnen. Das Marketing wird dann aus der Not die Tugend machen.

Sony besaß zu diesem Zeitpunkt bereits einen 16-Bit Wandler, wollte aber auch nicht auf das "Oversampling" der Niederländer als gut klingendes Verkaufsargument verzichten. Das führte kurioserweise dazu, dass Philips - obwohl es bei den Nachfolgermodellen bereits über einen echten 16-Bit Wandler, den TDA1541, verfügte - "Oversampling" seinerseits nicht mehr beerdigen konnte.

Entfernter Digitalfilter SAA7030      Entfernter Digitalfilter SAA7220

Bis heute schafften es nur wenige Chip-Hersteller, von dem damals in Gang gekommenen Bummelzug namens Oversampling wieder abzuspringen. Die Ingenieure beschäftigten sich eher damit, Fehler dieser Entwicklung durch neue zu relativieren. Sie erfanden fleißig Wandler mit größeren Datenfenstern von 24 Bit, um die größere Datenmenge incl. der Artefakte verarbeiten zu können. Je stärker die Baudichte in der weiteren Entwicklung der Chips wuchs, je mehr Funktionen implementiert wurden, desto mehr schwanden die Chancen, um die einmal eingeschlagene, falsche Richtung je wieder korrigieren zu können. Heutzutage gibt es kaum noch Wandlerchips, die auf eingebautes Oversampling und komplette Ausgangsstufen einfachster Machart verzichten. Diese Wandler ermöglichen es zwar, Millionen kleiner Handys und MP3-Spieler billigst zu produzieren. Vom Ideal naturgetreuer Wiedergabe entfernen sie sich zunehmend. Somit haben sie in einem hochwertigen Musik-Wiedergabegerät nichts zu suchen. Das Dilemma der Entwickler ist heute, dass sie nicht mehr auf andere Chips zurückgreifen können.


Datenformat 44.1khz/16 Bit einer Audio CD

Es ist spannend etwas Neues zu erschaffen. Manche Leute schnappen sich einen Lötkolben, andere starten eine Computer-Simulation. Jeder scheint sein eigenes Konzept zu besitzen. In meinem Fall beginnt es mit dem Zurückgehen zu den Grundlagen.

Als die Audio-CD am Musikhimmel aufging, dachte ich, dass Grundkonzept werde sich um das ursprüngliche 44.1kHz/16 Bit Datenformat drehen. Eine CD zu hören mit exakt den gleichen Daten, wie sie das Ton-Studio verlassen. Eine Erinnerung an diese verträumte Idee ist durchaus angemessen, digitale Wiedergabegeräte entfernen sich zunehmend von diesem Original. Jedes moderne High-Bit oder High-Sampling hat keine Daseinsberechtigung, weil es den Standard schlichtweg verfehlt.


Oversampling

Nach Prüfung der folgenden zwei Aspekte, kam ich zu dem Schluss, dass es problematisch ist, das Ursprungssignal durch Oversampling zu verändern.


1. Oversampling und Jitter

Es gibt zwei Achsen bei der Digitalisierung des Tons. Die Zeitachse und die Amplituden-Achse. Im Falle der CD betragen diese 44,1khz und 16 Bit. 16 Bit Genauigkeit bedeutet, wie genau sich die akustische Energie (Zeit x Amplitude), in jedem der 16 Bit-Schritte verteilt. Mit anderen Worten, wir packen in die Amplitude jedes der 16 Bit alle 22,7µsec. Daten. Daraus resultiert eine Fehlerrate von maximal +0,5 LSB. Diese Fehler betreffen aber nur die Amplituden-Achse, auf der Zeitachse sind keinerlei Fehler zugelassen. Je genauer die Amplituden-Daten sind, desto einfacher lassen sich Fehler auf der Zeitachse verteilen. Wenn wir die Hälfte (1/2) der Fehler verteilen ergibt sich (1 ÷ 44,1khz ÷ 2 hoch 16) ÷ 2 = 173psec. Das ist die Obergrenze der zulässigen Fehler, des Jitters.
Bild 1
aktzeptable Fehler bei 44.1khz/16Bit

Jitter 16-Bit
Bild 2
aktzeptable Fehler bei 8x Oversampling/20Bit

Jitter Oversampling 20-Bit

Bei 8x Oversampling und 20 Bit würde diese Fehlerrate 1.35psec. bedeuten. Das hört sich erstmal gut an, ist aber nicht von einem Analog Wandler zu erreichen, da dieser länger benötigt seine zeitliche Taktung mittels PPL zurück zusetzen. Daraus folgt, dass bei einem durchschnittlichen Jitter-Umfeld, Oversampling die Genauigkeit innerhalb des Arbeitsumfelds sogar sinken lässt. Kurz und einfach, durch Oversampling bleiben die ursprünglichen Daten mit 16 Bit Genauigkeit nicht erhalten.


2. Oversampling und High-Bit

Ursprünglich wurde Oversampling entwickelt, um die Verwendung eines analogen Filter mit sanfteren Eigenschaften zu ermöglichen. Ein weit verbreiteter Irrtum ist dessen Absicht zur Datenerhöhung - auch wenn dieses resultiert.
Überlagerung mehrerer Samples Bild 3
Das Prinzip der digitalen FIR Filter ist die ursprünglichen Daten zu verschieben und sie zu überlagern. Wenn diese Überlagerung durch Multiplikation der Koeffizienten auf die ursprünglichen Daten gelegt wird, wollen nun viel mehr Daten in das 16 Bit breite Datenfenster. Diese höhere Datendichte kann nur mit einem breiteren Fenster, also höheren Bit Rate als die 16 Bit der Quell-Daten, transportiert werden.

Zum Beispiel beim digitalen Filter SM5842 beträgt diese Datenfensterbreite 32 Bit. Der Digitalfilter rundet diese bei der Ausgabe auf 20 Bit ab und erzeugt bei der Re-Quantitisierung weitere Fehler. Solche Fehler können generell nur mit dem Beibehalten der ursprünglichen Datenfensterbreite von 16 Bit ausgeschlossen werden. Damit sind wir nicht in der Lage das höhere Datenvolumen, selbst wenn wir dieses beabsichtigt hätten, in der ursprünglichen Datenfensterbreite von 16 Bit zu transportieren. Ein 16 Bit ohne Oversampling ist immer genauer als ein Oversampling und High-Bit.

      Bild 4 - Fortsetzung des Bildrauschens
      Verlagerung zu höheren Frequenzen durch Oversampling

Was wird ohne Oversampling passieren? Theoretisch wird das Bildrauschen stufenlos zu höheren Frequenzen (Bild 4) wiederholt werden. Eine konventionelle Antwort hierauf wäre, das klingt nicht schön. Und, um das Bildrauschen zu entfernen sollten steilflankige Analogfilter mit anderen Nachteilen dem Analog Wandler folgen. Ist das so? Eine Herausforderung wäre nun auf das Shannon-Theorem über die Übertragung von Informationen einzugehen. Ich halte aber die Wahrnehmung von Informationen für wichtiger. Die Beschränkung unseres Hörsinns ist ein leistungsfähiger Tiefpass-Filter und das Shannon-Theorem kann sich getrost damit zufrieden geben. Über Theorien und Oszilloskope kann ich keinen guten Klang hören. Man kann denken, dass Frequenzen, die Menschen nicht hören, gefiltert werden müssten. Allerdings können auch 8x Oversampling Filter nur Frequenzen zwischen 22,05 kHz und 330kHz ausschneiden. Alles über 330kHz bleibt unberührt, es liegt also auch hier Hoffnung auf ein positives Ergebnis zu Grunde. Ich teile diese Hoffnung, es wird kein Problem sein. Ein Problem ist nur in den Begleiterscheinungen dieser Filter begründet.


Probleme des Digitalfilters

Bild 5 zeigt das Prinzip der FIR Digitalfilter. Das "T" steht für eine Verzögerung bei jedem Abtastintervall, "a" ist für den Koeffizientenmultiplizierer und "+" ist der Addierer. Nach Verzögerung der Eingabedaten und multiplizierung mit dem Koeffizienten wird dieser Prozess "n" mal wiederholt. Wobei "n" die Anzahl der Wege ist. Je mehr Wege der Filter hat, desto höher soll seine Leistung sein. Die Verzögerung ist keine Berechnung der Zeit, sondern eher die Wartezeit der Daten.
Bild 5

Arbeitsprinzip der Digitalfilter
T: Delay Schaltung für jedes Abtastintervall
a: Koeffizientenmultiplizierers
+: Addierer
Bild 6
Physikalische Auswirkung der Digitalfilter
Akustische Wirkung

Es ist gar nicht leicht dieses Diagramm instinktiv zu verstehen. Der Vorgang wird an Bild 6 etwas deutlicher. Die Verzögerungs wirkt wie eine Zeitversetzung des Schalls. Die kumulierte Verzögerung für jeden Weg beträgt 1,92msec, 0,16msec und 0,05 msec. Insgesamt sind es 2,13msec. Unser Hörsinn kann alle 2msec eine Frequenzanalyse durchführen. Eine Verzögerung von 2,13msec kann unser Ohr wahrnehmen.

Der wahrnehmbare Abstand zwischen dem vorderen und hinteren Lautsprechern entspricht akustisch 73,3cm. Können sie sich nun vorstellen welche Art von Musik so erzeugt wird? Alle Töne aus den Lautsprechern werden sich zeitversetzt zu einem kleinen Echo versammeln.
Sinnfreie Anordnung der Mikrofone Bild 7 zeigt die sinngemäße Anordnung der Aufnahmemikrofone. Wenn Sie immer fühlten, dass bei einer digitalen Aufnahme etwas Kern im Ton fehlte, überprüfen Sie bitte diese Darstellung aufmerksam. So Aufzunehmen und alles zu vermischen macht keinen Sinn. Genau so unsinnig ist aber die Aufnahme mit nur einem Mikrofon bei Verwendung eines digitalen Filters. Ein digitaler Filter machte auch theoretisch nur Sinn, wenn seine Verzögerung deutlich weniger als die wahrnehmbaren 2msec betrüge.


Wie klingt Non-Oversampling

Wir können eine zeitliche Verzögerung nur mit Digitalfiltern mindern, die mit einer kleineren Anzahl von Wegen produziert sind. Unter diesem Aspekt ist die Betrachtung eines Wadia-Dekodierer Computer (13 Wege) oder Luxman DA-07 (3 Wege) interessant. Beide erhielten (Wadia auch heute noch) hervorragende Beurteilungen für ihre sinnliche Darstellung des Klanges. Der Non-Oversampling Analog Wandler ist eine Korrekturentwicklung, dessen Leistung an die Originalgetreue nicht überschritten werden kann. Der Unterschied zwischen Non-Oversampling und einem herkömmlichen Analog Wandler mit Digitalfilter, liegt in der Bemessung der Genauigkeit im Zeit- und Frequenzbereich. Mit anderen Worten, ob Sie die musikalische Leistung und Qualität eines Klanges wünschen. Ein natürlicher stressfreier Klang, mit dem Eindruck dass der Musiker direkt zu Ihnen kommuniziert. Das ist der Klang von Non-Oversampling, einfach viel näher an der analogen Wirklichkeit.


196khz / 24 Bit

Ein direkter Zusammenhang zwischen Messungen und gutem Klang kann nicht gefunden werden. Sie können guten Klang nicht durch konkurrierende Zahlen über den Klirrfaktor oder Erweiterung des Frequenzbereichs ausfindig machen. Bei digitalen Wiedergabegeräten finden sie heute Argumente wie Quantisierung der Bit-Zahlen und Sampling-Frequenz Anpreisungen. Es bedeutet nur Senkung von Herstellungskosten und Entfernen von der ursprünglichen Musik-Aufnahme. Die Erfindung der CD war ein epochales Ereignis. Es liefert den Ton des Master-Bands direkt in unseren eigenen Hörraum. Es war die Kristallisation der Bemühungen der Ingenieure der damaligen Zeit. Im Vergleich dazu bietet die neue Generation digitaler Wiedergabegeräte nur die Erhöhung der Datenrate. Die Lebensdauer dieser Formate wird von kurzer Dauer sein. Was wir brauchen, ist ein genaues Verständnis um die Vor- und Nachteile dieser Formate um Neue zu entwickeln - welche die unserem Hörsinn entsprechen.

Ryohei Kusunoki, MJ Magazine (Zusammengefasst u. Übersetzt. AS.)