Der Wolf in der MusikWolfsquinte, Kommas und andere Temperaturprobleme
Begriffe wie Wolfsquinte, syntonisches Komma, Diësis usw. sind fast allen Musikern geläufig. Es handelt sich hierbei um Intervalle, die bei den unterschiedlichen historischen Stimmungen bzw. Temperaturen vornehmlich – doch nicht ausschließlich – der Tasteninstrumente auftreten.
Einerseits ergeben sich diese Intervalle gemäß physikalischer Gesetzmäßigkeiten unweigerlich, auf der anderen Seite sind sie musikalisch unselbständig, bereiten gar große Probleme und zwingen zum Kompromiss. Gleichwohl beschränken sich die resultierenden Schwierigkeit nicht auf die historisch informierte Aufführungspraxis; auch bei der heute für moderne Tasteninstrumente gebräuchlichen gleichstufigen Temperatur existiert ein beachtenswertes „Temperaturproblem“; denn hier ist jedes Intervall mit Ausnahme der Oktave unrein.
So ist nahezu jeder ausführende Musiker – bewusst oder unbewusst – mit diesen Temperaturproblemen konfrontiert. Allein die mathematische Herausforderung schreckt meist ab, sich intensiver mit dem Gegenstand auseinanderzusetzen.
Im Folgenden sollen die grundlegenden Temperaturprobleme wie die hiermit verbundenen besonderen Intervalle zunächst prinzipiell erläutert und erst anschließend mit einigen mathematischen Berechnungen konkretisiert werden.
Hierbei wird versucht werden, jeden erforderlichen Rechenschritt als auch die Ausführung mit dem Taschenrechner aufzuzeigen, da dies nicht zum „täglichen Brot“1 des Musikers gehört. Ziel ist nicht die systematische Darstellung sämtlicher historischer Temperaturen und der hieraus jeweils resultierenden Diskrepanzen zu einer reinen Stimmung. Vielmehr soll der Leser ein Gefühl für die grundlegenden Problematik beim Temperieren von Tasteninstrumenten bekommen, die sich in der Folge leicht auf alle historischen Temperaturen übertragen lassen. Schließlich soll deutlich werden, dass eine reine Temperatur auch für das abendländische zwölfstufige diastematische Tonsystem aufgrund sich gegenseitig ausschließender, physikalisch jedoch feststehender Parameter überhaupt nicht existieren kann.
Wolfsquinte
Bei der Wolfsquinte handelt es sich um eins der – zumindest namentlich – bekanntesten Probleme verschiedener historischer Temperaturen. Besonders leicht verständlich ist die Ableitung der pythagoreischen Wolfsquinte, da die ihr zugrunde liegende pythagoreische Stimmung2, die auf Pythagoras von Samos (6. Jh. vor Christus) zurückzuführen sein soll, sehr leicht erklärbar ist, da sie mit nur einem sich wiederholendem reinen3 Intervall arbeitet, und zwar der reinen Quinte. Schichtet man 12 reine Quinten übereinander, erreicht man mutmaßlich die 7. Oberoktave des Ausgangstons, z. B. 1C – c5. Dies würde bedeuten, dass das reine Quintintervall multipliziert mit 12 zum gleichen Zielton führt wie die reine Oktave multipliziert mit 7. Dem ist jedoch nicht so. Bevor dies mathematisch erläutert werden soll, ist es hilfreich, sich zu vergegenwärtigen, dass die Schichtung von 12 Quinten – auch musiktheoretisch – nicht zum mehrfach oktavierten Ausgangspunkt zurückfindet: 1C – 1G – D – A – e – h – fis1 – cis2 – gis2 – dis3 – ais3 – eis4– his4(!).
Dass ein his4 im entsprechenden musikalischen Kontext anders intoniert wird als ein c5 und ihm in der tonalen Musik eine andere Funktion zukommt, ist bekannt und mit anderen als den Tasteninstrumenten leicht realisierbar. Bei den Tasteninstrumenten hingegen wird den Tönen his und c die gleiche Taste zugewiesen4. Das Bild des sich schließenden und zum Ausgangspunkt zurückführenden Quintenzirkels ist somit irreführend. Sinnvoll ist es, von Quintenstrahl zu sprechen (auch die häufig bemühten Begriffe Quintenspirale oder Quintenturm sind irreführend), der zu beiden Seiten hin offen ist und somit Wiederholungen vermeidet.
Nicht nur musiktheoretisch, sondern auch mathematisch gelangt man hier deutlich über das Ziel hinaus: Das erreichte his4 liegt um einen mathematisch berechenbaren Cent-Wert (dies ist die Maßeinheit, mit der Intervalle angegeben werden, siehe unten) höher. Dies ist umso erstaunlicher, da das höher klingende his4 in den gebräuchlichen diastematischen Notationsformen unter dem tiefer klingenden c5 notiert wird. Die Differenz zwischen zwischen diesen beiden Tönen nennt man pythagoreisches Komma.
Nun müssen wir uns bewusst machen, dass das Intervall der Oktave als elementares Intervall immer rein gestimmt ist. War 1C Ausgangston unserer Überlegungen, müssen in der Folge alle C-Tasten unseres Tasteninstruments korrekt gestimmt. Da Tasteninstrumente jedoch keine speziellen Tasten für den Ton his besitzen, in es vonnöten, den his-Ton zu korrigieren. Folglich wird die letzte der 12 Quinten, hier also das Intervall eis4 – his4, etwas verkleinert, und zwar genau um den Wert des pythagoreischen Kommas. Die resultierende Quinte ist nun nicht mehr rein, sondern deutlich wahrnehmbar dissonant, und da sie „wie ein Wolf heult“, wurde ihr der Name Wolfsquinte gegeben.
Angemerkt sei bereits an dieser Stelle, dass sich ähnlich gelagerte Probleme auch mit anderen Stimmintervallen ergeben. Sehr deutlich wird dies – zunächst rein musiktheoretisch – bei Intervallen, die bereits nach wenigen Schichtungen mutmaßlich zum einfach oktavierten Ausgangston gelangen. Beispiele: große Terz (c – e – gis – his), kleine Terz (c – es – ges – heses – deses1), übermäßige Quarte (c – fis – his). Nahezu absurd wird dies bei der chromatischen Tonleiter (gemeint ist hier die Tonleiter, die ausschließlich aus chromatischen Halbtönen5, also übermäßigen Primen, besteht): c – cis – cisis – cisisis – cisisisis – cisisisisis – cisisisisisis – cisisisisisisis – cisisisisisisisis – cisisisisisisisisis – cisisisisisisisisisis – cisisisisisisisisisisis – cisisisisisisisisisisisis!
Intervalle als Frequenzverhältnisse
Frequenz in Hz | 66 | 132 | 198 | 264 | 330 | 396 | 462 | 528 | 594 | 660 | 726 | 792 | 858 | 924 | 990 | 1056 |
Note | ||||||||||||||||
Naturtonnummer | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
Verhältnis zum Ton darunter | 1:1 | 2:1 | 3:2 | 4:3 | 5:4 | 6:5 | 7:6 | 8:7 | 9:8 | 10:9 | 11:10 | 12:11 | 13:12 | 14:13 | 15:14 | 16:15 |
Intervall zum Ton darunter | Prime | Okt. | Quinte | Quarte | gr. Terz | kl. Terz | – | – | gr. Ganzt. | kl. Ganzt. | – | – | – | – | – | diat. Halbt. |
Verhältnis zum Grundton | 1:1 | 2:1 | 3:1 | 4:1 | 5:1 | 6:1 | 7:1 | 8:1 | 9:1 | 10:1 | 11:1 | 12:1 | 13:1 | 14:1 | 15:1 | 16:1 |
Intervall über Grundton | Prime | Okt. | Duodez. | 2 Okt. | 2 Okt. + gr. Terz | 2 Okt. + Quinte | 2 Okt. + Natursept. | 3 Okt. | 3 Okt. + gr. Sek. | 3 Okt. + gr. Terz | 3 Okt. + Alphorn-Fa | 3 Okt. + Quinte | 3 Okt. + ≈ kl. Sexte | 3 Okt. + Natursept. | 3 Okt. + gr. Sept. | 4 Okt. |
Obertonnummer | – | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
Man stelle sich ein Monochord vor, eine einzelne über einem Resonanzkörper gespannte Saite mit der Grundstimmung C. Halbiert man nun die Saite mit dem Finger und zupft eine der beiden Hälften an, schwingt nur diese eine Saitenhälfte bzw. Teilsaite. Resultat ist ein Ton, der eine Oktave über dem Grundton, also der leeren Saite, liegt: c. Der Oktave wird deshalb das Frequenzverhältnis 2:1 zugewiesen; denn die Länge der Teilsaite (\(\frac{1}{2}\)) und das Schwingungsverhältnis (2:1) verhalten sich reziprok (umgekehrt proportional) zueinander. Einige weitere Beispiele: Drittelt man die Saite ergeben sich zwei unterschiedlich lange Teilsaiten, eine mit der Länge eines Drittels der Ursprungssaite und eine mit einer Zwei-Drittel-Länge. Die längere Teilsaite (\(\frac{2}{3}\)) besitzt ein Frequenzverhältnis von 3:2 und entspricht der reinen Quinte. Es erklingt also ein G. Die kürzere Teilseite besitzt das Schwingungsverhältnis von 3:1, was der Duodetime g über dem Grundton C entspricht. Bei einem Teilungsverhältnis von 4:3 erklingt die reine Quarte F, die kürzere Teilseite mit dem Verhältnis 4:1 klingt als Doppeloktave über dem Grundton, also c1 (siehe oben stehende Tabelle).
Bei den jeweils kürzeren Teilsaiten handelt es sich folglich nicht, wie vielleicht vermutet werden kann, jeweils um das Komplementärintervall zu dem Tonresultat der längeren Teilsaite; denn dann müsste die kurze Teilsaite bei der Dreiteilung eine Quarte ergeben (Komplementärintervall der Quinte), die kurze Teilsaite bei Quartteilung wiederum die Quinte. Dies kann jedoch nicht der Fall sein, da 3:1 \(\neq\) 4:3 und 4:1 \(\neq\) 3:2. Vielmehr handelt es sich um Intervalle mit niedrigen Schwingungsverhältnissen (siehe Tabelle „Frequenzverhältnisse“) zuzüglich einer oder mehrerer Oktaven. Das Intervall mit dem Frequenzverhältnis 3:1 ist die Oktave plus Quinte (Duodezime), da \(\frac{2}{1}\) (Oktave) × \(\frac{3}{2}\) (Quinte) = \(\frac{6}{2}\) = \(\frac{3}{1}\). Das Frequenzverhältnis 4:1 steht für die Doppeloktave; denn \(\frac{2}{1}\) × \(\frac{2}{1}\) = \(\frac{4}{1}\).
Ferner ist zu beachten, dass neben der Saitenlänge auch deren Durchmesser, die Spannung und das Gewicht pro Längeneinheit eine Rolle für die Tonhöhe spielen.
Dies erklärt, warum Saiten ähnlicher Länge (z.B. bei der Gitarre) Töne sehr unterschiedlicher Höhe erzeugen.
Aus einfachen Teilungsverhältnissen resultieren Konsonanzen. Mit komplexer werdenden Teilungsverhältnissen nimmt die Reinheit der Intervalle permanent ab, bis sie in die Dissonanzen übergehen. Die Wolfsquinte hat, wie wir sehen werden, ein Teilungsverhältnis von 262144:177147, ein Wert, dem man den überaus dissonanten Charakter leicht ablesen kann.
Prime | 1:1 | ||||||||||||
Chromatischer/kleiner Halbton | 135:128 | ||||||||||||
Diatonischer/großer Halbton | 16:15 | ||||||||||||
Gleichstufiger Halbton | $\sqrt[12]{\frac{2}{1}}$ | ||||||||||||
Großer Ganzton | 9:8 | ||||||||||||
Kleiner Ganzton | 10:9 | ||||||||||||
Mitteltöniger Ganzton | $\sqrt[2]{\frac{5}{4}}$ | ||||||||||||
Kleine Terz | 6:5 | ||||||||||||
Große Terz | 5:4 | ||||||||||||
Ditonos (pythagoreische große Terz) | 81:64 | ||||||||||||
Quarte | 4:3 | ||||||||||||
Tritonus/verminderte Quinte/Halboktave | |||||||||||||
| |||||||||||||
Reine Quinte | 3:2 | ||||||||||||
Mitteltönige Quinte | $\sqrt[4]{5}$ | ||||||||||||
Kleine Sexte | 8:5 | ||||||||||||
Große Sexte | 5:3 | ||||||||||||
Kleine Septime | 16:9 | ||||||||||||
Große Septime | 15:8 | ||||||||||||
Oktave | 2:1 |
Intervalle lassen sich in unterschiedliche Gruppen einteilen. Gruppe I, perfekte Konsonanzen, umfasst die Intervalle Prime, Oktave, Quinte und Quarte.
Mathematisch ist den hier versammelten Intervallen gemein, dass sich ihr Teilungsverhältnis zu Brüchen mit dem gemeinsamen Nenner 12 erweitern lässt: Prime \(\frac{12}{12}\), Oktave \(\frac{6}{12}\), Quinte \(\frac{8}{12}\), Quarte \(\frac{9}{12}\). Die Gruppen IIa (Terzen) und IIb (Sexten) repräsentieren die imperfekten Konsonanzen. Der Grund, warum an dieser Stelle zwischen Terzen und Sexten unterschieden wird, ist, dass die Terzen wie die perfekten Konsonanzen ein Frequenzverhältnis von „n:n-1“ aufweisen, die Sexten jedoch nicht mehr, womit letztere quasi das Bindeglied zwischen Kon- und Dissonanzen darstellen. Auch in der Alten Musik kommt den Sexten eine Sonderstellung zu: Zum einen wird von den vier möglichen Melodieintervallen mit Sexten (große und kleine Sexte jeweils auf- und abwärts) in der Renaissance die kleine Sexte aufwärts als einziges Melodieintervall zugelassen, zum anderen sind Sexten nicht schlussfähig.
Gruppe III umfasst die Dissonanzen mit komplexeren Teilungsverhältnis.
Grundlegende mathematische Operationen mit Teilungsverhältnissen
Addition von Intervallen
Intervalle werden addiert, indem man das Produkt der Teilungsverhältnisse ermittelt. Um also das Teilungsverhältnis des Intervalls zu erhalten, das sich aus Quarte und großer Terz zusammensetzt, lautet die Berechnung:
\[\frac{4}{3} \times \frac{5}{4} = \frac{20}{12} = \frac{5}{3}\]
Tatsächlich entspricht das Ergebnis dem Teilungsverhältnis der großen Sexte.
Berechnung der Differenz zweier Intervalle
Die Differenz zweier Intervalle wird durch Division ihrer Teilungsverhältnisse berechnet. Ziehen wir beispielsweise die Quarte von der großen Sexte ab, muss sich wieder das Teilungsverhältnis der großen Terz ergeben:
\[\frac{\frac{5}{3}}{\frac{4}{3}} = \frac{5}{3} \times \frac{3}{4} = \frac{15}{12} = \frac{5}{4}\]
Unterteilung eines Intervalls in n gleich große Teile
Hierzu ist die n. Wurzel eines intervallischen Teilungsverhältnisses zu ermitteln:
\[\sqrt[12]{\frac{2}{1}}\]
Diese Operation teilt die Oktave in zwölf identisch große Intervalle.
Rechenbeispiel mit Quinten und Oktaven
Es ist erwähnt worden, dass die Schichtung von zwölf reinen Quinten einen anderen Zielton als die Schichtung von sieben Oktaven, ausgehend vom gleichen Ton, erreicht.
Bevor wir den genauen Wert (in Cent) berechnen, lohnt es, die Teilungsverhältnisse dieser beiden sehr großen Intervalle zu vergleichen.
Sieben Oktaven:
\[\left(\frac{2}{1}\right)^7 = \frac{128}{1}\]
Zwölf Quinten:
\[\left(\frac{3}{2}\right)^{12} = \frac{531441}{4096} \approx 129,74\]
Es ist leicht ersichtlich, dass das aus zwölf Quinten zusammengesetzt Intervall das größere ist.
Umrechnung der Frequenzverhältnisse in Cent-Werte
Bei der bei Tasteninstrumenten heutzutage gebräuchlichen gleichstufigen Stimmung wird das Problem der Wolfsquinte derart umgangen, dass nicht eine Quinte massiv, sondern sämtliche 12 Quinten minimal verstimmt sind. Diese „Quinttrübung“ fällt dem an diese Stimmung gewöhnten Ohr kaum mehr auf, und die Schichtung von 12 gleichstufigen Quinten erreicht tatsächlich den siebenfach oktavierten Ausgangston. Somit erklingen mit Ausnahme der Oktave auch alle übrigen Intervalle leicht verstimmt.
Für musikalische Intervalle wurde die logarithmische Maßeinheit Cent eingeführt und der gleichstufigen (nicht reinen!) kleinen Sekunde der Wert 100 Cent zugewiesen. Folglich besitzt die gleichstufige Quinte einen Wert von 700 Cent, da nach Schichtung von sieben gleich großen gleichstufigen kleinen Sekunden die gleichstufige Quinte erreicht wird. Analog besitzt die gleichstufige Oktave den Wert von 1200 Cent. Wiederholt sei, dass nur die Oktave rein gestimmt ist, die übrigen Intervalle trotz der einfachen Cent-Werte (Vielfache von 100) nicht.
Komplizierter wird es nun, möchte man den Cent-Wert für die übrigen reinen Intervalle berechnen. Wenn wir das bekannte Frequenzverhältnis eines Intervalls als Bruch \(\frac{f^1}{f^2}\) darstellen und den Cent-Wert i berechnen möchten, ergibt sich folgende mathematische Formel:
\[\log_2 \frac{f^1}{f^2}\times 1200 \text{ Cent} = i\]
Beispiel: Berechnung der Cent-Werts der reinen Quinte (3:2):
\[\log_2 \frac{3}{2}\times 1200 \approx 701,955 \text{ Cent}\]
Die Rechenoperation ist mit einem wissenschaftlichen Taschenrechner denkbar einfach auszuführen: 3/2 =; dann die log-Taste drücken; geteilt durch 2 eingeben und erneut log drücken. Abschließend mit 1200 multiplizieren:
3 : 2 = log : 2 log × 1200 =Das Ergebnis lautet i ≈ 701,955. Die ist der Cent-Wert des reinen Quintintervalls. Subtrahiert man hiervon den Wert der gleichstufigen Quinte, also 700 Cent, erhält man den Wert, um den jede gleichstufige Quinte verstimmt ist, nämlich ≈ 1,955 Cent.
Für die praxisorientierte Nutzung lässt sich die Rechenoperation wie folgt vereinfachen: Definieren wir \(\frac{f^1}{f^2} = q\), so lautet unsere Formel
\[\log_2(q) \times 1200\]
, was sich – leicht verkomplizierend – auch als
\[\frac{\log(q)}{\log(2)}\times 1200\]
ausdrücken lässt. Eine weitere Termumformung lässt erkennen, dass wir es in der Tat mit einer Konstanten zu tun haben:
\[\frac{1200}{\log(2)}\times \log(q)\]
\[\frac{1200}{\log(2)}\] entspricht dem determinierten Wert von ≈ 3986,313714, so dass in der Praxis schlicht wie folgt gerechnet wir
3986, 313714 × log(q). Die einfache Rechenoperation für den Cent-Wert der von uns gesuchten Quinte lautet somit:
3986,313714 × 1,5 log =Nun zurück zur Wolfsquinte: Addiert man 12 reine Quinten, ergibt sich ein ungefährer Wert von 8423,46 Cent (12 × 701,955). Dies ist also der Cent-Wert für das Intervall 1C – his4. Das Intervall 1C – c5 (sieben Oktaven übereinander) hat jedoch einen Wert von (genau) 8400 Cent, da die reine Oktave der gleichstufigen entspricht.
Die Differenz von ≈ 23,46 Cent ist das pythagoreische Komma. Die Wolfsquinte errechnet sich aus dem Cent-Wert der reinen Quinte minus dem des pythagoreischen Kommas, also 701,955 − 23,46 = 678,495 (alle Werte sind Näherungswerte).
Die mathematisch elegante Berechnung für das pythagoreische Komma lautet:
\[\frac{\left(\frac{3}{2}\right)^{12}}{\left(\frac{2}{1}\right)^7} = \frac{3^{12}}{2^{12} \times 2^7} = \frac{3^{12}}{2^{19}} = \frac{531441}{524288}\]
\[\log_2 \frac{531441}{524288}\times 1200 \approx 23,46 \text{ Cent}\]
und für die Wolfsquinte:
\[\frac{\left(\frac{2}{1}\right)^7}{\left(\frac{3}{2}\right)^{11}} = \frac{2^7 \times 2^{11}}{3^{11}} = \frac{2^{18}}{3^{11}} = \frac{262144}{177147}\]
\[\log_2 \frac{262144}{177147}\times 1200 \approx 678,495 \text{ Cent}\]
Die Wolfsquinte ist also ca. 23,46 Cent kleiner als die reine Quinte. Dieses pythagoreische Komma, also die Differenz beider Quinten, entspricht fast einem reinen Fünftelton bzw. einem gleichstufigen Viertelton!
Ein Rechenbeispiel für die reine große Terz:
\[\log_2 \frac{5}{4}\times 1200 \approx 386,314 \text{ Cent}\]
Hingegen hat die gleichstufige große Terz einen Wert von 400 Cent. Die Differenz beträgt hier rund 14 Cent! Dies ist der Wert, um den jede große Terz bei moderner gleichstufiger Klaviertemperatur im Verhältnis zur reinen großen Terz verstimmt ist.
Weitere besondere, musikalisch „unselbständige“ Intervalle
Kleine Diësis/Enharmonisches Komma
Die kleine Diësis meint die Differenz zwischen drei reinen großen Terzen und der reinen Oktave. Die große Terz hat das Frequenzverhältnis 5:4. Folglich lautet die bekannte Rechenoperation:
\[\frac{\frac{2}{1}}{\left(\frac{5}{4}\right)^{3}} = \frac{2 \times 4^{3}}{5^{3}} = \frac{128}{125}\]
\[\log_2 \frac{128}{125}\times 1200 \approx 41,059 \text{ Cent}\]
Zum besseren Verständnis ließe sich die Rechnung auch wie folgt durchführen:
\[1200 - (3 \times (\log_2 \frac{5}{4} \times 1200)) \approx 41,059 \text{ Cent}\]
Dieser Wert entspricht der verminderten Sekunde (z. B. his – c1) – eine dreifache Großterzschichtung über c hat his als Ziel –, daher auch der synonyme Terminus enharmonisches Komma.
Große Diësis
Die große Diësis ist die Differenz von reiner Oktave und der Schichtung vierer reiner kleiner Terzen:
\[\frac{\left(\frac{6}{5}\right)^4}{2} = \frac{6^{4}}{2 \times 5^4} = \frac{1296}{1250}\]
\[\log_2 \frac{1296}{1250}\times 1200 \approx 62,565 \text{ Cent}\]
Pythagoreische Terz
Bei der pythagoreischen Terz handelt es sich um ein Intervall, das als Differenz zur reinen großen Terz zu verstehen ist: Die Schichtung vierer reiner Quinten erreicht die zwei Oktaven über dem Ausgangston liegende große Terz (z. B. von c bis e2). Bei dieser aus Schichtung vierer reiner Quinten abgeleiteten Terz handelt es sich nicht um die reine große Terz (5:4), sondern um die sogenannte pythagoreische, deren Wert im Folgenden berechnet werden soll:
\[\frac{\left(\frac{3}{2}\right)^4}{\left(\frac{2}{1}\right)^2} = \frac{3^4}{2^6} = \frac{81}{64}\]
(Frequenzverhältnis der pythagoreischen Terz)
\[\log_2 \frac{81}{64}\times 1200 \approx 407,820\]
(Cent-Wert der pythagoreischen Terz)
Syntonisches Komma
Die Differenz der pythagoreischen Terz zur reinen großen Terz nennt sich syntonisches bzw. didymisches Komma:
\[\frac{\frac{81}{64}}{\frac{5}{4}} = \frac{81}{64} \times \frac{4}{5} = \frac{324}{320} = \frac{81}{80}\]
(Frequenzverhältnis des syntonischen Kommas)
\[\log_2 \frac{81}{80}\times 1200 \approx 21,506\]
(Cent-Wert des syntonischen Kommas)
Bekannte Temperaturen
Obwohl die Frequenzverhältnisse und folglich die reinen Intervalle gemäß physikalischer Gesetze vorgegeben sind, schließen sich die reinen Intervalle gegenseitig aus. Sämtliche Temperaturprobleme führen auf diese Diskrepanz zurück, und folglich sind sämtliche der zahlreichen historischen Temperaturen, wie auch die moderne gleichstufige, Kompromissstimmungen. Dieser Sachverhalt soll an einigen der bekanntesten Temperaturen verdeutlicht werden. Nun ist es nicht möglich, jede der aufgeführten historischen Stimmungen abschließend zu behandeln; aber die grundlegenden Probleme können deutlich werden, und wir erkennen, dass uns die behandelten besonderen Intervalle auch hier begegnen.
Reine Stimmung
Der Terminus suggeriert eine existente „voll-reine“ Stimmung (auch bei Tasteninstrumenten), und tatsächlich werden hier neben Oktaven und Quinten auch die großen Terzen rein gestimmt; dennoch existieren auch bei dieser Temperatur vielfache Probleme, da sich wiederum die rein gestimmten Intervalle gegenseitig ausschließen, wie einige Beispiele verdeutlichen mögen:
Zunächst ist zu zeigen, dass eine Schichtung dreier großer Terzen keine reine Oktave ergibt:
\[\left ( \frac{5}{4} \right ) ^3 = \frac{125}{64} = 1,953125\]
Entspräche diese Großterzschichtung in ihrer Summe der Oktave, müsste sich der Wert „2“ ergeben.
Auch beim Vergleich der reinen großen Terz mit der reinen Quinte (wie erwähnt sind große Terzen und Quinten rein gestimmt) ergeben sich vergleichbare Verhältnisse: Vier übereinander geschichtete Quinten ergeben mutmaßlich eine große Terz + zwei Oktaven. Dass dem nicht so ist, zeigt folgende Berechnung:
\[\left ( \frac{3}{2} \right ) ^4 = \frac{81}{16} = 5,0625\]
, während
\[\left (\frac{2}{1} \right ) ^2 \times \frac{5}{4} = \frac{2^2 \times 5}{4} = \frac{20}{4} = 5\]
Die „übergroße Terz“, also vier Quinten weniger zwei Oktaven, ermittelt sich nun durch folgende Operation:
\[\frac{\frac{81}{16}}{\left(\frac{2}{1}\right)^2} = \frac{81}{16} \times \left ( \frac{1}{2} \right) ^2 = \frac{81}{64}\]
Das Intervall mit dem Teilungsverhältnis 81:64 heißt Ditonus.
Der minimale Unterschied zwischen Ditonus und reiner großer Terz errechnet sich wie folgt:
\[\frac{\frac{81}{64}}{\frac{5}{4}} = \frac{81}{64} \times \frac{4}{5} = \frac{324}{300} = \frac{81}{80}\]
Wie bereits bekannt, ist dies das Teilungsverhältnis des syntonischen Kommas.
Dass eine zwölffache Quintschichtung nicht den mehrfach oktavierten Ausgangstons ergibt, ist ebenfalls bereits gezeigt worden:
\[\left(\frac{2}{1}\right)^7 = 128\]
, aber
\[\left(\frac{3}{2}\right)^{12} \approx 129,7463\]
Neu zu beachten ist, dass die große Terz (5:4) nicht aus zwei gleichen, nämlich zwei großen oder kleinen Ganztönen zusammengesetzt ist:
\[\frac{9}{8} \times \frac{9}{8} = \frac{81}{64}\]
(hier ergibt sich erneut der Ditonus, und somit lässt sich auch die Herkunft seines Namens ableiten) bzw.
\[\frac{10}{9} \times \frac{10}{9} = \frac{100}{81}\]
, sondern aus großem (9:8) und kleinem (10:9) Ganzton:
\[\frac{9}{8} \times \frac{9}{8} = \frac{81}{64}\]
(hier ergibt sich erneut der Ditonus, und somit lässt sich auch die Herkunft seines Namens ableiten), sondern aus großem (9:8) und kleinem (10:9) Ganzton:
\[\frac{8}{9} \times \frac{10}{9} = \frac{90}{72} = \frac{5}{4}\]
Beleuchten wird nun die Differenz zwischen den zwei unterschiedlichen Ganztönen:
\[\frac{\left(\frac{9}{8}\right)}{\left(\frac{10}{9}\right)} = \frac{9}{8} \times \frac{9}{10} = \frac{81}{80}\]
Erneut ergibt sich das syntonische Komma.
In jeder Tonart sind große und kleine Ganztöne an unterschiedlichen Positionen anzusiedeln. Dies erklärt sich leicht an der gezeigten Obertonreihe auf C: Während der Schritt von c2 zu d2 ein großer Ganzton ist, handelt es sich bei der weiteren schrittweisen Fortschreitung von d2 zu e2 um einen kleinen. Dieses Prinzip gilt analog für weitere Naturtonreihen. In der Paralleltonart a-Moll sind die Verhältnisse vertauscht: Hier ist der Schritt von c2 zu d2 ein kleiner Ganztonschritt, der Folgeschritt zu e2 ein großer Ganztonschritt. Je weiter sich ein musikalisches Werk von der Haupttonart fortbewegt, desto unreiner werden die Dreiklänge. Dies hat also zwei Gründe: Zum einen werden bei Modulation in entferntere Tonarten nicht diatonische Töne (in Bezug auf die Ausgangstonart) nötig, zum anderen werden einzelne große oder kleine Ganztöne in ihr großes bzw. kleines Pendant verkehrt.
An diesem Beispiel zeigt sich bereits, dass selbst die nahestmöglich verwandten Tonarten C-Dur und deren Paralleltonart natürliches a-Moll unterschiedlich gestimmt werden müssen, obwohl der gesamte Tonvorrat identisch ist – es sind dies die weißen Tasten des Klaviers. Je weiter ein Musikwerk sich nun von der Haupttonart fortbewegt, desto mehr Töne sind gegen die diatonischen Töne der Ausgangstonart verstimmt.
Mitteltönige Stimmung
Der Begriff mitteltönige Stimmung ist ein Sammelbegriff unterschiedlicher, aber vergleichbarer Stimmungen. In ihrer häufigsten Form sind, ähnlich wie bei der reinen Stimmung, die großen Terzen rein gestimmt. Zwei grundlegende Unterschiede zur reinen Stimmung lassen sich aber feststellen:
Zum einen wird die große Terz aus zwei identischen großen Sekunden zusammengesetzt. Von diesem Sachverhalt leitet sich auch der Begriff mitteltönig ab. Da wie gezeigt weder zwei große noch zwei kleine Ganztöne die große Terz ergeben, ist hierfür ein Frequenzverhältnis zu ermitteln, dass sich nicht nicht aus der Naturtonreihe ableiten lässt. Diese „künstlichen“ Arten von Frequenzverhältnissen werden irrational genannt.
\[\sqrt[2]{\frac{5}{4}}\]
Die Quadratwurzel teilt schlicht das Großterzintervall (5:4) in zwei identisch große Teile.
Ferner besteht der Unterschied darin, dass die Quinten zu klein, also unrein temperiert werden.
Wie oben gesehen entspricht die Schichtung von vier Quinten nicht der großen Terz zuzüglich zwei Oktaven. Zieht man die zwei Oktaven von dem Zielton der Quintschichtung wieder ab, ergibt sich der Unterschied eines syntonisches Kommas. Die mitteltönige Stimmung umgeht diesen Konflikt, indem die vier Quinten je genau um \(\frac{1}{4}\) eines syntonischen Kommas verengt werden.
\[\frac{\frac{3}{2}}{\sqrt[4]{\frac{81}{80}}} = \frac{3}{2} \times \sqrt[4]{\frac{80}{81}} = \sqrt[4]{5} \approx 1,49535\]
Der Wert 1,49535 entspricht der mitteltönigen Quinte, während die reine Quinte einen Wert von 1,5 aufweist (3:2).
Dies wird nun auf alle großen Terzen und Quinten übertragen, und folglich werden bei der mitteltönigen Temperatur sämtliche Quinten um diesen Wert zu klein gestimmt.
Wohltemperierte Stimmung
In den Jahren 1681 und 1691 stellte Andreas Werckmeister unterschiedliche wohltemperierte Stimmungen vor, die heute als Werckmeister-Stimmungen III–VI bekannt sind. Besonders Werckmeister III fand Verbreitung und ersetzte, vornehmlich zusammen mit später auftretenden Varianten anderer Theoretiker, sukzessive die zu seinen Lebzeiten vorherrschende mitteltönige Temperatur.
Sie ist dadurch charakterisiert, dass vier Quinten, C–G, G–D, D–A und H–Fis, um ein Viertel eines pythagoreischen Kommas verkleinert werden.
\[\frac{\frac{3}{2}}{\left(\frac{531441}{524288}\right)^4} = \frac{3}{2} \times \sqrt[4]{\frac{524288}{531441}} \approx 1,4949\]
Dies ist das Wert des Teilungsverhältnisses der vier verkleinerten Quinten in der wohltemperierten Stimmung. Alle übrigen Quinten sind rein (3:2 = 1,5).
Gleichstufige Stimmung
Wie erinnerlich ist bei der gleichstufigen Stimmung nicht eine Quinte massiv zu klein gestimmt (Wolfsquinte), sondern sämtliche der zwölf Quinten werden um ein Zwölftel des Wertes der Wolfsquinte zu klein gestimmt. Anders ausgedrückt wird die reine Oktave in zwölf gleich große Intervalle unterteilt: \(\sqrt[12]{\frac{2}{1}}\). Dies hat zur Folge, dass nicht nur alle Intervalle gleichen Namens das gleiche Teilungsverhältnis aufweisen (so kann beispielsweise nicht mehr zwischen großem und kleinem Ganzton differenziert werden); vielmehr weisen selbst enharmonische Varianten eines Intervalls (z.B. kleine Terz versus übermäßige Sekunde) das gleiche Verhältnis auf.
Eine Tonartencharakteristik, die nicht lediglich als hinderlich empfunden, sondern vielmehr von vielen Komponisten effektvoll eingesetzt wurde, geht hierbei selbstredend völlig verloren.
Zu beachten ist, dass entgegen einer weit verbreiteten Annahme die Terz eines gleichstufigen Durdreiklangs zu groß ist. Im gleichstufigen Kontext beträgt die große Terz genau \(\frac{1}{3}\) der Oktave. Somit errechnet sich ihr Wert wie folgt:
\[\sqrt[3]{\frac{2}{1}} \approx 1,259921\]
, wohingegen die reine große Terz den etwas kleineren Teilungswert von 1,25 (5:4) aufweist.
Reine Stimmung bei Nicht-Tasteninstrumenten?
Meist wird angenommen, reine Stimmung sei mit nicht mit Tasten ausgestatteten Instrumenten, die periodische Schwingungen erzeugen, möglich.
Auch dies ist leider nicht der Fall. Wenige Beispiele mögen dies verdeutlichen:
Gemäß Naturtonreihe auf C mit C = 66 Hz besitzt der Ton g die Frequenz von 198 Hz, der Ton a1 die Frequenz von 440 Hz. Diese Töne sind gewählt, weil sie zwei leeren Saiten der Violine entsprechen.
Nehmen wir nun an, eine Violine spielt den Ton a1 und hält diesen aus, während eine zweite Violine zunächst g spielt, um dann mittels zwei aufwärts gerichteter Quintsprünge mit der anderen Violine im Einklang zu verschmelzen.
\[198 \times \frac{3}{2} \times \frac{3}{2} = 198 \times \frac{9}{4} = 445,5~Hz\]
Hier wird bereits deutlich, dass beide Violinen schließlich nicht im Einklang spielen, da 440 \(\neq\) 445,5 Hz sind, und dies, obwohl sowohl die Ausgangstöne g und a1 wie auch die zwei reinen Quinten akustisch vorgegeben sind.
Spielt die zweite Violine hingegen von g aus zunächst eine reine Quarte und anschließend eine große Sexte aufwärts, wird a1 = 440 Hz tatsächlich erreicht.
Doch es wird noch erstaunlicher. Nehmen wir an, wir spielen die Akkordfolge C-Dur – a-Moll – F-Dur – C-Dur, wobei alle Dreiklänge in Grundstellung erklingen. Betrachten wir nun die konkrete Basslinie: Diese soll auf die Töne c1 – a – f – c1 lauten. Berechnung der Bassstufenfolge:
\[264~Hz \times \frac{5}{6} \times \frac{4}{5} \times \frac{3}{2} = \frac{15840}{60} = 264~Hz\]
Hier ist leicht ersichtlich, dass Ausgangs- und Zielton übereinstimmen.
Verkomplizieren wir nun eine Stufenfolge zu c1 – f1 – a1 – d1 – g1 – c1, stellt sich Situation anders dar:
\[264~Hz \times \frac{4}{3} \times \frac{5}{4} \times \frac{2}{3} \times \frac{4}{3} \times \frac{2}{3} = \frac{84480}{324} \approx 260,74074~Hz\]
Der Zielton ist also deutlich zu tief, obwohl der Ausgangston wieder erreicht sein müsste – und dies, obwohl absichtlich Fundamentsekundschritte ausgespart wurden, da, wie gesehen, zwischen großem und kleinem Ganzton unterschieden werden muss.
Betrachten wir abschließend folgende einfache Stufenfolge von c1 zu c1: c1 – g1 – d1 – a1 – c2 – c1.
\[264~Hz \times \frac{3}{2} \times \frac{3}{4} \times \frac{3}{2} \times \frac{6}{5} \times \frac{1}{2} = \frac{42768}{160} = 267,3~Hz\]
Hier ist der Zielton im Vergleich zum Ausgangston zu hoch.
Eine reine Stimmung ist also auch bei diesen Instrumenten oder der Chormusik Utopie. Gleichwohl ist es mit diesen Besetzungen möglich, die Abweichungen von einer reinen Temperatur „situativer“ zu gestalten, da jeder Einzelton mikrotonal intoniert werden kann, sehen wir von den leeren Saiten ab. Die Musiker beschreiten somit einen Weg des akustisch betrachtet geringsten Übels.
Epilog
Mit dem Zeitalter des Barock erhielten Cembalo (später Hammerklavier) und Orgel, oder auch Theorbe, Harfe und Gitarre einen festen Platz im Orchester – als harmonische Stütze des Orchestersatzes einerseits, im Bereich von Oper, Kantate und Oratorium besonders als Begleitinstrument des Einzelgesangs, der Monodie.
Die Vorteile einer klein besetzen Generalbassgruppe zur Begleitung von Monodien liegen auf der Hand: Klanglich überlagerte die Instrumentalgruppe den Sänger nicht, sondern fungierte fundierend und harmonisch stützend. Aufgrund der Tatsache, dass den Organisten und Cembalisten große Freiheiten bei der Ausführung des Generalbasses eingeräumt wurden – bekanntlich wurden nur Basslinie und Akkordbezifferung von den Komponisten vorgegeben –, konnten die ausführenden Instrumentalisten spontan auf subtile Stimmungsnuancen der Sängerin oder des Sängers reagieren, was besonders im dramatischen, die Handlung fortführenden Rezitativ unerlässlich ist, und auch akustische Bedingungen konnten unmittelbar die Ausführung des Generalbasses beeinflussen.
Der Einsatz von Orgel oder Cembalo als Orchesterinstrument war im Barock von einer solch großen Selbstverständlichkeit, dass die Komponisten explizit vorgeben mussten, wenn diese in Ausnahmefällen ganz zu schweigen hatten oder nur die Basslinie ohne akkordische Begleitung zu spielen war.
Während die Generalbassinstrumente in der Orchestermusik im Verlauf der klassischen Epoche zurückgedrängt wurden – in frühen Sinfonien Joseph Haydns kommt das Cembalo noch zum Einsatz –, bleibt ihre Verwendung in sakralmusikalischen Genres noch bis zur frühen Romantik üblich. So schreibt Franz Schubert in seinen frühen kirchenmusikalischen Werken Generalbassziffern vor und verzichtet erst mit seiner sechsten und letzten Messe in Es-Dur gänzlich auf die Orgel.
Im Verlauf der Romantik verlieren die Tasteninstrumente ihren angestammten Platz im Orchester völlig, sehen wir von einigen Ausnahmen und dem Solokonzert ab. Neben vielen Gründen des Zeitgeschmacks muss hierbei dem Temperaturproblem der Tasteninstrumente sicherlich größte Bedeutung beigemessen werden; denn mit zunehmender chromatisch-enharmonisch-modulatorischer Harmonik und Melodik verstärkt sich das Problem der Diskrepanz zwischen einem so naturrein wie möglich intonierenden Orchester und dem temperiert gestimmten Tasteninstrument.
So kann der erste akkordische Einsatz der Orgel in Richard Strauss’ sinfonischer Dichtung Also sprach Zarathustra, der dem ausgehaltenen Orchester-C-Dur-Klang hinzutritt, geradezu bestürzend wirken. Wenn die Orgel diesen Klang – Strauss schreib hier „volles Werk“ vor – schließlich aushält, während das Orchester verstummt, wird das klangliche Missverhältnis zwischen dem so naturrein wie möglich spielenden Orchester und der in den meisten Fällen wohl gleichstufig gestimmten Orgel über-evident.
Wie das Lügner-Paradoxon – dieser zunächst abwegig erscheinende Vergleich drängt sich zunehmend auf – kommen uns die sich gegenseitig ausschließenden aber gleichzeitig so natürlichen akustischen Phänomene entgegen, haben wir doch erkennen müssen, dass „c1 \(\neq\) c1“ ist (zumindest sein kann) oder „264 Hz = 260,74074 Hz“. Um so frappierender und wunderbarer ist es, dass Musik schlicht „funktioniert“ und sie in ihrer emotionalen Wirkung, als Kultur, Identität, gar sinnstiftendes Moment, als Kommunikationsmittel und in ihrer geradezu metaphysischen Semiotik weit über bloße Phänomenologie des Klangs hinausgeht.
Und so bleibt das Staunen.
Vgl. Robert Schumann: Musikalische Haus- und Lebensregeln↩︎
Wir gehen hier von einer „idealisierten“ bzw. „modernisierten“ pythagoreischen Stimmung aus, bei der 12 reine Quinten in Folge gestimmt werden. Der historischen Stimmung diente das b als Ausgangston, und es wurden nur 8 Quinten darüber gestimmt, da nicht alle Töne in Gebrauch waren.↩︎
Was „rein“ im physikalisch-akustischen Sinne bedeutet, wird unten erläutert.↩︎
Einige Bautypen historischer Tasteninstrumente waren mit mehrfach geteilten Tasten ausgestattet: Hier war es möglich, z. B. mit der Taste für den Ton b/ais tatsächlich zwei unterschiedlichen Saiten anzuregen. Als Beispiel mag das Archicembalo von Nicola Vicentino dienen, ein zweimanualiges Instrument mit 36 Tasten pro Oktave.↩︎
Regulär ist zwischen zwei unterschiedlichen Halbtonschritten zu unterschieden: dem chromatischen (übermäßige Prime) und dem diatonischen (kleine Sekunde) Halbton.↩︎