7
1900-talet
Kritik och förvirring
Helmholtz’ teori fick snabbt stor spridning, men utsattes för kritik från psykologer och
musikvetare, och man kan inte påstå att teorin blev allmänt omfattad. Långt in på 1900-talet
har man kunnat uppbåda stöd för konsonansteorier som utgår från samma förklaring som
Galilei omfattade, att örat helt enkelt föredrar enkla frekvensförhållanden, punkt slut. Andra
har ansett att det är andelen sammanfallande övertoner som är förklaringen till konsonans.
19
Ytterligare andra, som t.ex. psykologen Carl Stumpf kring förra sekelskiftet, menade med
stöd av en rad egna experiment att konsonans skulle förstås som graden av sammansmältning
till en enda ton (”Versmeltzung”). Många följde i hans fotspår, och i flera experiment försökte
man bestämma hur olika intervall skulle rankas i konsonanshänseende, om konsonans defini-
erades på något mer eller mindre lämpligt sätt. På 1910-talet lät C. F. Malmberg en jury
bestående av musiker och psykologer resonera sig fram till konsensusåsikter om konsonansen
hos de tolv intervall som ryms inom en oktav. Definitionen av konsonans diskuterades ige-
nom av juryn, och man kom fram till följande försök, tänkt att dels undvika subjektivt färgade
ord som ”välljudande” och ”njutbar”, dels undvika alla associationer till tonrörelser och ack-
ordföljder:
When the two tones of a two-clang tend to blend or fuse and produce a relatively
smooth and pure resultant, they are said to be consonant. Dissonance is the reci-
procal of this. (Malmberg 1918, s. 108, kursiv i orig.)
20
Malmbergs resultat blev rangordningar av de tolv intervallen med avseende på de adjektiv
som nämns i definitionen, nämligen ”blending”, ”fusion”, ”smoothness” och ”purity”. Fusion
ska här förstås på samma sätt som Stumpfs Versmeltzung, sammansmältning till en ton.
Ännu vid 1900-talets mitt var situationen förvirrad. Kritiken mot Helmholtz hade redan
från början gått ut på att hans teori delvis var kontraintuitiv. Om maximal dissonans uppträder
vid svävningsfrekvensen 33 Hz, så innebär det att den stora tersen 165-132 Hz är mycket
dissonant medan den stora tersen 660-528 Hz (två oktaver högre) är mycket konsonant. Som-
liga kritiker menade att ett och samma intervall borde tillskrivas en viss grad av konsonans
oavsett tonhöjd. Det är lätt att se att denna motsättning kan förklaras av olika definitioner av
begreppen konsonans och dissonans. Medan Helmholtz, Stumpf och Malmberg i sina arbeten
främst försökt förklara stillastående tvåklanger genom att försöka reducera fenomenet till en
enda faktor (svävningar hos Helmholtz, ”Versmeltzung” hos Stumpf, etc.), fanns det kritiker
som istället tog fasta på att dissonans ansågs vara instabil och ha riktningsverkan, medan
konsonans var vilande. En sådan tanke, som anknyter till Rameau/Riemann-skolan, kompli-
cerar naturligtvis saker och ting. Ännu på 1950-talet återgav G. Révész den klassiska kritiken
mot Helmholtz och drog slutsatsen att dennes teori var ohållbar (Révész 1953, s. 82f). Révész
tillhörde dem som ansåg att ett ackordiskt riktningstänkande hade en rättmätig plats i konso-
nansfrågan. Tyvärr kunde han inte erbjuda någon teori som löste problemet.
Helmholtz’ teorier revideras
Psykologen Révész satte i konsonansfrågan sitt hopp till gestaltpsykologin, ett hopp som
knappast infriats. Istället var det från akustiskt håll som nästa stora steg skulle tas. Holländ-
arna Rainier Plomp och Willem J. M. Levelt konstaterade i en mycket inflytelserik artikel från
1965 att det visserligen fanns en del experiment, vari försökspersoner fått bedöma konso-
nansen mellan sinustoner och mellan komplexa toner, vilkas resultat endast kunde få teore-
19
Observera noggrant skillnaden gentemot Helmholtz. Den senare ansåg att förklaringen till konsonans var av-
saknaden av störande svävningar. Detta inträffar visserligen vanligen när många parvisa deltoner sammanfaller,
men det är ändå inte samma förklaring.
20
Malmbergs artikel ligger också till grund för de åsikter som framförs av Seashore (1938) i frågan.
8
tiskt stöd från Helmholtz. Antagandet att maximal strävhet mellan sinustoner inträffar vid
samma frekvensskillnad i alla frekvensområden var dock fortfarande obekräftat. De utförde
därför själva experiment för att utröna frågan (Plomp & Levelt 1965). Resultatet visade att
Helmholtz hade fel. Maximal strävhet mellan sinustoner uppstår inte alltid då svävningsfre-
kvensen är 33 Hz. När sinustonerna är mörka fås maximal strävhet vid en lägre svävnings-
frekvens, när sinustonerna är ljusa vid en högre svävningsfrekvens. Man kunde gissa att sväv-
ningsfrekvensen för maximal strävhet helt enkelt var direkt proportionell mot genomsnittet av
de ingående sinustonernas frekvens, dvs. att samma intervall är mest strävt i alla frekvens-
områden. Så är det emellertid inte heller. Plomp och Levelt fann istället att maximal strävhet
uppträdde då svävningsfrekvensen motsvarade en kvarts kritisk bandbredd.
Det skulle leda för långt att här försöka ge en uttömmande beskrivning av hörselns fysio-
logi.
21
Här må följande resumé räcka: De vibrerande luftmolekylerna sätter trumhinnan i rö-
relse. Rörelsen förmedlas av tre små ben, hammaren, städet och stigbygeln, till ovala fönstret,
som utgör ingången till den snäcka (med det latinska namnet cochlea), vari det egentliga hör-
selorganet, Cortis organ, finns. Snäckan är delad på längden i tre kanaler (scalae). De vätske-
fyllda scala vestibuli och scala tympani har kontakt med varandra längst in i snäckan (dvs. de
är egentligen samma kanal). Mellan dem finns scala media. Membranet mellan scala tympani
och scala media kallas basilarmembranet (eller basalmembranet). På detta membran, på scala
media-sidan, ligger Cortis organ. Ovala fönstret förmedlar ljudvibrationerna till scala vesti-
buli, varifrån de förmedlas vidare till scala tympani. En våg uppkommer i snäckans kanaler
och deformerar basilarmembranet. Deformationen blir som störst på ett visst ställe, beroende
på vilken frekvens ljudet har. Om en komplex ton förmedlas, deformeras basilarmembranet på
alla de ställen som motsvarar frekvenserna för de ingående deltonerna. Cortis organ omvand-
lar deformationerna till nervimpulser och skickar dem till hörselcentrum i hjärnan.
Deformationen av basilarmembranet kan naturligtvis inte ske endast i en punkt, utan har
en viss utsträckning även om den motsvarar en sinuston med en exakt frekvens. Detta betyder
att två sinustoner som ligger tillräckligt nära varandra i frekvens deformerar basilarmembranet
så att det inte tydligt går att skilja ut två olika deformationsställen. Kritisk bandbredd (eng.
critical bandwidth) kallar man det frekvensavstånd som krävs för att man ska uppfatta två
sinustoner som två skilda toner.
22
När två sinustoner hamnar inom samma kritiska band upp-
kommer strävhet. Den kritiska bandbredden är olika stor i olika frekvensområden. För fre-
kvenser under 500 Hz är den kritiska bandbredden nära konstant 100 Hz, men för högre fre-
kvenser ökar den approximativt linjärt så att den motsvarar ungefär en liten ters (frekvens-
förhållandet
5
6
).
Vad Plomp och Levelt fann, inom rimliga felmarginaler, var alltså att maximal strävhet
mellan sinustoner inträffar då svävningsfrekvensen motsvarar en kvarts kritisk bandbredd
längs basilarmembranet. De skapade en standardkurva som de ansåg beskrev sambandet
mellan kritisk bandbredd och strävhet mellan sinustoner. Kurvan är mycket lik den som åter-
ges i figur 1, med den skillnaden att x-axeln ska ha etiketten ”kritisk bandbredd” och att kur-
vans maximum ska inträffa då den kritiska bandbredden är 0,25. Strävheten mellan nära-
liggande sinustoner skulle alltså ha en fysiologisk grund och vara lika för alla människor
oavsett kulturell bakgrund.
23
Strävhetskurvor
Som vi sett av figur 2 försökte redan Helmholtz, utifrån sina antaganden om när maximal
21
Den intresserade kan konsultera någon standardtext, t.ex. Pickles (1988).
22
Kritisk bandbredd dyker inte upp enbart i diskussioner om konsonans och dissonans utan även t.ex. uppfattad
ljudstyrka (hörstyrka). Om man lyssnar till ett smalbandigt brus vilkas frekvenser ryms inom ett och samma kri-
tiska band, kommer hörstyrkan att vara oförändrad när man ökar brusets bandbredd ända tills brusets bandbredd
blir större än hörselns kritiska bandbredd vid de aktuella frekvenserna. Då ökar hörstyrkan.
23
Se Kameoka & Kuriyagawa (1969a,b) för en redovisning av japanska försökspersoner som – ska det tilläggas
– dock var blivande ljudingenjörer.