Audió mérések: alapelvek, módszerek
(és tévhitek)
Hangminőségről, audió mérések logikájáról, tesztmódszerekről, hallásról és határértékekről.
2025.05.09.
Utoljára módosítva: 2026.01.20.
Audió mérések, hifi, hangtechnika (szabad a választás) világában nem könnyű eligazodni. Sajnos ez a terület meglehetősen kaotikusnak, szedett-vedettnek tűnik, nehéz átlátni az összefüggéseket, kapcsolódási pontokat, valamint a méréstechnika elméleti hátterét. A következő cikk megkísérli összefoglalni a legfontosabb alapelveket, bár csak "vázlatosan", a mélység boncolgatása nélkül.
Hifi magazinokban, fórumokon igen gyakori jelenség a szubjektív és objektív közötti határvonal eltorzítása, azaz jelenségekről vagy jellemzőkről azt állítani, hogy szubjektívek, miközben valójában nem azok. Zenei ízlés, esztétikum szubjektív, a hangminőség koncepciója azonban objektív kategória, még akkor is, ha a hallási képességek között találunk egyéni különbségeket, mivel ezek a különbségek egyszerűen mérhetők. Szintén gyakori trükk egyszerű akusztikai, hangtechnikai jelenségeket úgy beállítani, mintha nem lenne rájuk racionális magyarázat.
Szintén nem szerencsés, ha téves analógiák mentén építjük fel a saját igazságukat. ("Hogyan méred meg a hang minőségét, hiszen egy sütemény által okozott örömöt se lehet megmérni." és hasonlók. Hifi a hibás hasonlatok és rossz kérdések igazi kincsestára). Az analógiás érvelésnek vannak bizonyos szabályai és talán a legfontosabb szabály az, hogy csak akkor tudunk jó hasonlatot kitalálni, ha behatóan ismerjük azt rendszert, amit a hasonlatunkkal meg akarunk világítani (az analógiás érvelés 22-es csapdája). Persze az a legjobb, ha kerüljük a hasonlatokat amennyire lehet.
Ha a zene által kiváltott élménnyel próbáljuk jellemezni az audió lánc komponenseit, akkor biztosan félrevezetjük saját magunkat és garantáltan eltévedünk a hifi labirintusban. A zenei élményt, azaz a zene élvezetét rengeteg tényező befolyásolja a hangminőség mellett, hiszen a hangzás minősége a zenei élménynek csak egy része csupán, bár egy fontos és meghatározó alkotóeleme.
Sajnos objektív módszerek követése sem garancia az igazságra, főleg nem mélyebb igazságra... Statisztikai jellegű eszközökkel, ABX tesztekkel nagyon könnyen a tudományosság látszatát lehet kelteni. Statisztika, ABX teszt ráadásul nem magyaráz meg semmit, ha pedig megelégszünk az ABX tesztek eredményeivel, akkor ne csodálkozzunk, ha a felületesség vádjával illetnek minket. (Gondoljunk bele, melyik az igazi magyarázat: ABX teszteredmények tömkelege, vagy az, hogy össze tudjuk kapcsolni a jelenséget egy mérőjellel és hallási jellemzőkkel.)
Mennyire hihetünk a hallásunknak?
Vakon sem hallásunkban, sem látásunkban nem bízhatunk, mert előbb-utóbb becsapjuk magunkat. Nem hiszem, hogy ezt különösebben részletezni kell (optikai illúziók, félreértett mondatok, félreértett dalszövegek...). Veszélyhelyzeteket leszámítva az érzékszerveinkből származó információt sosem használjuk közvetlenül, hanem mindig figyelembe vesszük a múltbéli tapasztalatainkat. Az érzékelés részben tanulási folyamat, ami azt jelenti, hogy megtanuljuk helyesen használni az érzékszerveinket, az érzékelés határain azonban javítani nem tudunk.
Szinte mindenki különösebb nehézség nélkül fel tudja idézni magában egy zongora vagy gitár hangját, azonban kis különbségek összehasonlításánál az elemző és fókuszálási képességünk, valamint a memóriánk könnyen csődöt mond. Árnyalatnyi különbségek tesztelése különleges tesztmódszereket igényel, figyelembe kell vennünk saját korlátainkat és ezáltal minimalizálni a tévedés lehetőségét.
Azonban azzal, hogy bizonyíthatóan hallunk valamiféle különbséget, még nem értünk a történet végére. Zenei tesztek talán egyik legnagyobb buktatója, hogy legfeljebb a hangzásról tudunk ítéletet mondani, ugyanakkor a technológiával kapcsolatban egyértelmű következtetést levonni nem tudunk. A hatásmechanizmus felderítése további speciális feltételeket igényel. Például ki kell zárnunk annak a lehetőségét, hogy a különbséget ismeretlen (rejtett) változók okozzák (a teszt nem hamis pozitív vagy hamis negatív).
Ajánlott módszer kis különbségek tesztelésére:
- az összehasonlítandó hangminták rövidek legyenek (legfeljebb 5 másodperc hosszúak),
- hangminták közötti átkapcsolás gyors és hangtalan legyen (legfeljebb két másodperc),
- egyszerre csak egy paramétert szabad változtatni, különben érvénytelen a teszt,
- zenei részletek mellet szükség lehet tesztjelekre, szóló hangszeres felvételekre,
- a tesztanyag kiválasztása kritikus jelentőségű, mivel a hangminták befolyásolják a teszt érzékenységét és az eredmények szórását,
- bizonyos teszteknél digitális szűrőkkel szintén javíthatunk a teszt érzékenységén (pl. formátumok tesztelése),
- a teszteket úgy kell megtervezni, hogy ne csak eredményeket szolgáltassanak, hanem ok-okozati kapcsolatokra is fény derüljön.
Vakteszt/ABX teszt csak egyetlen problémára jelent megoldást!
Vakteszt, illetve leggyakrabban alkalmazott formája, az ABX teszt hatékony eszköz az elvárásainkból, esetleges előítéleteinkből fakadó önbecsapás kiküszöbölésére. ABX tesztelés azonban nem garantálja a hibátlan tesztfolyamatot, az eredmények lehetnek félrevezetőek, ha pedig az eredmények elfogadhatóak, a korreláció nem jelent feltétlenül oksági kapcsolatot. Tesztek kizárólagos alkalmazása tévhitek mellett felületes tudáshoz vezethet.
Zenével történő tesztelésnek csak akkor van értelme, ha már megfelelő ismerettel rendelkezünk a tesztelendő rendszerrel. (Orvostudományban, számítástechnikában a tesztelést mindig a végső fázisban alkalmazzák. Processzort nem terveznek csupán Benchmark tesztek alapján, vagy gyógyszereket csak kettős vakteszt eredmények alapján.)
Szerencsére tudásunk nem tesztekből származik, hanem mérésre és modellezésre épülő kísérletekből.
Babona, mágikus gondolkodás képzeletbeli folyamatokba vetett hit, vagy tárgyaknak nem létező tulajdonságok tulajdonítása rossz minőségű bizonyítékok alapján. Hibás logika mellett érzelmek is nagy szerepet játszanak babonák, vudu tanok létrejöttében (vágy vezérelt gondolkodás, kirekesztéstől való félelem, kognitív disszonancia).
Hangminőség - hat kérdés (kulcs a mérésekhez)
Hangtechnikában használt mérések mögött meghúzódó logika nem olyan bonyolult: egy komponens hangminőségét objektív módszerekkel úgy lehet meghatározni, ha megmérjük a jel változását (pontosabb egy adott tulajdonságát), miközben áthalad a komponensen, majd összehasonlítjuk a változást a megfelelő határértékkel. Értelemszerűen a jelnek azokat a jellemzőit mérjük, amelyek hatással vannak a hangminőségre.
Mérés és hallás közötti korreláció alapkövetelmény, hiszen a hangtechnika területén egy olyan mérés, ami nincs összefüggésben azzal amit hallunk nem igazán hasznos. Sajnos néhány népszerű, villamos méréstechnikából közvetlenül adoptált mérés kapcsolata az érzékeléssel kifogásolható (pl. SNR, SINAD). Azonban a hallás ismerete sokat segíthet még a kevésbé pontos mérések értelmezésében is.
Hangminőség mérésével kapcsolatos összes probléma az alábbi hat kérdés köré csoportosítható:
- Milyen fizikai folyamatok állnak az adott technológia mögött? Mi történik a jellel, amikor áthalad egy adott komponensen vagy rendszeren? (Ez a fizikai magyarázat szintje, vagy másképp a jelenség fizikai modellje.)
- Hogyan mérhető a méréstechnika általános eszközeivel a jel változása, illetve a modellben szereplő jellemzők? (Nem specifikált audió mérésre gondolok, hanem teljesen általános eszközre.)
- Milyen hallási folyamattal hozható kapcsolatba a jelváltozás érzékelése? Mi az átviteli hiba természete? (pl. hangelfedés, abszolút hallásküszöb, hangosság érzet)
- Melyik az a jel, amivel leginkább hallható a folyamat, hatás vagy átviteli hiba? (keressük a "worst-case"-t reprezentáló jelet)
- Milyen egyéni különbségek tapasztalhatók a határértékek között? (átlag, szórás)
- Hogyan kapcsolódnak a mérések, mérőjelek és határértékek a körülöttünk található hangforrások hangjához? (hangszerek, beszéd, kutyaugatás, mennydörgés, tücsökciripelés)
Helyes, érzékeléssel és a rendszer működésével összefüggő méréseket csak a fentiek figyelembevételével lehet felépíteni. Az első négy kérdésnek kitüntetett szerepe van, mivel a mechanizmusra vonatkozik, azaz a modellre. Az utolsó kettő inkább pontosítás, hogy jobb képet kapjunk.
Hasonló jellegű írás a hangtömörítés alapjairól (angolul): Lossy audio compression: principles, methods, misconceptions
Minden, ami hallható
Hallásmodell: érzeti akusztika speciális teszthangokkal vizsgálja az emberi hallást, hallásmodelleket alkot és különféle küszöbértékeket határoz meg.
Az abszolút hallásküszöb (ATH) és a hangelfedés jelensége (auditory masking) határozza meg a hallható hangok tartományát. Az előző megállapítás bármilyen hangra igaz kivétel nélkül: nemlineáris torzításra, zajra, rezonanciákra, időbeli jelenségekre.
A hangelfedés azt jelenti, hogy egy (hangos) hang közelében a hallásküszöb megemelkedik (hangelfedésnek nincs jelentősége halk hangoknál). A hallásküszöbnél kisebb intenzitású jelek nem hallhatók.
Hangelfedés általában a harmadik harmonikusig jelentős. Egy oktávval a maszkoló jel felett (második harmonikus) az éppen érzékelhető hang intenzitása csupán 40 decibellel alacsonyabb a maszkoló jel intenzitásánál. Harmadik harmonikusnál a különbség 60 decibel.
Hifi Teszt Zene Válogatás (YouTube)A jel „tisztasága” lényegtelen
Nem a jel „tisztasága” számít... Egy audió rendszerben az elsődleges cél a jel megőrzése és továbbítása oly módon, hogy a felhalmozódott hibák ne legyenek hallhatók, vagy elég alacsonyak ahhoz, hogy ne befolyásolják a hangminőséget.
Magának a jelnek az alakja is lényegtelen (négyszögjel-válasz, impulzusválasz). Például nem számít, hogy az impulzusválasz nem tökéletes, hiszen az az igazi kérdés, hogy a rezgés vagy rezonancia az impulzusban hallható-e... Hangminőséget nem lehet pusztán hullámforma alapján megítélni.
Hangminőség paraméterei (mérések fő kategóriái)
Hangminőség paraméterei: frekvenciaválasz (amplitúdó-frekvencia), nemlineáris torzítás görbék, zajspektrum (vagy jel-zaj viszony) és impulzusválasz (vagy fázismenet, csoportkésés). Időtartománybeli mérések másodlagosak, mivel DAC-ok és erősítők fázistorzítása minimális a hallható tartományban. Többutas hangsugárzók fázistorzítása nagyságrendekkel nagyobb, az impulzusválaszban azonban még ez sem hallható. Időtartománybeli méréseknek szobaakusztikában van nagyobb szerepe, bár ezek a mérések jelentősen eltérnek a fázis / csoportkésés mérésektől.
Erősítőknél, DAC-oknál értelmezhető még a csatornák közötti áthallás. Hifiben a rémisztgetés és nagyotmondás leggyakoribb eszköze, a jitter (órajel ingadozása) pedig egyszerű torzításként jelentkezik.
A hangminőség paraméterek azt írják le, hogy egy rendszer milyen mértékben képes reprodukálni a mikrofonnal rögzített előadást. Frekvenciaátviteli hibák megváltoztatják a harmonikusok egymáshoz viszonyított amplitúdóját. Ezt a változást a hangszínváltozásként érzékeljük (bizonyos harmonikusok felerősödnek, míg mások halkabbak lesznek). Nemlineáris torzítás hatására új komponensek keletkeznek, amit szintén hangszínváltozásként érzékelünk. Zajt nem kell különösebben bemutatni, bár manapság pont a zajtalan rendszerek miatt lehet ismeretlen sokak számára.
Érdekesség, hogy a zaj egyszerűen tesztelhető, nincs szükség komplex méréstechnikára, se komoly tapasztalatra. Ha a zaj kérdéses, csak meg kell hallgatni a rendszer alapzaját. Ezzel szemben a frekvenciaátviteli hibák kiértékelésében hallásunk nagyon ügyetlen: bár halljuk, hogy valami nincs rendben, nem tudjuk egyértelműen megmondani, hogy melyik frekvenciasávban és mekkora mértékben. Frekvenciaátviteli hibákat csak méréssel lehet pontosan megállapítani.
Érdemes elolvasni Ethan Winer "Audiophoolery" cikkét.
Határértékek és „worst-case” határértékek
Az éppen érzékelhető torzítás, zaj, szintkülönbség vagy fáziskülönbség a hangjel harmonikus és időbeli tulajdonságainak függvénye. Mindig találhatunk egy olyan jelet olyan alacsony határértékkel, amelynél a vizsgált hiba-kategória leginkább hallható (worst-case: legrosszabb eset).
Például nemlineáris torzítás tiszta hangokkal és kettős hangokkal hallható leginkább. Az érzékelés jóval nehezebb összetett, időben változó jelekkel és impulzusokkal. Ezzel szemben az idővel kapcsolatos hibák jobban hallhatók impulzusokban vagy impulzussorozatokban. (Néhány mérőjel „worst-case”-nek számít.)
Transzparencia illetve a transzparens rendszer definíciója szorosan kapcsolódik a „worst-case” fogalmához. Például nemlinearitást vizsgálva transzparencia akkor érhető el, ha a torzítás nem hallható „worst-case” típusú tesztjeleknél. Hangsugárzók és fejhallgatók frekvenciaátvitele kivételnek számít, mivel ebben az esetben a „worst-case” (éppen érzékelhető szintkülönbség tiszta hanggal) túl szigorú kritérium.
Határérték, illetve a határérték és jelforma között kapcsolat talán a legfontosabb alapelv az audió területén. Bármilyen hangminőséggel kapcsolatos kérdés a határérték, illetve a határérték és jelforma körül forog.
Horváth Csaba
Kapcsolódó cikkek:
Egy szippantás a jóból (zenei válogatás)
SINAD / THD+N mérése, határértékei
Hangszóró direktivitás modellezése
Alsó kategóriás hifi fejhallgatók a múltból: mit kezdjünk velük?


