Alta fedeltà o suggestione? Il mistero delle frequenze che (forse) non sentiamo
Esiste una polemica (vecchia ma tornata d’attualità) sull’uso e l’utilità delle alte frequenze oltre i 20 kHz nei formatiad alta risoluzione, nelle produzioni musicali, e nei sistemi hi-fi.

La banda udibile: teoria e limiti pratici
La gamma di frequenze che l’orecchio umano è in grado di percepire, detta banda udibile, si estende teoricamente da 20 Hz a 20.000 Hz (20 kHz). Tuttavia, questo intervallo rappresenta un limite ideale, valido principalmente per soggetti giovani in condizioni ottimali.
Nella pratica, la sensibilità dell’udito alle alte frequenze diminuisce con l’età (presbiacusia) e con l’esposizione a rumori intensi nel corso della vita. Già intorno ai 30 anni, molte persone iniziano a percepire difficilmente frequenze superiori ai 16 kHz, e solo una piccola percentuale riesce a distinguere suoni oltre i 18 kHz. Dopo i 50 anni, la soglia superiore può scendere anche sotto i 14–15 kHz.
È importante distinguere tra percezione conscia e risposta fisiologica. Frequenze superiori a 20 kHz (ultrasuoni) non vengono percepite come suoni udibili. Il sistema uditivo umano, infatti, non ha la capacità meccanica e neurale per trasdurre efficacemente onde sonore oltre questa soglia in segnali percepiti consciamente. Possibili effetti fisici o soggettivi degli ultrasuoni (ad esempio fastidio o pressione) non sono collegati alla percezione acustica vera e propria, ma a fenomeni secondari come la vibrazione di tessuti o l’intermodulazione in presenza di dispositivi elettronici.
In sintesi, possiamo dire che:
- 20 Hz – 20 kHz è la banda teorica udibile per l’essere umano;
- 10 Hz – 16/18 kHz è più realistico per la maggior parte degli adulti;
- >20 kHz è fuori dal range di percezione cosciente e non viene udito come suono.
Curva di Fletcher-Munson

Queste curva di intensità sonora illustrano come la sensibilità dell’orecchio umano varia in funzione della frequenza e del livello di pressione sonora.
Una curva di uguale intensità sonora rappresenta graficamente quali combinazioni di frequenza e pressione sonora (dB SPL) sono percepite come ugualmente forti dall’orecchio umano.
Immaginiamo di ascoltare un tono puro a 1.000 Hz con un’intensità di 40 dB SPL (decibel Sound Pressure Level). Le curve ci dicono, per ogni altra frequenza, a quale intensità (in dB SPL) dovremmo riprodurre un tono affinché venga percepito dalla stessa persona come “ugualmente forte” a quel tono da 1.000 Hz.
In particolare, mostrano che l’orecchio è più sensibile alle frequenze tra 2.000 e 5.000 Hz, richiedendo livelli di pressione sonora più bassi per percepire suoni in questo intervallo come ugualmente intensi rispetto ad altre frequenze.
La figura mostra due gruppi di curve: Fletcher-Munson vs ISO 226:2003:
Curve di Fletcher-Munson (1933, 1937): furono le prime curve di equal-loudness sperimentalmente determinate ottenute negli anni ’30 da Harvey Fletcher e Wilden A. Munson presso i Bell Labs, I dati si basano su test condotti su un numero relativamente piccolo di soggetti (circa 20 persone) e le misure erano meno precise, ma hanno gettato le basi per la psicoacustica moderna. Vengono spesso mostrate per motivi storici o didattici.
Curve ISO 226:2003: Sono le curve attualmente riconosciute a livello internazionale (ISO = International Organization for Standardization) pubblicate nel 2003, frutto di un ampio lavoro di raccolta dati da più laboratori internazionali coinvolgente un campione molto ampio e diversificato di soggetti. Sono definite matematicamente e più precise nella rappresentazione della sensibilità umana media al suono e rappresentano la norma ufficiale per applicazioni tecniche, ingegneristiche e medicali.
Sugli assi delle curve si ha:
- Orizzontale: la frequenza del suono in Hz (scala logaritmica).
- Verticale: la pressione sonora in dB SPL.
Ogni curva rappresenta un livello di percezione soggettiva di volume (fon), dove:
- 1 fon è il volume percepito di un tono a 1 kHz a 1 dB SPL.
- 40 fon, 60 fon, ecc. indicano suoni percepiti via via come più forti.
Esempio concreto:
- Una curva da 40 fon dice: “Tutti i punti su questa curva suonano come 40 fon, cioè come un suono da 1.000 Hz a 40 dB SPL”.
- Per ottenere 40 fon a 100 Hz, servono circa 60 dB SPL.
- Per ottenere 40 fon a 5.000 Hz, bastano 35 dB SPL.
Con l’età o danni all’udito (presbiacusia), le curve di uguale intensità si alzano alle alte frequenze: serve molto più volume per percepire un suono sopra i 10–12 kHz. Questo è il motivo per cui gli over 30 spesso non percepiscono bene suoni sopra i 16–18 kHz.
Ecco alcuni link per approfondire:
- Equal-loudness-level contours for pure tones” – Yôiti Suzuki & Hisashi Takeshima
Journal of the Acoustical Society of America - “Comparison of equal-loudness-level contours between otologically normal young and older adults” – Kenji Kurakata et al. Acoustical Science and Technology
Effetto del contenuto ultrasonico
Alcuni studi e marketing sostengono che anche se non “sentiamo” quelle frequenze, esse influenzano la percezione del suono, la spazialità, o danno una sensazione di realismo.
Questa teoria è nota come: “Effetto del contenuto ultrasonico”.
Uno studio molto citato è quello di Oohashi et al. (2000):
- Alcuni soggetti avrebbero risposto positivamente alla presenza di frequenze >20 kHz
- Solo una piccola parte del campione sembrava distinguere la differenza
- Ma è molto controverso, per via del bias psicologico, dell’ambiente di ascolto, e della qualità della riproduzione
Ma cosa ci dice la scienza audio?
Ci conferma che oltre i 20 kHz l’orecchio non percepisce consapevolmente e In alcune registrazioni ad alta risoluzione, il suono può apparire migliore, ma per altri motivi (miglior DAC, mix diverso, meno compressione, placebo…) ma ci sono possibili problemi infatti le alte frequenze “ultra” possono generare distorsioni intermodulatorie nei convertitori e negli amplificatori non perfetti e possono affaticare i tweeter o causare effetti non voluti nei crossover
La questione dell’influenza delle frequenze ultrasoniche (oltre i 20 kHz) sulla percezione umana è stata oggetto di numerosi studi, alcuni dei quali mettono in discussione l’esistenza di effetti significativi. Ecco alcune ricerche che evidenziano risultati contrastanti o negativi:
- “High-frequency sound components of high-resolution audio are not detected in auditory sensory memory“ (2020) di Hiroshi Nittono: Questo studio ha esaminato se le componenti ad alta frequenza dell’audio ad alta risoluzione vengano rilevate nella memoria sensoriale uditiva. I risultati hanno indicato che queste componenti non sono state rilevate, suggerendo che potrebbero non avere un impatto significativo sulla percezione uditiva.
- “Effects of very high-frequency sound and ultrasound on humans. Part I: Adverse symptoms after exposure to audible very-high frequency sound“ (2018) di Mark D. Fletcher et al.: In questo studio, i partecipanti sono stati esposti a suoni ad altissima frequenza (VHFS) e ultrasuoni (US). I risultati hanno mostrato che l’esposizione a VHFS udibili può causare sintomi negativi, come mal di testa e affaticamento, senza evidenziare effetti positivi sulla percezione o sul benessere.
- “Perceptual discrimination between musical sounds with and without very high frequency components“ (2003) di Toshiyuki Nishiguchi et al.: Questo studio ha valutato la capacità dei soggetti di discriminare tra suoni musicali contenenti o meno componenti ad altissima frequenza. I risultati hanno indicato che i partecipanti non erano in grado di distinguere in modo affidabile tra le due tipologie di suoni, suggerendo che le componenti ad altissima frequenza potrebbero non influenzare significativamente la percezione musicale.
Questi studi contribuiscono al dibattito scientifico sull’effetto delle frequenze ultrasoniche, indicando che potrebbero non avere un impatto significativo o positivo sulla percezione uditiva umana.
I formati audio ad alta risoluzione
I formati audio ad alta risoluzione (o hi-res audio) sono sistemi di codifica del suono digitale che superano le specifiche dello standard CD (44.1 kHz / 16 bit), offrendo campionamenti più frequenti e maggiore profondità in bit.
Esempi comuni di formati hi-res:
- 96 kHz / 24 bit
- 192 kHz / 24 bit
- DSD (Direct Stream Digital): usato nei SACD, con una logica di codifica diversa (1 bit a frequenze molto alte, es. 2.8 MHz)
Frequenza di campionamento (sample rate): È il numero di campioni al secondo usati per rappresentare un segnale audio digitale. Secondo il Teorema di Nyquist-Shannon, un sistema può rappresentare fedelmente frequenze fino a metà del sample rate.
Quindi:
- 44.1 kHz → può contenere frequenze fino a 22.05 kHz
- 96 kHz → fino a 48 kHz
- 192 kHz → fino a 96 kHz
Profondità in bit (bit depth): Definisce la gamma dinamica del segnale (differenza tra suoni più deboli e più forti).
Un file a 16 bit può rappresentare circa 96 dB di dinamica, mentre un file a 24 bit arriva a circa 144 dB, ben oltre il range dell’udito umano (tipicamente <120 dB in condizioni ideali).
Chi apprezza l’audio ad alta risoluzione sostiene che:
- Il suono risulta più aperto e arioso, specialmente in ambienti acustici ricchi (es. musica orchestrale).
- Si percepisce una maggiore “naturalità” e presenza, specialmente con strumenti acustici.
- Risulta meno affaticante all’ascolto prolungato, grazie a una ricostruzione più precisa del transitorio e della spazialità.
- I DAC (convertitori digitale/analogico) lavorano meglio a 24 bit perché gestiscono meno dithering e riducono la distorsione di quantizzazione.
Gli scettici mettono in discussione i benefici percepiti:
- L’udito umano non percepisce suoni sopra i 20 kHz, quindi campionare a 96 o 192 kHz sarebbe inutile in termini pratici.
- Le differenze percepite sarebbero effetti psicoacustici o suggestione.
- L’audio ad alta risoluzione aumenta il rischio di artefatti come:
- intermodulazioni ultrasoniche nei convertitori analogici (prodotti da componenti che non gestiscono bene segnali oltre 20 kHz),
- aliasing se il sistema non implementa filtri digitali di qualità.
- Molti DAC lavorano al meglio a 44.1 o 48 kHz, mentre a sample rate molto alti potrebbero introdurre jitter o distorsione fuori banda.
In sintesi
Caratteristica | Audio standard (CD) | Audio ad alta risoluzione |
---|---|---|
Sample rate | 44.1 kHz | 96 kHz, 192 kHz, DSD |
Bit depth | 16 bit (~96 dB) | 24 bit (~144 dB) |
Banda audio | fino a ~22 kHz | fino a 48–96 kHz |
Udito umano coperto? | Si | Si (ma con ampio margine) |
Benefici soggettivi | Standard sufficiente | Percezione di maggiore “aria” |
Rischi tecnici | Minimi | Intermodulazioni / aliasing |
Conclusione
L’audio ad alta risoluzione può offrire vantaggi tecnici e soggettivi, specialmente su sistemi hi-fi di fascia alta. Tuttavia, non è automaticamente “migliore”, e il beneficio dipende da ascoltatore, apparecchiature e contesto di ascolto. L’approccio migliore è sperimentare in prima persona e valutare in base al proprio orecchio e alle proprie esigenze.
Pubblicato il 25 Aprile 2025 in temporanea