il protocollo per l’audio nel cinema

REPLICHE di Fabrizio Calabrese a Simone Corelli

Interessanti, i dubbi di Simone Corelli sulle mie proposte per il protocollo per l’audio nel cinema: provvedo subito a chiarire, punto per punto.

1)- TONO DI CALIBRAZIONE- La registrazione professionale ed il rilevamento fonometrico dei livelli sonori sono due cose diverse: tuttavia è utile in entrambi i casi disporre di un riferimento certo (come non è affatto vero che lo sia un semplice valore “-X dB” riferito ad un fondo scala). Spiego meglio e rispondo alle prime obiezioni: il segnale sinusoidale continuo a circa 1000 Hz prodotto dai calibratori di precisione impiegati in ambito peritale è applicato direttamente sulla membrana del microfono; non è un caso che i microfoni di misura abbiano tutti dei diametri standard (1”, ½”, ¼”...): essi permettono di impiegare calibratori con imboccature a misura.

Dunque non vi è alcuna propagazione in aria, se non per pochi mm., né interferenze di fase... L’impiego di questi calibratori con i normali microfoni è possibile senza problemi solo per gli omnidirezionali di diametro inferiore ad 1” (25,4 mm.), tramite semplici adattatori in PVC tornito (che -per i diametri standard- sono sempre già a corredo del calibratore). Per tutti gli altri microfoni esistono due possibili alternative: la prima è quella di mettere a punto dei “calibratori” di maggiore capienza (è più facile di quanto si possa immaginare), mentre la seconda è semplicemente quella di prendere per buoni i dati di sensibilità dichiarati dalla casa costruttrice. Non dobbiamo dimenticare che la necessità di livelli di precisione pari a mezzo deciBel o meno, esiste solo in ambito peritale...
Per calibrare una catena di registrazione non sono affatto richieste tolleranze di questo ordine, ed anche un semplice generatore di segnale, attenuato in modo di fornire un tono ad 1 KHz alla stessa tensione ed impedenza d’uscita del microfono scelto, sarà più che sufficiente per effettuare la calibrazione. Vedremo più avanti quanto grande sia l’utilità che segue tanto piccolo incomodo.

Il motivo per cui si utilizza un tono sinusoidale continuo a 1 KHz è che in questo modo si ottiene esattamente lo stesso risultato con qualsiasi curva di ponderazione (A-B-C-Lin.) e con qualsiasi costante di tempo (Fast-Slow-Leq.). Un tono sinusoidale ha poi il vantaggio di avere un fattore di cresta minimo e –soprattutto- certo: i sostenitori dell’impiego del Rumore Rosa troppo spesso ignorano che è possibile produrre (e definire) Rumore Rosa con fattori di cresta che vanno da appena sei dB ad anche 24-30 deciBel... una vera sfida al concetto di “standard”.

2)- UTILITA’ DELLA CALIBRAZIONE- Per ogni umana attività è sempre possibile operare nel modo che favorisce al massimo grado ogni tipo di errore: per esempio l’idea di ancorare tutti i livelli di registrazione ad un solo “riferimento” non è affatto male, in questa prospettiva...
Proviamo ad immaginare il fonico di presa diretta che registri di seguito una scena di conversazione a due in interno, poi i due personaggi che parlano tra loro, ma in auto, poi una scena d’azione con rumori forti ed esplosioni, intervallate talvolta da urla, talvolta da semplice parlato, a livello questa volta necessariamente più sostenuto. Naturalmente egli disporrà di più tracce, con microfoni più o meno vicini al singolo personaggio, talvolta radiomicrofoni indossati.
Allineando tutti i livelli su un unico “riferimento”, il fonico finirà per collocare i dialoghi su livelli assai differenti, nelle diverse scene, rischiando sempre la saturazione, con i rumori.
In sede di post produzione, un altro fonico dovrà rimediare “ad orecchio”. Ci riuscirà bene solo alla condizione di disporre di ascolti timbricamente neutri e che restino tali a qualsiasi livello d’ascolto (vedi avanti, al punto n.9). Un altro fonico potrà allineare i livelli assai diversamente, per esempio perché opera in uno studio più silenzioso, o in cuffia, oppure semplicemente perché i rumori di bassa frequenza non vengono riprodotti dai suoi ascolti (ma poi, nei cinema, sovrasteranno inesorabilmente i dialoghi...).

Nel caso delle registrazioni calibrate scomparirà una prima fonte di errori: la pista dei rumori, calibrata per 130 deciBel di Picco Lineare (cioé non-RMS e non-pesato) verrà saturata solo dai rumori che in ogni caso non sarebbe possibile riprodurre nelle sale cinematografiche. Questa non è affatto una semplificazione da poco: nei rari casi di superamento, almeno si accerta l’esistenza di un problema, che potrà essere affrontato in diversi modi, poiché è stato individuato per tempo.

Nel caso delle tracce di dialogo, ma calibrate, la distinzione tra urla e dialoghi sottovoce sarà riportata pari pari nelle registrazioni, per cui ogni intervento di riallineamento potrà essere eseguito sia “ad orecchio” che tenendo conto delle distanze, sia di ripresa audio che nell’inquadratura.
La maggiore differenza pratica tra questo modo di operare e quello tradizionale è quella per cui sarà molto più facile mantenere la vera dinamica dei dialoghi nel mix da destinare alle sale digitali, ed altrettanto facile “spianare” tutto, per le colonne sonore da fruire in ambiti domestici.

Il fatto di poter eseguire in ogni momento una verifica dei livelli assoluti (con un economico fonometro di Classe-2) consentirà al fonico di post-produzione di valutare assai meglio l’eventuale fastidio provocato da dialoghi troppo alti o la scarsa intellegibilità di quelli di livello troppo basso (non dimentichiamo che il livello di rumore di fondo nei cinema è necessariamente diverso da quello in qualsiasi regìa, anche per distribuzione spettrale e relativo potenziale di mascheramento).
Come si fa –altrimenti- a valutare il “fastidio”, se la posizione del controllo di volume degli ascolti è arbitraria ???

3)- LIVELLI IN SEDE DI POST PRODUZIONE- Il termine “assemblaggio” è obiettivamente bruttino, ma occorre trovare il modo di distinguere tra tutte quelle operazioni di post-produzione che comportano interventi sui livelli sonori (relativi) potenzialmente irreversibili, dalle altre operazioni di editing, come il semplice montaggio. Si accettano suggerimenti.

4)- LIVELLI DI PICCO LINEARE NELLE SALE DIGITALI- Per raggiungere un determinato livello di Picco Lineare in una sala cinematografica è possibile impiegare tutte le risorse disponibili, cioé i 3 (o 5) canali frontali, i “surround” ed i Sub (LFE), ma occorre tener presente che le energie si addizionano in fase tanto meglio quanto più bassa è la frequenza emessa (il che mette in gran parte fuori discussione i “surround”). A frequenze medie ed alte sono possibili effetti di addizione, ma anche cancellazioni. Occorre anche pensare ai transienti da un punto di vista appena un poco più “matematico”: essi sono inevitabilmente caratterizzati da spettri larghi e “pieni”, diversamente dalle emissioni dei più comuni strumenti musicali, che, analizzate spettralmente, presentano il più delle volte la sola fondamentale ed un numero di armoniche, di vari livelli, ma separate da intervalli di spettro relativamente poco energetici.
I rumori –transienti o stabili che siano- tendono tutti a presentare spettri omogenei, cioè privi di componenti dominanti: in questi casi è possibile ipotizzare che gli effetti delle interazioni di fase positive tra più sorgenti e quelli delle cancellazioni tendano ad eguagliarsi, con il risultato di una semplice addizione delle energie. Il problema si fa più concreto quando si affrontano le specifiche degli ascolti, ma il margine di 3 volte (che si ottiene se si considera uno solo invece che 3 diffusori retroschermo) costituirà una riserva di dinamica, al di sopra del livello di Picco Lineare in specifica.

5)- LIVELLI DI PICCO LINEARE NEGLI IMPIEGHI DOMESTICI- I 110 deciBel di Picco Lineare proposti come valore di riferimento si spiegano facilmente: i livelli d’ascolto (musicali) domestici sono in gran parte compresi tra 80 ed 85 deciBel (RMS, cioé LEQ Lineare), per cui i livelli di Picco Lineare seguono con il rapporto presente nelle “normali” incisioni (15-20 dB), di qui i 110 deciBel, che è bene un impianto audio domestico possa raggiungere, senza clipping.
Nelle “Listening Conditions for the Assessment of Broadcast Programmes” dell’EBU (1993, pag.7) si specifica un Livello di Riferimento Lref = 85 – 10 Log (n), dove “n” è il numero di canali.
Ai 110 dB di Picco Lineare si perviene anche attraverso un’altra via: i diffusori domestici hi-fi hanno rendimenti tipici compresi tra 87 e 93 dB/1W/1m, con ampli le cui potenze di picco (il doppio del valore RMS delle specifiche) vanno da 50 a 200 W (da +17 a +23 dB ref. 1 W), per cui i livelli di Picco Lineare ad un metro sono appunto pari a 110 dB, in media. In casa si ascolta tipicamente con due diffusori e a due-tre metri di distanza, ma in ambienti la cui “distanza critica” è tipicamente pari ad un metro o pochissimo più: ancora una volta risultano 110 dB di picco, alla posizione d’ascolto (applicando l’equazione di Hopkins Stryker). Nulla vieta di dotarsi di impianti di maggiore potenza o rendimento, che possono per esempio consentire livelli d’ascolto da discoteca (10-15 dB superiori), ma se i missaggi dei brani musicali di più larga diffusione venissero allineati per questo tipo di ascolti, allora l’unica scelta praticabile dalla maggioranza degli ascoltatori domestici sarebbe quella di abbassare il controllo di volume, per non far clippare l’ampli, ascoltando un suono “fiacco”, cioé di livello inferiore ad 80-85 deciBel, che è il valore di SPL sotto il quale l’orecchio umano inizia a perdere sensibilità alle basse frequenze, progressivamente.

6)- LIVELLI DI PICCO LINEARE DEGLI IMPIANTI “HOME THEATRE”- Rivolgendosi ad esperti di audio, dovrebbe essere del tutto sottinteso che è semplicemente impensabile che diffusori con woofers da 6-8 cm. possano riprodurre linearmente gli stessi livelli di Picco Lineare normalmente praticabili con gli impianti hi-fi di 15-20 anni fa. In questi anni, tuttavia, l’uso dei compressori digitali e dei programmi di “massimizzazione” ha consentito di contenere i livelli di picco di quei 10-12 deciBel che hanno appunto reso possibile il successo commerciale dei piccoli diffusori home-theatre: essi possono raggiungere gli stessi livelli medi d’ascolto dei tradizionali impianti hi-fi, ma solo alla condizione di riprodurre brani compressi nei picchi.

7)- IL PROBLEMA DEI “METADATA”- Non sono a conoscenza degli sviluppi più recenti in materia di “metadata”, ma se il margine di manovra che essi consentono è davvero di appena 4 (quattro) deciBel, allora si può veramente scherzare sulla montagna che ha partorito un topolino...
Scherzi a parte, la differenza tra la dinamica di una colonna sonora adatta ad una sala digitale e quella riproducibile in ambito domestico è –già attualmente- ampia quanto basta a mettere del tutto fuori discussione l’inutilità di “metadata” di proporzioni così ridotte.
Piuttosto, questi “metadata” si possono impiegare più lucidamente per allineare i livelli medi del parlato cinematografico, che possono –come i livelli reali- variare entro un intervallo troppo ampio per essere accettabile in ambienti domestici, specie nel caso di ascolti notturni. Egualmente preziose potrebbero rivelarsi le possibilità di allineare anche gli inserti musicali (e gli spot) su un valore costante, p.es. 70 dB”A” Leq., ma con la possibilità per l’utente di programmare livelli diversi, in corrispondenza di ciascuna tipologia. Le implicazioni commerciali sono immaginabili, per cui è del tutto possibile che la Dolby si sia dovuta adattare più di quanto la semplice logica suggerisse.
Il problema è che –così facendo- non si semplifica affatto la vita ai fonici ed ai tecnici di post produzione, e vi è il rischio concreto che si rimedi all’errore tra qualche anno (di caos...).
Avendone noi oggi la possibilità, chiariamoci –per favore- le idee: anche alla Dolby non potranno che apprezzare un proposta sensata e praticabile !

8)- IL PROBLEMA DEI MISSAGGI- Un esempio rende bene l’idea: due diversi fonici allineano i livelli relativi dei dialoghi e dei rumori di scena (o Foley) per una scena d’azione. Uno dei due opera in una regìa con ascolti ben dimensionati, p.es. in grado di riprodurre 128-130 deciBel di Picco Lineare, mentre l’altro opera in una saletta di post-produzione, con due normali ascolti di tipo simil-domestico, che sopra 110 dB vanno in crisi alla grande. E’ evidente che il secondo fonico non potrà mai allineare il livello dei rumori in proporzioni realistiche, e tali da sfruttare a fondo le risorse dinamiche disponibili nelle sale moderne, se non estrapolando con molta fantasia.
Ancora una volta il nuovo “protocollo” va in soccorso agli operatori, semplificando i compiti e creando le premesse per evitare gli errori più comuni: la regola che qui scaturisce è quella per cui tutti gli interventi di allineamento irreversibili (p.es. quando si sommano più tracce) è bene siano eseguiti controllando il risultato con ascolti allineati sui livelli reali e con capacità dinamiche analoghe a quelle degli apparati di riproduzione finali.

9)- LE CARATTERISTICHE DINAMICHE DEGLI ASCOLTI- La specifica dell’omogeneità delle prestazioni dinamiche di un diffusore monitor è tutt’altro che “una definizione molto personale”, ma un requisito logico di importanza fondamentale, per l’impiego sul campo.

Ancora una volta un esempio –un caso reale- rende meglio l’idea. Tempo fa mi recai a casa di un amico, per ascoltare il suo prestigioso e costosissimo impianto audio, i cui diffusori impiegavano due trombe diritte per la gamma delle frequenze medie ed alte, filtrate passivamente, mentre i due Subwoofers erano di tipo attivo. Al primo ascolto l’equilibro generale sembrava corretto, perlomeno per il pop-rock, ma non appena compariva l’emissione di un contrabbasso, di un violoncello o di un trombone, essi apparivano tutti privi di corpo. Un semplice rilevamento della curva di risposta con Rumore Rosa ed in terzi d’ottava chiarì la causa: l’incrocio tra Sub e medio-bassi era troppo aperto ed il livello dei Sub era più alto di 8-9 dB rispetto a medi ed alti. Il problema venne quindi risolto semplicemente operando sui controlli dei Sub ed ottenendo una riposta quasi perfettamente lineare.

Al successivo ascolto i contrabbassi ed i tromboni ricomparvero nel loro splendore, ma l’equilibrio complessivo che si percepiva con la regolazione precedente (che era stata effettuata verosimilmente “ad orecchio”) era andato irrimediabilmente perduto, specie per i brani di musica pop-rock.
La misura che ha permesso di chiarire le origini del problema è la stessa che ho proposto e che ha suscitato i dubbi finali di Simone Corelli, per cui ne anticipo la spiegazione.

 

La Fig.1, qui sopra, mostra la sequenza di campioni digitali (a 44,1 KHz) delle due mezze sinusoidi impiegate per testare i livelli di picco degli ascolti: come si vede, si tratta di segnali impulsivi, caratterizzati da uno spettro lineare fino a poco meno di 2 KHz., poi decrescente. E’ stata impiegata la sola metà superiore di una normale sinusoide, ma è bene alternare anche le metà inferiori, ad intervalli non inferiori a 300 millisecondi tra loro. L’impiego di due mezze sinusoidi di durata diversa è necessario per riempire i vuoti spettrali alle alte frequenze di ciascuna, con i picchi dell’altra: esse si alterneranno in sequenza e tra i due canali.

 

La Fig.2, qui sopra, mostra lo spettro di due diverse sequenze di questi impulsi, riprodotte con la regolazione del livello d’ascolto variata di 18 deciBel, da una sequenza all’altra, in modo di raggiungere la saturazione di uno dei due amplificatori, vale a dire di una delle due vie, per la sola sequenza al più alto livello.

Il risultato dell’analisi dei due spettri concorda perfettamente con quanto percepito all’ascolto.

La differenza di livello è mantenuta intatta solo in gamma media, grazie al rendimento delle trombe, mentre gli amplificatori interni ai Sub raggiungono la piena potenza quasi 20 dB prima di quanto necessario ad eguagliare le doti dinamiche di medio-bassi ed alti (la cui gola, ristretta, fa tuttavia la sua parte, agli alti livelli).

ATTENZIONE: la linearità della curva non ha che una minima pertinenza con l’analisi dei risultati: infatti gli impulsi sono stati equalizzati in modo di simulare lo spettro tipico delle incisioni musicali di pop rock, ma anche delle colonne sonore digitali di film d’azione, con un dislivello di 10 dB a favore della banda compresa tra 30 e 250 Hz. ed una graduale attenuazione sopra 2 KHz.

QUEL CHE INTERESSA E’ L’INVARIANZA DELLO SPETTRO AL VARIARE DEL LIVELLO SONORO. Nel caso di questo impianto, ad esempio, se si allineano i due Sub su un livello 10 dB superiore a quello dei medi ed alti, allora quando il loro amplificatore viene condotto in saturazione, dai transienti, la resa si equilibra (in media) e risulta assai più accettabile di quando, allineando correttamente le due diverse vie (ma –necessariamente- solo a basso livello), i transienti di livello più alto sono riprodotti e percepiti come sono, sbilanciati in favore della gamma media.

Ora proviamo ad immaginare il disastro che compirebbe inevitabilmente il fonico che operasse un missaggio con ascolti di questo tipo (che però costano poco meno di 20.000 Euro...).
Immaginiamo –come probabile- che l’impianto sia stato equalizzato ai soliti 83-85 dB”C”, cioé ad un livello ancora praticabile per gli ampli dei Sub. La risposta sarà dunque perfettamente lineare.
Se i dialoghi saranno stati registrati linearmente, essi emergeranno ancora tali all’ascolto e saranno dunque correttamente missati dal fonico. Diversissima sarà la situazione per musica e rumori, se i livelli saranno quelli di una colonna sonora digitale: in questo caso il fonico sentirà una netta carenza di basse frequenze, cui rimedierà enfatizzando la banda sotto 200-250 Hz. A questo punto solo un improbabile miracolo potrà salvare questa colonna sonora, una volta giunta in sala: se anche l’impianto del cinema avrà infatti lo stesso comportamento dinamico, allora l’unica conseguenza sarà un bella percentuale di clipping per gli ampli dei sub (e dei bassi dei tre canali retroschermo), mentre l’equilibrio timbrico generale non sarà poi tanto diverso da quello scelto dal fonico.

Paradossalmente, il caso peggiore sarà quello della visione (e dell’ascolto) in una sala dotata di un impianto audio pienamente conforme alle specifiche Dolby Digital, cioè con Sub in grado di emettere livelli di picco di almeno 10 dB superiori a quelli consentiti ai canali retroschermo.
In queste sale, la nostra colonna sonora suonerà cupa e rimbombante, con possibili problemi di intelligibilità del parlato, sovrastato dai rumori nelle scene d’azione.

Questo è, naturalmente, soltanto un esempio. In pratica si possono presentare situazioni tra le più disparate, specie nel caso di diffusori dotati di amplificazioni interne e di limitatori (che così agiscono indipendentemente, per ogni banda). Nulla esclude che il progetto di questi diffusori abbia tenuto conto di questi aspetti, curando l’allineamento dei livelli di saturazione: poche aziende rinuncerebbero però a farne ampia luce su depliant e siti, visto il possibile ritorno pubblicitario.

10)- LA CONDIZIONE DI IMPIEGARE AMPLIFICATORI DI POTENZA BEN DEFINITA-
Già l’esempio appena commentato ci suggerisce il motivo per cui la potenza degli amplificatori di un sistema di monitoraggio non può essere scelta a caso, nei sistemi multivie o con Sub. Se infatti l’amplificatore dei medio-alti, collegato alle trombe, avesse avuto una potenza così ridotta da farlo entrare in saturazione agli stessi livelli cui satura l’ampli del Sub, allora la resa dell’insieme ampli diffusori sarebbe evidentemente rimasta equilibrata a qualsiasi livello d’ascolto (fatta salva la prevista perdita di dinamica, che in fondo è meno nefasta dello sbilanciamento di prima).

Ventisei anni fa mi accorsi dell’importanza di questo aspetto mentre progettavo e seguivo nell’uso gli impianti di monitoraggio di palco di Scossa ed HQ (e confesso che mi guardai bene dal pubblicare il tutto...). Chiunque voglia sperimentare può farlo facilmente scambiando un piccolo ampli a valvole con un finale di potenza convenzionale, in qualsiasi impianto a due o più vie attive, specialmente se il rendimento dei trasduttori è identico o assai simile. A seconda della direzione in cui si opera lo sbilanciamento dinamico, la tendenza all’ascolto sarà sempre quella di tentare compensare il tutto con un allineamento erroneo tra le due vie, che però distruggerà l’equilibrio timbrico ai bassi livelli d’ascolto.
Ma c’è davvero qualche fonico che aspiri a lavorare in queste condizioni ???

Quanto al dubbio di Simone Corelli sul fatto che la potenza debba essere “SUFFICIENTEMENTE ALTA”, mi spiace deluderlo, ma è vero esattamente il contrario... Allineando le potenze di amplificazione per eguagliare i livelli di picco della via con i trasduttori più efficienti, si finisce, nove volte su dieci, per applicare potenze insostenibili agli altri trasduttori, specialmente in termini di linearità ed escursione. Per esempio, il caso dell’impianto hi-fi appena commentato, con trombe da 105 dB/1W/1m ed ampli da 50 Watt di picco, avrebbe richiesto un ampli da 1600 Watt di picco (800 Watt RMS) sui sub, cioé una potenza insostenibile, a meno di 50 Hz, per due coni da 10”.
Se invece lasciamo gli originali 250 Watt di picco sui Sub, occorreranno 8 Watt di picco sui medio alti, vale a dire il solito monotriodo a riscaldamento diretto che gli appassionati di hi-fi esoterica adottano normalmente (guarda caso...) con questi diffusori.

11)- UNA PARENTESI- Gli appassionai di hi-fi vengono spesso trattati con troppa ironia dai “professionisti”: se alcuno dei miei amici fosse stato presente all’ascolto delle registrazioni di organo, l’avremmo dovuto rianimare a grappe... Voglio proporre un’ipotesi scandalosa: perché non prestarmi una copia della registrazione meno manipolata (quella con i due Neumann cardioidi), in CD, in modo di poter provare a riascoltarla sul nuovo impianto dello stesso amico, che, dopo la prova di cui abbiamo parlato, si è subito deciso a cambiare modello, scegliendone uno con Sub e ampli di potenza maglio proporzionata... ?

12)- UN ESEMPIO DI SPECIFICA- Il caso vuole che l’amico appassionato di hi-fi, una volta individuata con certezza l’importanza e la causa dello sbilanciamento dinamico del suo impianto, abbia provveduto (ieri...) a rimandare indietro i precedenti diffusori, acquistandone un modello superiore, dotato di Subwoofers più efficienti ed ampli di potenza assai maggiore.

 

La Fig.3, qui sopra, mostra lo spettro di due diverse sequenze d’impulsi equalizzati, riprodotte con la regolazione del livello d’ascolto variata di 12 deciBel, con il nuovo impianto (un canale). Come si può osservare, le due curve sono quasi perfettamente parallele. L’unica traccia di compressione si intravede al di sotto di 100 Hz, ed è verosimilmente causata dal fatto che la risposta è equalizzata.
Il livello di Picco Lineare è, questa volta, di ben 115 deciBel, nonostante l’ampli della sezione medio-alti abbia una potenza di appena 20-25 Watt (un monotriodo...). All’ascolto il nuovo impianto è equilibrato, sia a basso che ad alto livello, senza dover ricorrere ad alcun ritocco nell’allineamento tra Sub e medio-alti (che è stato regolato per la massima linearità).

Naturalmente, esisterà la possibilità di “sbilanciare” dinamicamente anche questo sistema di diffusori, che hanno i due Sub amplificati: semplicemente basterà eliminare il finale monotriodo per la gamma medio-alta, sostituendolo con un ampli di potenza p.es. venti volte maggiore.
Se infatti osserviamo con attenzione la coppia di grafici di Fig.3, noteremo che le due curve distano esattamente 12 dB, ma solo dai 100 Hz. in su, mentre a frequenze inferiori siamo già arrivati al limite di emissione (dato dal prodotto della potenza di picco egli ampli interni, moltiplicata per il rendimento dei trasduttori), ed infatti le due curve distano in media 9 deciBel. Se dunque adotteremo un ampli 20 volte più potente per la gamma medio-alta, non possiamo assolutamente aspettarci lo stesso incremento di dinamica (cioè dei livelli di Picco Lineare) per i Subwoofers...

Questo tipo di specifica potrà anche meritare l’aggettivo di “personale” (che qui rappresenta una specie di riconoscimento...), ma, per quanto si vada ad esaminare ogni possibile alternativa, nessuna di esse condivide tutti i pregi di questa, che sono:
a)- Impiego di fonometri calibrati e certificati: il livello di Picco Lineare è preciso e ripetibile.
b)- Impiego di segnale impulsivo: esso non attiva che in minima parte il campo riverberato.
c)- Impiego di segnale che non necessita di post elaborazione e di traduzione grafica; (chi ha mai operato con analizzatori MLS/TDS/FFT sa quanto la grafica sullo schermo influenzi il giudizio).
d)- Segnale di prova innocuo per tutti i diffusori, in quanto impulsivo ed equalizzato.
e)- Possibilità di rilevare a distanze prossime alla “distanza critica”, in ambiente.
f)- Inclusione, nel risultato, delle primissime riflessioni (dalle pareti adiacenti i diffusori).

MA IL PREGIO FONDAMENTALE DI QUESTA TECNICA DI MISURA E’ QUELLO DI CONDURRE AD UNA INTERPRETAZIONE UNIVOCA E COMUNE. Due diversi esperti, che esaminino i risultati di una coppia di rilevamenti come questi, perverranno esattamente alle stesse conclusioni: a loro è infatti richiesto di individuare soltanto gli scostamenti dal parallelismo di due curve, graficate sullo stesso foglio e con la stessa scala. Anche variando l’equalizzazione del segnale di prova, il criterio interpretativo resta stabile (ma occorre estrapolare allo spettro tipico delle condizioni d’impiego previste, cosa che viene automaticamente se si equalizzano gli impulsi).

SI TRATTA ANCHE DI UNA TECNICA DI MISURA RESISTENTISSIMA AGLI ERRORI-
Provare per credere...! Un primo esperimento potrà essere quello di utilizzare le più diverse ed eterogenee finestrature temporali, per l’analisi spettrale: il risultato coincide entro meno di un deciBel passando dalle finestre di Hanning, Hamming, Blackman-Harris, ed altre ancora.
Un secondo esperimento sarà quello di comparare gli spettri dei più diversi brani musicali e dei più diversi film; occorre non dimenticare che ci stiamo occupando del limite superiore della dinamica, per cui gli spettri da rilevare saranno quelli delle scene d’azione o dei brani musicali potenzialmente in grado di mettere in difficoltà gli ascolti... Ebbene anche una piccola orchestra di mandolini e chitarre (con una batteria suonata pianissimo), registrata dal vivo, mostra uno spettro con la gamma bassa (da 30 a 200 Hz) sollevata di qualche deciBel, rispetto alla gamma media (fino a 1-2 KHz), al di sopra della quale si osserva la solita graduale attenuazione. La conferma della vera e propria “necessità” di emettere questo tipo di spettro, che è l’unico accettabile agli alti livelli d’ascolto, viene sia dalle specifiche Dolby Digital (che prescrivono 10 dB di margine in più per il canale LFE, cioé per i Sub), sia –per noi- dalla recente esperienza dell’ascolto delle registrazioni d’organo, un caso in cui la mancanza della predominanza della banda 30-200 Hz. si scontava con un evidente fastidio, specie agli alti livelli d’ascolto.
Un terzo esperimento lo si può effettuare variando la distanza di misura. Se si rileva la curva di risposta di un diffusore in ambiente con un segnale continuo (sinusoidi o Rumore Rosa), occorre andare veramente vicino ai trasduttori per non veder comparire picchi e buche causati unicamente dalle interferenze di fase tra emissione diretta e riflessioni: più precisamente occorre rilevare ad una distanza inferiore (almeno la metà) rispetto alla “distanza critica”, che è la distanza alla quale l’energia del campo riverberato eguaglia quella emessa direttamente dal diffusore, incrementandone il livello di tre dB rispetto a quello che si rileverebbe all’aperto, cioè in assenza riflessioni.
Se invece si impiegano segnali di prova di breve durata, come le mezze sinusoidi suggerite, e si ha l’accortezza di riprodurne una sequenza con ampi intervalli (p.es. 300 ms.), allora il campo riverberato non ha modo di attivarsi, e quindi non interferisce che minimamente, anche a distanze eguali o poco superiori alla “distanza critica”, cioè alle tipiche distanze d’ascolto in regìa.
Il quarto esperimento, il più convincente, forse, è quello di provare ad effettuare la stessa specifica utilizzando analizzatori di FFT bicanale, o sistemi MLS: un incubo ! Poco meglio se si opera in Time Delay Spectrometry, ma occorre davvero esperienza per passare dai dati rilevati ai valori effettivi dei limiti superiori della dinamica, per l’insieme ampli-diffusori-ambiente.

INFINE UN DUPLICE APPELLO:

Quando sui due piatti di una bilancia si pone, da una parte, un requisito logico concretissimo e necessario per favorire le condizioni di lavoro e la qualità del risultato finale che ne deriva, e, dall’altra parte, un collage eterogeneo di norme e raccomandazioni (talvolta provenienti da aziende del settore, come lo “standard” Dolby Digital), la tentazione è -il più delle volte- quella di fare il più possibile a meno di pensare a cosa si fa e di valutare, invece, all’autorevolezza (presunta o reale) della fonte normativa. Chiunque abbia operato la certificazione dell’isolamento di facciata (previsto dal DPCM 05/12/97), seguendo le complesse norme e procedure ISO, sa bene che il risultato finale è quanto di più “Standard” si possa immaginare, ma è fuorviante di appena un centinaio di volte rispetto a quello che si ascolta, di persona ed in loco, o a quello che i misura con tecniche assai più “ruspanti”. Per cui, ben vengano le certificazioni ISO, ma se lo scopo è quello di trarne delle deduzioni di carattere operativo, come nel nostro caso, allora i risultati devono essere perfettamente verificabili sul campo ed all’ascolto.
Ebbene, due diffusori che abbiano la stessa curva di risposta (rilevata con qualsiasi tipo di strumento o tecnica di misura) possono produrre sensazioni all’ascolto assolutamente differenti, se le loro capacità dinamiche sono differenti. Questa sembra un’affermazione banale, ma alle spalle delle registrazioni compresse e prive di respiro di questi ultimi 15-20 anni, ci sono altrettanti anni di “ascolti” simil-domestici spacciati per monitor da studio e di fonici che serenamente affermavano che “i grandi monitor non suonano”, semplicemente perchè il missaggio effettuato sulle minicasse tirava fuori tutti i suoi limiti, oppure, nel migliore dei casi, perché i “grandi monitor” erano degni di essere definiti con ben altro titolo (p.es. “grossi”...).

Il secondo appello è quello a smettere di considerare il mondo dell’audio per il cinema come la punta di diamante della tecnologia e –soprattutto- della cultura in campo elettroacustico: un segnale d’allarme lo avrebbe dovuto dare, da tempo, la constatazione che si va proponendo -da trent’anni di seguito- la stessa configurazione di diffusori, nei cinema di qualsiasi capienza e misura, mentre i trasduttori hanno subìto, nel frattempo, un’evoluzione tale da incrementane le prestazioni di più di 10 volte. Si vuole con ciò affermare che le solite scatole di legno con quattro buchi, per i bassi, e le solite trombe rappresentano il non plus ultra ? Oppure è più probabile che i reparti progettazione della (sola ?) azienda che li produce siano stati semplicemente dismessi 30 anni fa, con sentiti ringraziamenti alla benevolenza degli acquirenti, per il grande risparmio ?

Se nuovi protocolli operativi e nuove specifiche tecniche potranno portare una ventata d’aria fresca e di rinnovamento, allora contribuiamoci tutti, nel comune interesse.
Fabrizio Calabrese