Audio Digital Signal Processing: techniques and applications

Belardinelli, Carlo

Utilizza questo identificativo per citare o creare un link a questo documento: http://hdl.handle.net/2307/501

Titolo:	Audio Digital Signal Processing: techniques and applications
Autori:	Belardinelli, Carlo
Relatore:	Giunta, Gaetano
Data di pubblicazione:	3-apr-2009
Editore:	Università degli studi Roma Tre
Abstract:	Dottorato in Ingegneria dell'Elettronica Biomedica, dell'Elettromagnetismo e delle Telecomunicazioni (XXI Ciclo) Università di Roma3 Rome, Italy Audio Digital Signal Processing: techniques and applications Carlo Belardinelli Tutor Professor Gaetano Giunta Abstract In questa tesi viene descritta la mia attività di ricerca durante il corso di dottorato in Elaborazione Elettronica del Segnale Audio. Durante questi tre anni ho sviluppato il quadro di riferimento teorico in questo ambito e realizzando poi diverse applicazioni pratiche che vengono riportate in dettaglio nei capitoli seguenti dopo un'introduzione generale (Capitolo II). In particolare sono stati sviluppati i concetti seguenti: Nel terzo capitolo viene presentato un sistema di marchiatura digitale audio che permette la valutazione della qualità di una trasmissione in sistemi di comunicazione di terza generazione senza influire sul payload dei contenuti inviati né tantomeno peggiorare la qualità dei contenuti musicali trasmessi, sviluppato durante il primo anno di corso presso il dipartimento di Elettronica Applicata dell'Università di RomaTre: i risultati raggiunti confermano l'efficacia del sistema che ne permette l'applicazione in sistemi di comunicazione radio mobile di terza generazione (UMTS) e internet WIFI (IEEE 802.11). In particolare un watermark fragile viene inserito tramite tecniche spread-spectrum nel dominio DCT all'interno della regione delle frequenze medio-alte dei frame del segnale musicale. Il principio base dell'idea consiste nell'ipotesi che poiché marchio e segnale audio marchiato sono entrambi sottoposti alle stesse operazioni di codifica/decodifica e viaggiano sullo stesso canale di trasmissione, il livello di degradazione del watermark dopo la ricezione è supposto essere proporzionale al livello di deteriorazione subita dal segnale audio stesso. In ricezione è infatti a disposizione la versione originale del marchio (avente un payload trascurabile): una volta estratti i wateramrk ricevuti dai frame del segnale audio, questi vengono mediati di modo da ottenere un'unica versione del marchio ricostruito che puo' essere utilizzato come riferimento per il calcolo del QoS (Quality of Service) della trasmissione. Infatti, mentre l'uso del PEAQ (Perceptual Evaluation of Audio Quality, standard ITU BS-1387) è stato utilizzato per provare l'effettiva completa trasparenza del marchio all'udito umano, i risultati delle sperimentazioni testimoniano la sensibilità del sistema di marchiatura fragile proposto nell'ottenere una stima blind della bontà della comunicazione: l'errore quadratico medio del marchio (MSE), difatti, non solo si rivela essere proporzionale al numero di errori introdotti dal canale, ma é strettamente proporzionale all'errore quadratico medio del segnale audio rivevuto in cui é stato inserito. Nel periodo da visiting student presso il Signal Processing Lab della University of Cambridge (UK), ho implementato e verificato le prestazioni di un Phase Vocoder Probabilistico applicato alla ricostruzione dei campioni andati perduti all'interno di un file musicale. Nel quarto capitolo viene illustrato come questa applicazione abbia prestazioni incoraggianti per quel che riguarda la stima di informazioni musicali a contenuto informativo residuo nullo tramite strumenti di calcolo probabilistico-bayesiani. Dopo aver utilizzato il Phase Vocoder come modello generativo del segnale audio, viene definita la versione stocastica dello spazio di stato. Il Phase Vocoder Probabilistico permette l'applicazione di un filtraggio di Kalman e di uno smoothing secondo le equazioni di Rauch-Tung-Striebel. L'algoritmo di Expectation Maximization permette la derivazione di una procedura ricorsiva che permette infine di stimare iterativamente i parametri del suddetto spazio di stato che meglio approssimano i campioni mancanti tramite maximum likelihood. Infine presso il Fraunhofer Institut di Magdeburg in Germania ho sviluppato le ricerche sul tema "Interaction of Sound in Virtual Reality". In questo contesto: o Ho sviluppato e testato la funzione audio della piattaforma grafica per realtà virtuale, elaborata dal Virtual Development and Training Centre in seno all'Istituto stesso, che permette in maniera agile di ottenere suoni 3D all'interno di scenari virtuali (capitolo V). La core function è implementata utilizzando l'API OpenAL in maniera da rendere la realizzazione di contesti sonori virtuali, che si integrano con la rispettiva rappresentazione visiva, intuitiva ma al tempo stesso completa per la creazione e diffusione tridimensionale del segnale acustico. Per quanto riguarda il punto di vista dell'usufruitore degli scenari virtuali, la spazializzazione del suono è implementata in maniera efficace di modo tale che l'elaborazione sonora avviene real-time anche con hardware non dedicato. L' Audio Core Function permette innovativi usi del suono in rappresentazioni 3D che sono stati testati tramite diversi scenari virtuali qui di seguito riportate. o Ho ideato e implementato il workflow per un plugin che permetta di visualizzare nello spazio virtuale (in particolare all'interno della Digital Factory) il campo acustico, simulato in maniera fedele da efficienti strumenti di CAE appositi, generato da macchinari industriali (capitolo VI). Il livello di pressione sonora (SPL) viene calcolato in maniera fedele tramite accurate simulazioni ed elaborati strumenti di calcolo ricorrendo al Boundary e Finite Element Methods. I valori di SPL ottenuti al termine dell'analisi acustica possono venire importati facilmente dalla piattaforma di Realtà Virtuale, poiché vengono salvati in formato altamente editabile. In questo modo é possibilie verificare in 3 dimensioni la conformità di progetti di nuovi siti industriali alle norme sulle soglie di rumore in ambienti lavorativi e apportare eventuali correzioni (applicando anche tecniche di Active Noise Control, ANC), prima che la fabbrica sia concretamente realizzata. L'attività di ricerca da me svolta durante il dottorato è stata oggetto di presentazioni in conferenze internazionali (quali la IEEE European Signal Processing Conference 2006 a Firenze o l'IEEE Workshop on Application of Signal Processing on Audio and Acoustics 2007 a New Paltz, New York) e ha mostrato l'efficacia delle tecniche di DSP per quanto riguarda il segnale audio. Nella società odierna in cui si sovraccaricano i sensi -e quindi anche e soprattutto l'udito- di contenuti informativi, una migliore gestione del contenuto dell'informazione sonora può dunque essere una chiave per un progresso che aiuti effettivamente a vivere meglio.
URI:	http://hdl.handle.net/2307/501
È visualizzato nelle collezioni:	X_Dipartimento di Elettronica applicata T - Tesi di dottorato

File in questo documento:

File	Descrizione	Dimensioni	Formato
AudioDigitalSignalProcessing_techniquesandapplications.pdf		1.39 MB	Adobe PDF	Visualizza/apri

Visualizza tutti i metadati del documento Suggerisci questo documento

Page view(s)

290

checked on 21-nov-2024

Download(s)

431

checked on 21-nov-2024

Google Scholar^TM

Check

File in questo documento:

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM