Ambiente Risorse Salute
Maggio '99


Sette nuovi prodotti del programma Esprit

I computer eseguono i comandi vocali in ambienti rumorosi.
Questi prodotti sono pronti per il mercato europeo.

Da qualche anno si trovano sul mercato prodotti per il riconoscimento vocale dei comandi impartiti ai computer. Alcuni sistemi comprendono solo un numero limitato di parole, indipendentemente da chi le pronuncia, altri invece comprendono molte parole, ma vanno "educati" perché riconoscano la voce del "padrone". Tra questi ultimi, bisogna distinguere tra quelli per cui la dettatura dev'essere chiara e deve separare ciascuna parola dalle altre, e quelli che riconoscono il parlato continuo.

I progressi fatti in questo campo sono sicuramente rilevanti, ma tutti i sistemi hanno difficoltà insolubili per comprendere ciò che viene detto loro quando l'ambiente circostante è rumoroso, fatto che ne limita l'uso. I sistemi che riconoscono solo poche parole potrebbero essere meglio valorizzati se operassero efficacemente in ambienti rumorosi. Ad esempio nelle officine meccaniche, dove per le procedure diagnostiche vengono utilizzati dei computer, spesso i meccanici si trovano a dover azionare la tastiera mentre hanno entrambe le mani occupate: se i comandi fossero vocali, la loro produttività aumenterebbe. Ma se è vero che la tecnologia che consente di comprendere i comandi è ormai matura, è anche vero che trova un ostacolo nella presenza del rumore. Nessuno degli attuali sistemi può obbedire ai comandi vocali all'interno di un'officina, proprio a causa del rumore.
Si può dire che oggi i computer sentono bene, ma che il loro udito è seriamente compromesso in presenza di rumore.
Riabilitare il computer
Per sormontare tale ostacolo, il 1° novembre 1995, nell'ambito del programma Esprit, è stato lanciato il progetto IVORY. Secondo Pedro Gómez Vilda, del Politecnico di Madrid, "l'obiettivo è produrre una piattaforma (macchine e software) a basso prezzo per la creazione di sistemi di riconoscimento vocale che sopportino il rumore". Il progetto si è concluso nell'aprile del 1998 ed ha raggiunto i suoi obiettivi.
I computer sono ormai in grado di interpretare comandi (parole singole) impartiti da qualunque voce, in ambienti estremamente rumorosi come sale giochi di realtà virtuale, officine meccaniche, fabbriche, cabine di comando di aerei o di treni in marcia. Inoltre sono stati creati strumenti per realizzare in modo semplice sistemi con funzioni specifiche, ad esempio il controllo delle sedie a rotelle di disabili da parte di persone la cui dizione non è perfetta.

Il progetto ha sviluppato 7 prodotti pronti per la commercializzazione.
- Una scheda per computer con i componenti specifici per il riconoscimento vocale, installabile su vari tipi di macchine, mediante bus PCI o porte seriali.
- Programmi di gestione della scheda per due sistemi operativi standard, DOS e Windows 95.
- Uno strumento di sviluppo che consente di creare in forma semplice nuovi sistemi di riconoscimento per gruppi che utilizzano particolari linguaggi, ad esempio i bambini.
- Un database per riconoscere 109 parole pronunciate da un gruppo che parli un inglese standard. Le parole sono state ottenute tenendo conto delle caratteristiche di 24 persone di età, sesso e registro vocale differenti. Sono tuttora in costruzione altri database, con altre parole ed altre lingue (spagnolo, italiano, francese). Va sottolineato che è possibile l'inserimento di parole "su misura".
- Un database dei comandi più utilizzati, quali GO, STOP, LEFT, RIGHT, UP, DOWN, i numeri da 0 a 9 e le lettere dalla A alla Z.
- Algoritmi di eliminazione del rumore per diversi microprocessori. - Un identificatore di comandi singoli, in quanto la soluzione IVORY fa parte dei sistemi che riconoscono un numero limitato di parole pronunciate singolarmente da un parlante qualsiasi.
Tuttavia rimangono ancora molti aspetti da sviluppare. È necessario infatti reperire un canale affidabile per gli ordini che i piloti d'aereo impartiscono ai propri strumenti, che richiedono una sicurezza totale in un ambiente rumoroso. La stessa soluzione verrà utilizzata negli spostamenti con il telefono portatile, soprattutto in auto, per evitare le interferenze con i rumori della circolazione, come accade invece oggi.

Un altro obiettivo è quello di eliminare le interferenze tra operatori che lavorano simultaneamente, ad esempio gli agenti di borsa. L'idea è isolare un operatore eliminando il rumore emesso dagli altri.
Il sistema IVORY ha inoltre la possibilità di visualizzare la forma delle parole, caratteristica che dovrebbe consentire lo sviluppo di applicazioni futuriste. Ad esempio, i non udenti hanno sempre difficoltà ad imparare a parlare poiché manca loro la possibilità di riascoltare le parole che imparano. Con un sistema di questo tipo potranno vedere le parole ed affinarne la pronuncia; lo stesso principio potrà essere applicato all'insegnamento delle lingue straniere.
Fonte VIPS