DITELO: DIalogue over the TELephOne
Responsabile: Daniele Falavigna.
Obiettivi. Questo progetto ha l'obiettivo di realizzare sistemi che consentano interazioni flessibili per l'accesso ad informazioni in domini molto ristretti, mediante il riconoscimento automatico della voce su linea telefonica. Durante il 1998 sono stati realizzati un centralino automatico, installato in Caritro a dicembre 1997 e migliorato durante il 1998, ed alcuni prototipi di sistemi di dialogo su linea telefonica. Sono inoltre iniziate due commesse, VOX e ATP, finanziate da entità esterne, entrambe incentrate sulla realizzazione di sistemi/prototipi di dialogo per l'accesso ad informazioni su linea telefonica. La commessa VOX ha caratteristiche più applicative, tendendo alla realizzazione di librerie software per l'integrazione di moduli di dialogo in prodotti largamente impiegati nell'attuale mercato delle telecomunicazioni (call-center); ATP invece ha l'obiettivo di integrare diverse tecnologie (generazione di linguaggio naturale, sistemi multi agente) in un dimostrativo. I prototipi di dialogo costruiti durante il 1998 dimostrano buone potenzialità, in quanto permettono all'utente di esprimersi con una certa libertà (inimmaginabile nei sistemi a menu) nell'ambito del dominio applicativo scelto; ciò nonostante, per poter diventare dei sistemi veri e propri, necessitano di miglioramenti sia tecnologici, sia in termini di prestazioni di riconoscimento. Ad esempio, vi si vuole introdurre una misura della bontà di un'ipotesi di riconoscimento, al fine di evitare di appesantire l'interazione con troppe richieste di conferma. Per quanto riguarda le prestazioni di riconoscimento, oltre a migliorare il motore acustico si intende ad esempio arricchire il modello del linguaggio con informazioni statistiche estratte da opportuni corpora di dialogo, raccolti durante l'uso dei vari prototipi. È inoltre necessario poter fornire a potenziali utilizzatori della nostra tecnologia degli strumenti di sviluppo che li mettano in grado di costruire delle applicazioni. Durante il 1999 si vuole quindi concentrare l'attività, che comunque dovrà in gran parte perseguire gli obiettivi delle commesse VOX e ATP, sul miglioramento della tecnologia di dialogo e sulla messa a punto di strumenti per lo sviluppo di prodotti commerciali.
Collocazione rispetto alla programmazione poliennale.
Il progetto, continuazione dei progetti Tecnologie vocali
per il telefonico (1996), Pronto (1997) e DITELO (1998), si colloca nell'area
del riconoscimento del parlato all'interno della divisione Sistemi Sensoriali
Interattivi.
Posizionamento rispetto allo stato dell'arte.
Il riconoscimento del parlato su linea telefonica è
un'attività su cui stanno investendo le grandi multinazionali che
si occupano di telecomunicazioni. La ricerca tende sempre più ad
affrontare temi legati alle reali esigenze degli utilizzatori. In particolare
viene data grande rilevanza al fatto che gli utenti possano interagire
in maniera naturale con la macchina, potendo da un lato prendere l'iniziativa
se hanno già una certa familiarità col servizio, dall'altro
essere guidati nel caso non abbiano dimestichezza col sistema. Si parla
a questo proposito di sistemi di dialogo ad iniziativa mista.
Quasi tutti i laboratori di ricerca stanno mettendo a
punto sistemi basati su dialogo; i più avanzati, dopo aver costruito
ed affinato dei servizi reali, hanno raccolto una considerevole quantità
di interazioni sul campo sulle quali possono fornire le prestazioni di
riconoscimento. Per quanto riguarda lo stato dell'arte, CSELT ha realizzato
un prototipo di dialogo per parlato continuo relativo a informazioni su
orari ferroviari, che potrebbe essere messo in campo tra breve (attualmente
è in linea un sistema a menu); Philips ha già in campo diverse
applicazioni, operanti su lingue diverse, che fanno uso di dialogo. Lernout
& Hauspie (associata a Microsoft) attualmente commercializza un pacchetto
di librerie e degli strumenti di sviluppo che permettono di realizzare
applicazioni telefoniche multilingua; tuttavia le prestazioni per l'italiano
non sembrano essere molto soddisfacenti. Come notizia informale sembra
che IBM uscirà con un prodotto simile nel corso del prossimo anno.
Collaborazioni.
Nell'ambito della commessa VOX si collaborerà principalmente
con l'azienda Alceo s.r.l. di Venezia, che si occupa di servizi telefonici
automatici. Nella commessa ATP si collaborerà con divisioni interne
all'ITC-irst, in particolare TCC e SRA. Sono attivi alcuni contatti con
aziende italiane che sviluppano prodotti per la telefonia. Tali aziende
si sono dette interessate ad integrare la nostra tecnologia di riconoscimento
nei loro prodotti. Tempi e fasi di esecuzione e risultati previsti L'attività
del progetto per il prossimo anno si articola su tre task principali, fortemente
interallacciati tra loro per quanto riguarda le attività. Ci si
propone di affrontare i seguenti temi:
Task 1 (T1): TECNOLOGIA.
Questo task sarà principalmente orientato all'irrobustimento
dell'attuale tecnologia e allo sviluppo di strumenti per la realizzazione
di prodotti commerciali. In particolare saranno sviluppati i seguenti punti.
| Tarcisio Coianiz | Daniele Falavigna | Roberto Gretter | Marco Orlandi | Gianni Lazzari | Totale complessivo | |
| T1 | 4 | 4 | 4 | 12 | ||
| T2 | 5 | 5 | 6 | 12 | 28 | |
| T3 | 3 | 3 | 2 | 2 | 10 | |
| Totale | 12 | 12 | 12 | 12 | 2 | 50 |
Forme di finanziamento.
La commessa VOX porterà nel 1999 150 milioni di
Lit (IVA compresa);
la commessa ATP e` stata interamente finanziata e pagata, per una somma
complessiva pari a 200 milioni di Lit, a dicembre 1998 (vedi project
management 1998).
Main events.
Spese previste (a livello di divisione?).
| viaggi | hardware | software | Totale complessivo | |
| COMMESSA VOX | 18 | 10 | 28 | |
| COMMESSA ATP | 8 | 10 | 7 | 25 |
| Totale | 26 | 20 | 7 | 53 |