back to Project management
back to DITELO
 

DITELO: DIalogue over the TELephOne

Responsabile: Daniele Falavigna.
 

 Obiettivi.   Questo progetto ha l'obiettivo di realizzare sistemi che consentano interazioni flessibili per l'accesso ad informazioni in domini molto ristretti, mediante il riconoscimento automatico della voce su linea telefonica. Durante il 1998 sono stati realizzati un centralino automatico, installato in Caritro a dicembre 1997 e migliorato durante il 1998, ed alcuni prototipi di sistemi di dialogo su linea telefonica. Sono inoltre iniziate due commesse, VOX e ATP, finanziate da entità esterne, entrambe incentrate sulla realizzazione di sistemi/prototipi di dialogo per l'accesso ad informazioni su linea telefonica.   La commessa VOX ha caratteristiche più applicative, tendendo alla realizzazione di librerie software per l'integrazione di moduli di dialogo in prodotti largamente impiegati nell'attuale mercato delle telecomunicazioni (call-center); ATP invece ha l'obiettivo di integrare diverse tecnologie (generazione di linguaggio naturale, sistemi multi agente) in un dimostrativo.   I prototipi di dialogo costruiti durante il 1998 dimostrano buone potenzialità, in quanto permettono all'utente di esprimersi con una certa libertà (inimmaginabile nei sistemi a menu) nell'ambito del dominio applicativo scelto; ciò nonostante, per poter diventare dei sistemi veri e propri, necessitano di miglioramenti sia tecnologici, sia in termini di prestazioni di riconoscimento. Ad esempio, vi si vuole introdurre una misura della bontà di un'ipotesi di riconoscimento, al fine di evitare di appesantire l'interazione con troppe richieste di conferma. Per quanto riguarda le prestazioni di riconoscimento, oltre a migliorare il motore acustico si intende ad esempio arricchire il modello del linguaggio con informazioni statistiche estratte da opportuni corpora di dialogo, raccolti durante l'uso dei vari prototipi. È inoltre necessario poter fornire a potenziali utilizzatori della nostra tecnologia degli strumenti di sviluppo che li mettano in grado di costruire delle applicazioni. Durante il 1999 si vuole quindi concentrare l'attività, che comunque dovrà in gran parte perseguire gli obiettivi delle commesse VOX e ATP, sul miglioramento della tecnologia di dialogo e sulla messa a punto di strumenti per lo sviluppo di prodotti commerciali.

Collocazione rispetto alla programmazione poliennale.
   Il progetto, continuazione dei progetti Tecnologie vocali per il telefonico (1996), Pronto (1997) e DITELO (1998), si colloca nell'area del riconoscimento del parlato all'interno della divisione Sistemi Sensoriali Interattivi.

Posizionamento rispetto allo stato dell'arte.
   Il riconoscimento del parlato su linea telefonica è un'attività su cui stanno investendo le grandi multinazionali che si occupano di telecomunicazioni. La ricerca tende sempre più ad affrontare temi legati alle reali esigenze degli utilizzatori. In particolare viene data grande rilevanza al fatto che gli utenti possano interagire in maniera naturale con la macchina, potendo da un lato prendere l'iniziativa se hanno già una certa familiarità col servizio, dall'altro essere guidati nel caso non abbiano dimestichezza col sistema. Si parla a questo proposito di sistemi di dialogo ad iniziativa mista.
   Quasi tutti i laboratori di ricerca stanno mettendo a punto sistemi basati su dialogo; i più avanzati, dopo aver costruito ed affinato dei servizi reali, hanno raccolto una considerevole quantità di interazioni sul campo sulle quali possono fornire le prestazioni di riconoscimento. Per quanto riguarda lo stato dell'arte, CSELT ha realizzato un prototipo di dialogo per parlato continuo relativo a informazioni su orari ferroviari, che potrebbe essere messo in campo tra breve (attualmente è in linea un sistema a menu); Philips ha già in campo diverse applicazioni, operanti su lingue diverse, che fanno uso di dialogo. Lernout & Hauspie (associata a Microsoft) attualmente commercializza un pacchetto di librerie e degli strumenti di sviluppo che permettono di realizzare applicazioni telefoniche multilingua; tuttavia le prestazioni per l'italiano non sembrano essere molto soddisfacenti. Come notizia informale sembra che IBM uscirà con un prodotto simile nel corso del prossimo anno.

Collaborazioni.
   Nell'ambito della commessa VOX si collaborerà principalmente con l'azienda Alceo s.r.l. di Venezia, che si occupa di servizi telefonici automatici. Nella commessa ATP si collaborerà con divisioni interne all'ITC-irst, in particolare TCC e SRA. Sono attivi alcuni contatti con aziende italiane che sviluppano prodotti per la telefonia. Tali aziende si sono dette interessate ad integrare la nostra tecnologia di riconoscimento nei loro prodotti. Tempi e fasi di esecuzione e risultati previsti L'attività del progetto per il prossimo anno si articola su tre task principali, fortemente interallacciati tra loro per quanto riguarda le attività. Ci si propone di affrontare i seguenti temi:

Fasi di esecuzione.
   L'attivita` si sviluppera` su tre tasks.

Task 1 (T1): TECNOLOGIA.
   Questo task sarà principalmente orientato all'irrobustimento dell'attuale tecnologia e allo sviluppo di strumenti per la realizzazione di prodotti commerciali. In particolare saranno sviluppati i seguenti punti.

Task 2 (T2): COMMESSA VOX (filone call-center).
   Ha lo scopo di realizzare un sistema prototipale per l'accesso ad informazioni via telefono, in linguaggio naturale, nell'ambito di qualche dominio limitato. Si focalizzerà l'attenzione sia su tematiche tese a sviluppare la tecnologia di base, sia su aspetti implementativi (realizzazione di API) per l'integrazione dei vari moduli in un tool di sviluppo. Per ulteriori dettagli si rimanda al documento di progetto. Task 3 (T3): COMMESSA ATP.
  Ci si propone di svolgere attività nell'area dell'accesso all'informazione elettronica disponibile in rete, con tecnologie di riconoscimento del parlato e presentazione dell'informazione in linguaggio naturale. Per ulteriori dettagli si rimanda al documento di progetto. Risorse impiegate (in mesi/uomo).
 
 
Tarcisio Coianiz Daniele Falavigna Roberto Gretter Marco Orlandi Gianni Lazzari Totale complessivo
T1 4 4 4 12
T2 5 5 6 12 28
T3 3 3 2 2 10
Totale  12 12 12 12 2 50
 
 

Forme di finanziamento.

   La commessa VOX porterà nel 1999 150 milioni di Lit (IVA compresa);
la commessa ATP e` stata interamente finanziata e pagata, per una somma complessiva pari a 200 milioni di Lit, a dicembre 1998 (vedi project management 1998).
 

Main events.

Spese previste (a livello di divisione?).
 
 
viaggi hardware software Totale complessivo
COMMESSA VOX 18 10 28
COMMESSA ATP 8 10 7 25
Totale 26 20 7 53