back to DITELO

back to Project Management

Papers:
author(s) title where when status
D. Falavigna, 
R. Gretter
Telephone Speech Recognition Applications at IRST IVTTA '98 
workshop, Torino
29-30 
sep 1998
presented
R. Gretter, 
T. Coianiz, 
D. Falavigna, 
M. Orlandi
Description and Evaluation of a Mixed Initiative Dialogue System for Telephone Applications. 
PAPER IDENTIFICATION NUMBER = g015
Eurospeech 99, Budapest, Hungary 5-10 sep 1999  rejected
T. Coianiz, 
D. Falavigna, 
R. Gretter, 
M. Orlandi
Use of Simulated data for Robust Telephone Speech Recognition 
PAPER IDENTIFICATION NUMBER = c018
Eurospeech 99, Budapest, Hungary 5-10 sep 1999  presented
D. Falavigna, 
R. Gretter
FLEXIBLE MIXED INITIATIVE DIALOGUE OVER THE TELEPHONE NETWORK 
access code = 2368
ASRU 99 
Keystone, Colorado
12-15 dec 1999 presented
D. Falavigna, 
R. Gretter,
M. Orlandi,
V. Sandrini
Sistema di Dialogo ad Iniziativa Mista su Linea Telefonica Annual AIIA Workshop on Elaborazione del Linguaggio e Riconoscimento del Parlato, Trento, Italy 16-17 dec 1999 presented
C.  Barbero, 
D. Falavigna, 
R. Gretter,
M. Orlandi,
E. Pianta
Some  improvements  on  the  IRST  mixed  initiative  dialogue
technology.
TSD 2000 - Third International Workshop on TEXT, SPEECH and DIALOGUE , Brno, Czech Republic
reference number is 19
13-16 
sep 2000
presented
D. Falavigna, 
R. Gretter, 
M. Orlandi
A mixed language model for a dialogue system over the telephone ICSLP 2000, Beijing, China 16-20 oct 2000 accepted

TV:
date program description
7/12/1998 Mediamente
on RAI3
Just a small piece of the train timetable demo, inserted in a overview of IRST activity (mainly speech, but not only).

Proposals:
date program description
18/03/1999 ELRA Call 1999.  Proposal (doc file) for the Collection of an Italian Human-Machine Dialogue Corpus (submitted).
18/06/1999 EU Call for the Vth Framework. Proposal for Speech based Application Control for the Internet (submitted).
10/05/2000 ??? Proposal for AURORA (Automated User-fiendly Routing Of Requests and Answering

Thesis:
author title where when tutor(s)
V. Sandrini Inpiego di misure di confidenza nel riconoscimento automatico della voce Universita` degli Studi di Trento - Facolta` di Scienze Matematiche Fisiche e Naturali 16-17 dec '99 L. Tubaro
D. Falavigna

Seminaries:
date - relator - title - abstract
DATE:     28/1/1999 
PLACE:    ITC-irst 
RELATOR:  R. Gretter 
TITLE:    DIALOGO SU TELEFONO 
ABSTRACT: 

Nell'ambito del progetto  DITELO si sta  lavorando da circa un anno ad un sistema automatico di dialogo che permetta  ad un utente qualsiasi, interagendo  in maniera naturale,  di accedere ad  un certo insieme di informazioni via telefono. Nei mesi scorsi  sono stati attivati per un breve periodo due servizi sperimentali: un centralino automatico ed un prototipo per l'accesso ad informazioni ferroviarie. 
Durante  il seminario verra`  brevemente presentata sia l'architettura del  prototipo, sia la tecnologia  di riconoscimento e di comprensione utilizzata.  Verranno  discussi   alcuni  problemi  emersi  durante la sperimentazione, nonche` alcuni risultati. 
Il  prototipo di accesso ad  informazioni  ferroviarie verra` attivato tutte le sere dopo le  18.00 (e tutto il  fine settimana), da oggi al giorno  del  seminario.  Il  numero a  cui  il  prototipo  risponde e` l'interno IRST 572 (0461-314572 dall'esterno).  Tutti i segnali vocali delle interazioni verranno registrati e riascoltati.

DATE:     8/7/1999 
PLACE:    ITC-irst 
RELATOR:  M. Orlandi 
TITLE:    Dialogue Prototype System for accessing a train timetable. 
ABSTRACT: 

The dialogue architecture is described and emphasis is given to the implementation issues of the prototype. Calls to the classes of API SPINET and the communication protocol among processes and related implementation are described in the details.

DATE:     17/12/1999 
PLACE:    AT&T Shannon labs, Florham Park, NJ 
RELATOR:  R. Gretter 
TITLE:    Mixed initiative dialogue over the telephone in restricted domains. (Powerpoint, 1.1 Mbyte
ABSTRACT: 

In  the talk a  brief  overview  of the  research activities  on speech recognition at ITC-irst  will  be presented.  These include recognition in  car  environment,  microphone  arrays  for hands-free  interaction, broadcast news  transcription,  spoken document retrieval, multilingual human-to-human communication, speech recognition over the telephone. 
Then,  our  dialogue  technology  for  telephone  applications will  be presented.  A prototype  based on  a mixed initiative strategy has been built,  which allows  information  access  in restricted  domains.  The main features of the dialogue architecture are the following: 
* speaker independent, continuous speech recognition and understanding: recursive  transition networks are used to represent, at the same time, both  the  language  model,   which  limits  the  search  space  during recognition, and the concepts to understand; 
* easy  portability  to  different  restricted  domains:  all the  data related to a given application  are part  of a description which is fed by a dialogue engine; 
* mixed initiative:  since all  the sub-grammars of the application are always  active,  the  user  can  give  information  or  switch  to  new subdomains in every instant of the interaction. 

DATE:     27/6/2000
PLACE:    AT&T Shannon labs, Florham Park, NJ 
RELATOR:  R. Gretter 
TITLE:    Main speech and language projects going on at ITC-irst. (Powerpoint, 0.5 Mbyte
ABSTRACT: 

I will briefly describe a dialogue prototype for accessing tourism information (see http://www.provincia.tn.it/apt/).
I will give a preliminary analysis of the dialog interactions we have collected so far. Then I will present some projects for the integration of our speech recognition and dialogue technology into call center applications.

DATE:     8/9/2000
PLACE:    AT&T Shannon labs, Florham Park, NJ 
RELATOR:  R. Gretter 
JOINT WORK: G. Riccardi
TITLE:    Sausages and Lattice-Based Confidence Measures. (Postscript, 0.25 Mbyte
ABSTRACT: 

In this talk I will describe the work I've done at AT&T during this summer. It has been mainly devoted to trying to exploit the knowledge which is inside a word lattice.
First I will briefly outline the Consensus algorithm, which transforms a lattice in a different format, called sausage, and extracts what is called the "consensus hypothesis". This is a word sequence, each one with a posterior probability, which can also be used as a confidence score. 
Then I will describe an alternative algorithm, which provides similar confidence scores for the best path hypothesis, starting from the lattice. This is more related to the time information (which is somewhat lost in the sausages).
Finally I will describe some experiments in the direction of the on-line learning, using speech data (without transcriptions) to improve the language models. 
Results will be provided for the HMIHY task.

DATE:     2/10/2000
PLACE:    ITC-irst
RELATOR:  R. Gretter 
JOINT WORK: G. Riccardi
TITLE:    Salsicce e altre misure di confidenza. 
ABSTRACT: 

Molti  sistemi di  riconoscimento  vocale offrono  la possibilita`  di avere come uscita, oltre alla  miglior sequenza di parole, un reticolo (lattice) di ipotesi  di parole, organizzate in una  struttura a grafo che  rispecchia  vincoli  temporali  e  sintattici.   Questi  reticoli contengono  una   gran  mole  di  informazioni,   che  possono  essere utilizzate per diversi scopi.
Per  prima cosa  descrivero`  brevemente il  Consensus algorithm,  che trasforma un reticolo in  un formato piu` compatto, chiamato salsiccia (sausage), da cui e`  immediato ottenere l'ipotesi di consenso. Questa e`  una  sequenza di  parole,  ognuna  delle  quali associata  ad  una probabilita`  a posteriori  che puo`  essere efficacemente  usata come
punteggio di confidenza.
Quindi descrivero`  un algoritmo  alternativo, capace di  estrarre dei punteggi  di confidenza  per la  miglior sequenza  di  parole operando direttamente sul reticolo.
Infine descrivero`  alcuni esperimenti di on-line learning,  in cui si cerca di  usare materiale vocale  grezzo - cioe` senza  trascrizioni - per migliorare le prestazioni di un riconoscitore, ottenendo quindi un sistema capace di affinarsi da solo.
Saranno presentati risultati sul task HMIHY (How May I Help You).
Questo  lavoro  e`  stato  svolto  quest'estate,  assieme  a  Giuseppe Riccardi, durante la mia permanenza come summer visitor nei laboratori della AT&T.

 Last update Oct 3, 2000- Maintainer: Roberto Gretter