Mar 17 2008

Anticipazioni - Fabrizio Gramuglio: tecnologie vocali e multimodali al servizio dell’accessibilità.

Tag:Tag , , Gramuglio @ 15:17

Lo scopo di questo intervento è quello di far chiarezza su alcune tecnologie, ormai mature anche se ancora poco diffuse, che rappresentano un valido supporto per prodotti e servizi di nuova generazione.

Sotto il nome generico di tecnologie vocali e multimodali sono presenti diversi strumenti che vanno dal “semplice” motore di sintesi vocale a complessi framework di sviluppo e controllo dell’input utente: sia esso vocale, mediato da sensori, sguardo, gesti ecc.

Al fine di non risultare troppo accademico e poco pratico ogni argomento trattato sarà, il più possibile, ricco di riferimenti ad applicazioni, esempi, demo, e link ad approfondimenti. Questo permetterà all’utente, non solo di evitare di ascoltare normative, raccomandazioni e proiezioni su un imprecisato e poco datato futuro, ma anche di rendersi conto di quale sia lo stato dell’arte delle tecnologie, e, soprattutto, gli permetterà di capire su quali tecnologie il mercato stia attualmente scommettendo.

Quindi, cercando di delineare un’agenda dell’intervento (agenda che, come l’esperienza mi ha insegnato, verrà modificata di giorno in giorno fino all’ora dell’intervento) possiamo dire che verranno toccati i seguenti argomenti:

  • Chi fa cosa: un esame dei principali attori di progetti a livello internazionale per le nuove tecnologie sui diversi media, in questa sezione si parlerà di applicazioni web, applicazioni remote su mobile e del web visto attraverso protocolli diversi dal solo e solito http.
  • Tecnologie vocali: cosa sono? Quale è lo stato dell’arte attualmente disponibile? Cosa ci si aspetta dai prossimi tre anni? Come e dove posso provarle? ASR1, TTS2, SI3, NLU4, SV5, Trascrizione Speech Dependent, ecc.
  • Tecnologie multimodali: quali sono? Esistono degli standard? Come e dove posso testare un’applicazione multimodale? Quali input sono oggi disponibili per l’utente (voce, tastiera, mouse, sensori di movimento, sensori di pressione, ecc.)? Qual’è la relazione e il supporto che queste tecnologie possono dare all’accessibilità?
  • Progetti attualmente disponibili o di prossima pubblicazione: cosa offre il mercato? Chi lo sta offrendo? Quale è la scommessa dei player per i prossimi anni? Cosa posso già testare?

All’interno della sezione “progetti” si esamineranno, tra gli altri, Android progetto diretto e voluto dalla Open Handset Alliance tra i cui membri si trovano nomi illustri nella produzione di devices (Motorola, HTC, Samsung), nel campo degli operatori telefonici (China Mobile Communications Corporation, T-Mobile e Telecom Italia) e nella produzione software (Ebay, Google), e, per avvicinarci alla parte che ci riguarderà più vicino, per la parte vocale (Nuance e SoniVox).

Altri progetti che andremo ad esaminare sono tutti quei progetti/software che vanno sotto il nome di Interactive Web (sia multimedia che multimodale) che, nonostante l’assonanza, non hanno nulla a che fare ne con il social network né con pagine realizzate con l’ultima moda in fatto di linguaggi web. Ma piuttosto permetteranno all’utente di utilizzare tecnologie diverse da quelle tipiche del web attraverso il web.

Popolarità: 10% [?]

  1. Automatic Speech Recognition [indietro]
  2. Text-To-speech [indietro]
  3. Semantic Interpretation [indietro]
  4. Natural Language Understanding [indietro]
  5. Speaker verification [indietro]

Una risposta a “Anticipazioni - Fabrizio Gramuglio: tecnologie vocali e multimodali al servizio dell’accessibilità.”

  1. Semplicemente » Blog Archive » Gli argomenti dei seminari didattici ha scritto:

    […] Fabrizio Gramuglio, sulle tecnologie vocali e multimodali. […]

Lascia una risposta