Come costruire un'applicazione di riconoscimento vocale

Preparazione del software di riconoscimento vocale

Passaggio 1

Raggruppa il tuo software con un programma di riconoscimento vocale, come Dragon NaturallySpeaking o ViaVoice di IBM. Se sei uno sviluppatore di software, dai l'opzione all'utente di acquistare il software. Come parte del processo di installazione dell'applicazione, chiedere all'utente di installare anche il programma di riconoscimento vocale.

Passaggio 2

Configura il software di riconoscimento vocale. Affinché la tua applicazione possa trarre il massimo vantaggio dal riconoscimento vocale, il programma deve essere configurato correttamente. Ciò significa che le impostazioni del microfono e della lingua devono essere regolate in modo appropriato per sfruttare appieno le capacità del programma.

Passaggio 3

Allena il programma di riconoscimento vocale. Questo potrebbe dover essere fatto al di fuori dell'applicazione, a seconda della sua natura. In questo caso, la maggior parte dei programmi di riconoscimento vocale include programmi e schermate di addestramento, oppure il programma può essere addestrato in un elaboratore di testi.

Integrare l'immissione di testo

Passaggio 1

Crea un controllo testo o rich text nella tua applicazione. Molti programmi di riconoscimento vocale funzionano con tutti i programmi che dispongono di opzioni di immissione di testo. Se ciò di cui hai bisogno è l'introduzione di parole, l'applicazione probabilmente non ha bisogno di alcuna modifica per funzionare con un programma di riconoscimento vocale.

Passaggio 2

Include spazio aggiuntivo nel controllo di immissione del testo. Poiché i programmi di riconoscimento vocale sono in grado di riconoscere il parlato a un ritmo più veloce di quello che molti possono scrivere, potrebbe essere necessario aumentare la dimensione dei controlli di inserimento del testo. Lascia uno spazio sufficiente per scrivere testo e rivederlo in tempo reale.

Interazione attraverso un'API

Passaggio 1

Utilizza un'interfaccia di programmazione dell'applicazione (API) per interagire con il software di riconoscimento vocale. Molti programmi di riconoscimento vocale includono un'API per altre applicazioni da utilizzare. L'uso di uno consentirà alla tua applicazione di avere pieno accesso a tutte le funzioni di riconoscimento vocale e darà all'utente il pieno controllo dell'applicazione attraverso il parlato.

Passaggio 2

Integrare l'API con l'applicazione. Ciò potrebbe includere la creazione di più di una "modalità" di controllo vocale. Crea parole di comando, come "salva file" o "crea nuovo file". Quando si immette del testo, gli utenti dovrebbero anche essere in grado di modificare senza dover toccare la tastiera e attivare le funzioni rich text, come grassetto, corsivo, sottolineatura e altre modifiche ai font.