Reconnaissance vocale : la meilleure API ?

Reconnaissance vocale : la meilleure API ? - Divers - Programmation

Marsh Posté le 22-04-2009 à 15:01:05    

Bonjour,
 
J'étudie aujourd'hui la reconnaissance vocale, et dans le but d'établir un logiciel performant et propre à mes besoins, je cherche une API efficace.  
 
Le cahier des charges est le suivant :  
- l'API doit supporter la reconnaissance vocale du français (si possible avec quelques mots en anglais sans que ça lui pose problème, après je peux toujours essayer d'adapter dans l'application)
- elle devra traiter correctement le bruit de fond et les accents de prononciation
- les machines destinées à recevoir l'application tourneront sous XP et Vista
- elle doit minimiser le temps d'apprentissage de l'user (temps pour lequel elle s'approprie les caractéristiques de sa voix : ton, vitesse, volume, accent ... )
 
Quelques Speech API sont disponibles, comme :
 

  • SAPI 5.3 (Speech API) de Windows, manipulable via des objets COM ou directement en passant par la bibliothèque System.Speech du framework .NET 3.0 . Seule la version 5.3 m'intéresse car c'est la seule à prendre en charge le français. Je sais que cette version est native sous Vista, et incluse dans le Windows SDK (utilisable sous XP).


  • SMAPI (Speech Managed API) fournie par IBM ViaVoice. Elle traite uniquement la reconnaissance vocale (pas la synthèse, contrairement à la précédente), et prend en charge le français. Elle est composée de deux APIs en réalité : la première comportant le moteur de reconnaissance vocale, la deuxième qui compile les grammaires.


  • JSAPI (Java Speech API) fournie également par IBM. Elle est utilisable seulement pour des applications en Java. Pour l'instant, il me reste quelques recherches à faire pour une documentation plus complète...


 
Mon problème est le suivant : j'ai trouvé pas mal de caractéristiques sur ces API, la seule chose qui me manque, ce sont des points de vue, des avis.  
 
Quelqu'un a-t-il déja rencontré et mis en oeuvre ces API ? Qu'en pensez-vous ? Lesquelles se valent ?
Ont-elles de bons taux de reconnaissance ? Une marge d'erreur signifiante ? Un défaut particulier ?
 
Il est inutile de me coller des liens sur les logiciels existants sur le marché, exploitant ou non les API citées : ce n'est pas ce que je cherche. En revanche, s'il existe d'autres API non citées, ça m'intéresse.

Reply

Marsh Posté le 22-04-2009 à 15:01:05   

Reply

Marsh Posté le 23-04-2009 à 15:45:21    

[:drap]

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed