Bonjour,
J'étudie aujourd'hui la reconnaissance vocale, et dans le but d'établir un logiciel performant et propre à mes besoins, je cherche une API efficace.
Le cahier des charges est le suivant :
- l'API doit supporter la reconnaissance vocale du français (si possible avec quelques mots en anglais sans que ça lui pose problème, après je peux toujours essayer d'adapter dans l'application)
- elle devra traiter correctement le bruit de fond et les accents de prononciation
- les machines destinées à recevoir l'application tourneront sous XP et Vista
- elle doit minimiser le temps d'apprentissage de l'user (temps pour lequel elle s'approprie les caractéristiques de sa voix : ton, vitesse, volume, accent ... )
Quelques Speech API sont disponibles, comme :
- SAPI 5.3 (Speech API) de Windows, manipulable via des objets COM ou directement en passant par la bibliothèque System.Speech du framework .NET 3.0 . Seule la version 5.3 m'intéresse car c'est la seule à prendre en charge le français. Je sais que cette version est native sous Vista, et incluse dans le Windows SDK (utilisable sous XP).
- SMAPI (Speech Managed API) fournie par IBM ViaVoice. Elle traite uniquement la reconnaissance vocale (pas la synthèse, contrairement à la précédente), et prend en charge le français. Elle est composée de deux APIs en réalité : la première comportant le moteur de reconnaissance vocale, la deuxième qui compile les grammaires.
- JSAPI (Java Speech API) fournie également par IBM. Elle est utilisable seulement pour des applications en Java. Pour l'instant, il me reste quelques recherches à faire pour une documentation plus complète...
Mon problème est le suivant : j'ai trouvé pas mal de caractéristiques sur ces API, la seule chose qui me manque, ce sont des points de vue, des avis.
Quelqu'un a-t-il déja rencontré et mis en oeuvre ces API ? Qu'en pensez-vous ? Lesquelles se valent ?
Ont-elles de bons taux de reconnaissance ? Une marge d'erreur signifiante ? Un défaut particulier ?
Il est inutile de me coller des liens sur les logiciels existants sur le marché, exploitant ou non les API citées : ce n'est pas ce que je cherche. En revanche, s'il existe d'autres API non citées, ça m'intéresse.