¿API de texto a voz (generación de voz) y de voz a texto (reconocimiento de voz)?

¿Hay una lista completa de API conocidas para entornos de escritorio o de navegador?

Rehago y actualizo una respuesta del reconocimiento de voz en C o Java o PHP? . Esto de ninguna manera es exhaustivo, pero podría ser un comienzo para ti


Después de ver estas preguntas durante algunos meses, he visto que la mayoría de las opciones de desarrollador se desglosan así:

Gente de Windows: use las características de System.Speech de .Net o Microsoft.Speech e instale los reconocedores gratuitos que proporciona Microsoft. Windows 7 incluye un motor de voz completo. Otros se pueden descargar gratis. Hay una API C ++ para los mismos motores conocidos como SAPI. Ver en http://msdn.microsoft.com/en-us/magazine/cc163663.aspx . o http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx . Más información sobre los motores de Microsoft para Windows ¿Cuál es la diferencia entre System.Speech.Recognition y Microsoft.Speech.Recognition?

Gente de Linux: Sphinx parece tener muchos seguidores. Ver http://cmusphinx.sourceforge.net/ y http://cmusphinx.sourceforge.net/wiki/

Productos comerciales: Nuance , Loquendo , AT & T , IBM , otros. Cada uno proporciona sus propios SDK y bibliotecas para varios idiomas.

Servicio en línea: Nuance , Yapme , ispeech.org , vlingo , otros. Nuance ha mejorado su progtwig de desarrollo y ahora le dará acceso gratuito a sus servicios para el desarrollo. Yap (creo) fue comprado recientemente por Amazon , por lo que podemos ver algunos cambios allí.

Por supuesto, esto también puede ser útil: http://en.wikipedia.org/wiki/List_of_speech_recognition_software

Hay una API de voz Java. Consulte javax.speech.recognition en Java Speech API http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html . Creo que todavía tiene que encontrar un motor de voz que admita esta API. No creo que Sphinx lo admita por completo: http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi

Hay muchas otras preguntas de SO: ¿ Necesita herramientas de reconocimiento de texto a voz y voz para Linux y pyspeech (python)? ¿Transcribir archivos mp3? que habla sobre http://code.google.com/p/pyspeech/ . También puede consultar http://code.google.com/p/dragonfly/

¡Los principales proveedores de API de texto a voz (generación de voz) son YAKiToMe! y iSpeech. YAKiToMe! es el que uso porque me gusta más su calidad de voz y son los menos caros (mayormente gratuitos). Admiten parlantes masculinos y femeninos en varios idiomas. Algunos de los vendedores de voz, como Acapella, Nuance, Loquendo e iVona tienen voces decentes, pero tienden a ser caros de usar.

Así es como puedes hacerlo: Nota: es una API de Google, por lo que solo funciona en el navegador Chrome.

(Vea la demostración en vivo y descargue el código fuente completo aquí http://purpledesign.in/blog/?p=33 )

definir un botón

 

y define lo que quieres hacer en una función en tu archivo javascript

Me gusta esto

  function processspeech() { var speechtext=$("#speech").val(); var elem = document.getElementById("test"); elem.value = speechtext; var notification="\""+ speechtext + "\" 
*Is this what you said???"; notify(notification); }

aquí

  

El discurso está escrito en el área de texto