miércoles, 3 de febrero de 2010

ROBOTS-Reconocimiento de Voz

CIRCUITOS DE RECONOCIMIENTO DE VOZ
En un futuro próximo, el reconocimiento de voz será el nuevo método para controlar aplicaciones en juguetes, instrumentos, computadotas y robótica. Hay un enorme mercado comercial que espera que esta tecnología madure.Este artículo detalla la fabricación de un circuito de reconocimiento de voz autónomo, entrenable que puede ser interconectado para controlar sistemas eléctricos, robots, instrumentos de prueba, la TV, el grabador de vídeo, etc. El circuito es "entrenado" (programado) para reconocer las palabras que se desea reconozca.


El controlar y comandar una aplicación (el ordenador, el grabador de vídeo, el sistema de seguridad, el TV, etc.) usando comandos de voz lo hace más fácil, aumentando la eficacia y la eficiencia de trabajar con este dispositivo.
En su reconocimiento de voz de nivel básico permite al usuario realizar tareas paralelas, p. ej. si las manos y los ojos están ocupados en otra tarea, y seguir trabajando con el pc o cualquier otra tarea. Este circuito permite experimentar con muchas facetas de la tecnología de reconocimiento de voz.
El corazón del circuito es el circuito integrado de reconocimiento de voz HM2007. El chip proporciona las opciones de reconocer 40 palabras de 0.96 segundos de duración o veinte palabras de 1.92 segundos de duración. Este circuito permite al usuario escoger ya sea las palabras de 0.96 segundos de longitud (vocabulario de 40 palabras) o la segunda opción de longitud de palabras de 1.92 (vocabulario de 20 palabras). Como memoria el circuito usa una RAM estática de 8 X 8 kB.
El chip tiene dos modos operacionales; modo manual y modo de CPU. El modo de CPU es diseñado para permitir trabajar al chip bajo una pc. Esto es un acercamiento atractivo al reconocimiento de voz por compùtadora porque el chip de reconocimiento de voz funciona como un coprocesador a la CPU principal. Las funciones de escucha y reconocimiento no ocupan el tiempo de la CPU. Cuando el HM2007 reconoce una orden, puede enviar una interrupcion a la CPU de la pc y luego retransmitir el código de la orden. El chip HM2007 puede ser implementado en cascada para proporcionar una biblioteca más grande de reconocimiento de palabras. El circuito SR-07 del ejemplo funciona en el modo manual. El modo manual permite construir una tabla de reconocimiento de voz autónomo que no requiere una pc y puede ser integrado en otros dispositivos para utilizar el control de voz.

APLICACIONES.

- Mando y control de aplicaciones y equipos.
- Sistemas telefónicos de ayuda.
- entrada de Datos
- Control por voz de juguetes
- Sistemas de seguridad de reconocimiento de voz.

PROGRAMA.
Normalmente la mayor parte de los sistemas de reconocimiento de voz disponibles hoy son programas que se usan en las pcs. Estos programas funcionan continuamente en el sistema operativo de las pcs (windows, OS/2, etc.). Estos programas requieren que el ordenador sea equipado con una tarjeta de sonido compatible. La desventaja en este metodo es la necesidad de una pc, y no es económicamente viable para los fabricantes añadir sistemas informáticos para controlar una lavadora o el grabador de vídeo. Además hay una sensible reducción en la velocidad de operación y en la función de la pc cuando se habilita el reconocimiento de voz.

APRENDIENDO A ESCUCHAR.
Tomamos nuestra capacidad de escuchar como algo natural. Por ejemplo somos capaces de escuchar a una persona hablando entre varios en una fiesta. Nuestro subconsciente filtra las conversaciones extrañas y el ruido. Estas capacidades de filtración están fuera de las capacidades de los sistemas actuales de reconocimiento de voz. El reconocimiento de voz no es el entendimiento de las palabras. El entendimiento del significado de las palabras es una función intelectual más alta. Una pc puede responder a un una orden verbal, pero eso no significa que entiende la orden verbal. ¡El sistema de reconocimiento vocal un día tendrá la capacidad de distinguir matices lingüísticos y el significado de las palabras.

DEPENDIENTE / INDEPENDIENTE
El reconocimiento de voz es clasificado en dos categorías, el dependiente del operador y el independiente del operador.

DEPENDIENTE DEL OPERADOR.
Los sistemas son entrenados por el individuo que usará el sistema. Estos sistemas son capaces de abarcar una mayor cantidad de órdenes y tiene el 95 % de exactitud para el reconocimiento de las palabras. La desventaja de esto consiste en que el sistema sólo responde con exactitud al individuo que entrenó el sistema. Este es el método más común empleado en el software para PCS
INDEPENDIENTE DEL OPERADOR.
Es un sistema entrenado para responder a las palabras independientemente de quien las diga. Por lo tanto el sistema debe responder a una gran variedad de modelos de palabras, inflexiones y pronunciación de la palabra objetivo. La cantidad de palabras de ordenes es por lo general inferior que el sistema dependiente sin embargo mantiene la alta exactitud dentro de los límites de procesamiento. Las exigencias industriales mas a menudo necesitan los sistemas de voz independientes, como el sistema AT*T usado en los sistemas telefónicos.

RECONOCIMIENTO DE ESTILOS.
Los sistemas de reconocimiento de voz tienen otra característica que concierne el estilo de palabras que ellos pueden reconocer. Esta característica es el estilo, son tres estilos de palabras: aislado, unido y continuo.

AISLADO los sistemas de reconocimiento de voz solamente pueden manejar las palabras que son habladas separadamente. Estos son los sistemas de reconocimiento más comunes disponibles hoy. El usuario debe hacer una pausa entre cada palabra u orden hablada. El circuito de reconocimiento es configurado para identificar palabras aisladas de 0.96 segundos de longitud.

CONECTADO es el punto medio entre el reconocimiento de la palabra aislada y la palabra continua. Permite a los usuarios hablar múltiples palabras. El HM2007 puede ser configurado para identificar palabras o frases de 1.92 segundos de longitud. Esto reduce el número del vocabulario de reconocimiento de palabras a 20.

CONTINUO es la conversación natural que usamos en la vida diaria. Es sumamente difícil para un sistema reconocedor el seguir el texto cuando las palabras parece que se combinasen. ¿Por ejemplo, " Hola, cómo esta usted? " suena como " Hola. comtaste " los sistemas de reconocimiento Continuo que están en el mercado todavía estan en continuo desarrollo.

CIRCUITO DE RECONOCIMIENTO DE VOZ.
El circuito de demostración HM2007 funciona en el modo manual. Este modo usa un teclado numérico simple y un display digital para la comunicacion y la programacion del chip HM2007.

figura 1
teclado: el teclado es de 12 pulsadores.

Cuando el circuito es energizado, el HM2007 verifica la RAM estática. Si toda la prueba esta bien, el display digital muestra "00" y se enciende el led rojo (LISTO). Lo que indica que está en espera de una orden.

ENTRENAMIENTO.
Para entrenar el circuito, se comienza por presionar sobre el teclado numérico el número de palabra que se quiere entrenar. El circuito puede ser entrenado para reconocer hasta 40 palabras. Usar cualquier número entre 1 y 40. Por ejemplo presionar el número "1" para entrenar la palabra número 1. Cuando se presiona el número (s) sobre el teclado numérico el led rojo se apagará. Y el número es mostrado sobre la pantalla digital. Luego presione " *" para el entrenamiento. Cuando es presionado " *" prepara el chip para escuchar una palabra de entrenamiento y el led rojo se enciende nuevamente. Ahora decir claramente en el micrófono la palabra que se quiere que el circuito reconozca. El led debería parpadear momentáneamente, esto es una señal que la palabra ha sido aceptada.

Seguir entrenando nuevas palabras en el circuito, usando el procedimiento descrito. Presionar "2" después "*" para entrenar la segunda palabra etcétera. El circuito aceptará hasta cuarenta palabras. No se tiene que entrar las 40 palabras en la memoria para usar el circuito. Se puede usar tantos espacios de palabra como se desee.

PRUEBA DE RECONOCIMIENTO.
Ya que el circuito esta continuamente en escucha. Repetir una palabra entrenada en el micrófono. El número de la palabra sera mostrado en la pantalla digital. Por ejemplo si la palabra "directorio" fue entrenada como la palabra número 25, diciendo la palabra "directorio" en el micrófono, se mostrara el número 25.

CODIGOS DE ERROR.
El chip proporciona los siguientes códigos de error:

55 = palabra muy larga.
66 = palabra muy corta.
77 = palabra no almacenada.

ENTRENANDO AL HM2007
LIMPIANDO LA MEMORIA
Para borrar todas las palabras en la memoria RAM presionar "99" en el teclado numérico luego presionar " *" . La pantalla digital mostrara rápidamente los números del 1 al 40, limpiando la memoria.

Para borrar un solo espacio de palabra presionar el número de la palabra que se quiere limpiar, luego presionar " *".

CONSTRUCCION DEL CIRCUITO.
El diagrama esquemático es mostrado en la figura 1. Se necesitan tres placas de PCB para este proyecto, ver la lista de componentes. Los componentes son montados sobre el lado superior de la placa, ver la Figura 3. Iniciar la construcción soldando las bases IC sobre la placa. Después montar y soldar todas las resistencias. Ahora montar y soldar el cristal de 3.57 MHz y el led rojo. El Terminal largo del led es positivo. Después soldar los condensadores y el regulador de voltaje 7805. Soldar los siete ejes de fijación de posición del teclado numérico a la tarjeta de circuito impreso principal como se muestra en la figura 2 y 3. Después soldar los 10 ejes de fijación de la placa del display a la tarjeta de circuito impreso principal.


                                                                 figura 3

SISTEMA INDEPENDIENTE.
Este circuito de demostración permite experimentar con sistemas dependientes así como independientes. El sistema normalmente es entrenado como dependiente. Para entrenar el sistema para reconocimiento independiente (Multiusuario) usar la técnica siguiente. Usar cuatro espacios de palabra para cada palabra objetivo. Arreglar las palabras de modo que las palabras puedan ser reconocidas solamente descifrando el digito menos significativo del número sobre la pantalla digital.
Para lograr esto, los espacios de palabra 01, 11, 21 y 31 son asignados a la primera palabra objetivo. Sólo descifrando el dígito menos significativo del numero, en este caso 1 "de X" "1" (donde X es cualquier número del 0 - 3) se puede reconocer la palabra objetivo.
Hacer esto para los espacios de palabra restantes. Algunas veces, la segunda palabra objetivo usará los espacios de palabra 02, 12, 22 y 32. Seguir de esta manera hasta que todas las palabras sean programadas.

Si es posible, usar diferente personas que hablen al sistema. Esto permitirá al sistema reconocer diferentes voces, inflexiones y pronunciaciones de la palabra objetivo. Hay ciertas advertencias que deben tomarse en cuenta. Primero del número de palabras del vocabulario para el sistema independiente. La efectividad del vocabulario decae de cuarenta a diez palabras. El circuito de descifrado que reconoce el numero de la palabra y realiza la función debe ser diseñada para reconocer los códigos de error 55, 66 y 77 y no confundirlos con los espacios de palabra 5, 6 y 7.

SISTEMA DE SEGURIDAD.
El HM2007 no fue diseñado para su empleo en un sistema de seguridad de voz. Pero esto no impide experimentar con el para este objetivo. Se puede usar tres o cuatro palabras clave que deben ser habladas y reconocidas en la secuencia correcta para activar un circuito que abra una cerradura o permita la entrada.

MODO CPU.
El chip de reconocimiento HM2007 esta hecho para ser conectado a un sistema pc, para esto conectar el chip al bus de la pc, el puerto paralelo o el serie no son un problema. Sin embargo el circuito requerirá el drive necesario para el entrenamiento, control, el almacenaje y el reconocimiento.

5 comentarios:

Anónimo dijo...

quisiera saber donde se puede comprar este chip

ximena dijo...

quisiera saber donde se puede comprar este chip

ximena dijo...

quisiera saber donde se puede comprar este chip

Anónimo dijo...

donde se puede comprar este circuito

salaidhgagne dijo...

Casino Table Games - Slots of Vegas
A very specific table game, a card or 카 심바 a game 더킹 바카라 of skill, is a popular form of casino table 텐벳먹튀 games. 메이저 벳 먹튀 A player's game of skill and knowledge is called a card op사이트 game.