La comunicación mediante el habla es la forma más habitual de transmitir información entre personas. En este tipo de comunicación, la identidad del interlocutor va a estar fuertemente correlacionada con las características fisiológicas y de comportamiento del mismo (hábitos lingüísticos, entonación de las frases, entre otras). Las bases para el reconocimiento de voz fueron desarrolladas por la compañía Texas Instruments alrededor de 1960 y desde ese momento la identificación por voz ha estado bajo intensas investigaciones y desarrollos. A pesar de esto, la variabilidad presente en la señal de la voz al momento de llevar a cabo el proceso de identificación haciendo uso de sistemas reconocedores de voz resulta perjudicial pues el locutor no puede repetir de forma exacta una misma frase o palabra.
Este tipo de Sistemas deben de ser capaces de trabajar de tres formas distintas:
a) Modo de Entrenamiento: En esta fase se obtienen los patrones y valores de referencia correspondientes a cada uno de los usuarios.
b) Modo de Funcionamiento o servicio: Esta es la fase de utilización del sistema, y en la cual a partir de señales de voz el sistema tomará decisiones acerca de la identidad del locutor.
c) Modo de actualización: Durante la vida útil del sistema, éste deberá ser capaz de incorporar nuevos locutores, dar de baja a usuarios, y opcionalmente actualizar o mejorar modelos y referencias correspondientes a los usuarios presentes del sistema.
La primera gran diferencia entre sistemas viene dada por la dependencia del sistema al texto o mensaje que se necesita pronunciar, teniendo de esta forma lo que llamaremos sistemas dependientes de texto, basados en palabras o frases claves; o sistemas independientes de texto, donde no habrá restricción en el contenido lingüístico del mensaje. La segunda gran clasificación que podemos hacer, y que va a influir de forma significativa en la estructura del sistema final, es entre sistemas de identificación o verificación de locutores. El objetivo de los sistemas de identificación de locutores es clasificar una señal de voz, cuyo origen es desconocido, como perteneciente a uno de entre un conjunto de n locutores. Dentro de estos sistemas, debemos diferenciar dos posibles casos:
1. Identificación en conjunto cerrado: En este caso, el resultado del proceso es una asignación de identidad a uno de los locutores modelados por el sistema, y conocidos como usuarios.
2. Identificación en conjunto abierto: Aquí se debe considerar una posibilidad adicional a las del caso anterior, y es la posibilidad de que el locutor que pretende ser identificado no pertenezca al grupo de usuarios, con lo que debería ser catalogado como impostor al intentar ser identificado como usuario del sistema.
Por el contrario, los sistemas de verificación de locutores toman dos entradas: una de ellas es la señal de voz a verificar, y la otra es una solicitud de identidad, que puede ser realizada de diversas formas: lectura de tarjeta magnética individual, mediante el teclado de un código de locutor, entre otras. De este modo, las dos únicas salidas o decisiones del sistema son la aceptación o el rechazo del locutor.
AQUÍ TIENES UN 👉👉 VIDEO DE RECONOCIMIENTO DE VOZ MUY SENCILLO
QUE PIENSAS DE ESTE MÉTODO FÁCIL Y NOVEDOSO??
COMENTANOS
👇👇👇
No hay comentarios:
Publicar un comentario