El reconocimiento de voz es una modalidad biométrica que analiza las características de la voz humana para identificar a las personas. La biometría de voz, ampliamente considerada como una tecnología rápida, económica, sin contacto, fluida y altamente segura, ya se ha incorporado a una serie de aplicaciones cotidianas: transacciones en línea para bancos, comercios minoristas y atención médica, centros de llamadas, chatbots, asistentes de inteligencia artificial, dispositivos de IoT e incluso control de acceso físico.
Pero esto no ha hecho más que empezar. Se espera que la tecnología se adopte aún más ampliamente en los próximos años, gracias a los rápidos avances de la inteligencia artificial y las redes neuronales, que han hecho posible algoritmos más rápidos, precisos y eficientes. La velocidad de los avances de esta tecnología es tal que algunos sistemas de reconocimiento de voz ya han superado la precisión de un PIN de 4 dígitos.
Como ocurre con otras modalidades biométricas, la biometría de voz es un tipo de identificación de «lo que eres» que ofrece distintas ventajas sobre los métodos que se basan en «lo que sabes», como las contraseñas o «lo que tienes», como los tokens físicos. Esto significa que no se puede perder, olvidar ni robar. Esto aumenta exponencialmente la seguridad y minimiza las infracciones causadas por el phishing y otros ataques.
Además, la biometría de voz suaviza la experiencia del cliente al eliminar los incómodos procedimientos de inicio de sesión.
La biometría de la voz se rige por los aspectos fisiológicos de la producción de voz. Con al menos 70 partes diferentes del cuerpo trabajando en conjunto para producir expresiones, no faltan las características y los factores que forman la huella vocal de una persona, que es tan única como una huella digital. De este modo, el software de reconocimiento de voz puede medir estos factores que hacen que cada huella de voz sea única.
Hay dos maneras de analizar las huellas de voz: activas o pasivas. Si bien pronunciar una frase específica puede acelerar la autenticación de voz, el método pasivo, en el que la persona simplemente habla de forma natural, funciona igual de bien. Esto se debe a que el reconocimiento de voz no depende de las frases habladas sino de las minucias de la voz.
Para verificar una identidad mediante un procedimiento de comparación individual, el sistema de reconocimiento de voz captura una nueva muestra de voz que se compara con la huella de voz inscrita inicialmente.
En una técnica de «uno a muchos», se compara una muestra de voz de una identidad desconocida con varias plantillas de inscripción para tratar de encontrar una que coincida.
Dado que tu voz va contigo a todas partes y no puede olvidarse como una contraseña ni robarse como un token, el reconocimiento de voz es una de las modalidades más seguras del mercado.
Sin embargo, esto no disuade al estafador de intentar explotarlo mediante la grabación de audio de la voz de una persona inscrita. Para frustrar estos intentos, los desarrolladores han integrado funciones de detección de la vida en un software que analiza minucias para garantizar que quien habla es de carne y hueso.
Una gran ventaja del reconocimiento de voz es su persistencia. Si bien la mayoría de las modalidades son «de una sola vez», en las que una persona permanece autenticada después de iniciar sesión, el reconocimiento de voz puede ser un proceso continuo. En teoría, un defraudador que obliga a una persona a iniciar sesión en una llamada telefónica mediante la tecnología de reconocimiento de voz puede tomar el relevo para llevar a cabo actividades ilegales. Sin embargo, con un sistema de autenticación por voz mejorado, es posible realizar una comprobación continua para asegurarse de que la persona que interviene en la llamada sigue siendo la persona autenticada originalmente.
No se puede exagerar el beneficio de esto para los bancos y los centros de llamadas, ya que podría ahorrarles millones.
Por el momento, la biometría de voz registra una tasa de aceptación falsa (FAR) del 0,01 por ciento y una tasa de falso rechazo (FRR) del 5 por ciento para el desbloqueo de dispositivos mediante la autenticación biométrica. Si bien esta cifra sigue por debajo del estándar de seguridad para desbloquear dispositivos móviles y ordenadores portátiles, el nivel de precisión de la tecnología de reconocimiento de voz ahora supera al de un PIN y se espera que mejore rápidamente.
Como se mencionó anteriormente, la banca es la principal beneficiaria de esta tecnología, y muchos de los bancos gigantes, como HSBC, Barclays y Santander, ya utilizan la tecnología para acelerar el proceso de autenticación de los clientes de canter llamadas.
Un enorme 93% de los clientes de Barclays han declarado estar satisfechos con el sistema de reconocimiento de voz, que reduce el tiempo de transacción en unos 20 segundos al realizar transacciones con los centros de llamadas del banco.
Otro adoptante satisfecho es HSBC, que ha observado una disminución del 50% en el fraude bancario gracias a la tecnología de reconocimiento de voz.
El banco eslovaco Tatra Banks presume de haber reducido el tiempo de transacción por cliente en un asombroso 66 por ciento, a solo 27 segundos. El sistema de reconocimiento de voz ha hecho que la eficiencia se dispare y ha reducido la demanda de operadores.
La tecnología de reconocimiento de voz también está avanzando en el comercio minorista y el comercio electrónico, la educación, la aplicación de la ley, la atención médica, los recursos humanos y el marketing.