Google Duplex: qué es y cómo funciona

¿Alguna vez imaginamos que llegaríamos a conversar con un robot, como si lo hiciéramos con una persona, sin darnos cuenta que se trata precisamente de una máquina?

Quizá algunos usuarios han “vivido” esta experiencia con los asistentes de voz Cortana y Siri, para solicitar cierta información, dado que estas herramientas están integradas en sus dispositivos inteligentes, cuyas marcas seguro son de las más conocidas en el mercado.

Pero de eso a que de alguna forma una persona interactúe con una máquina, sosteniendo una conversación para solicitar un servicio, como reservar mesa en un restaurante o sacar cita en una peluquería, hay un paso enorme, porque se trata de un sistema diferente e innovador.

Es el caso de “Google Duplex”, una nueva herramienta que ha presentado recientemente el gigante Google y que proyecta el paso que faltaba para lograr la “interacción humano-computadora”, la cual permite entablar una conversación normal, concretamente para atender servicios que se hacen en la vida diaria, tales como solicitar reservas o citas.

Google empezará a probar esta nueva herramienta en los dispositivos este próximo verano, incluso Google Duplex podría crear “chats”, debido a factores con los que cuenta el sistema, como la “interacción, el tiempo, el habla y la comprensión”.

¿Cómo funciona Google Duplex?

Luego de saber que el gigante Google ha hecho una herramienta de gran impacto, la pregunta es cómo se puede tener una conversación fluida con un robot, como si se de una persona se tratara.

Para lograr esto, el asistente de voz “Assistant”, basa su sistema en una Red Neuronal Recurrente (RNN), la cual es un sistema que está conectado consigo mismo con la idea de aprender a través de la experiencia, que se va grabando en el sistema, misma que ha sido desarrollada a través de TensorFlow Extended.

Pero para que el asistente de voz haya alcanzado la precisión en el nivel de conversación, la red nueronal fue entrenada con conversaciones anónimas telefónicas.

Dicho sistema se basa en el uso de la tecnología ASR (Automatic Speech Recognition) de Google y va analizando parámetros, con la idea de diferenciar el contexto y entender lo que le está diciendo la otra persona.

¿Pero cómo se consigue que la voz del robot suene natural?

Para hacer eso se utiliza el sistema de dictado (Text speech – TTS), usando Tacotrony WaveNet a fin de controlar la entonación de la voz.

Lo importante en este punto es el lograr introducir las llamadas “speech disfluencies”, que permiten momentos en los cuales se expresan sonidos como “uhhhm”, “mmmm” y “ahmmm”, que son expresiones propias de las personas al momento de hablar y que consigue que la voz sintetizada convenza más al momento de parecer voz humana.

Google Duplex es un sistema capaz de sostener conversaciones de manera independiente sin que intervenga alguna persona, además de que tiene integrado un sistema de monitorización que indica a un operador humano que alguna tarea no se pudo ejecutar del todo.

Es importante saber –y aclarar- que esta nueva tecnología, Google Duplex, está ideada sólo para realizar reservas de servicios, no para abordar cualquier conversación. Esto significa que es limitado el contexto de preguntas y respuestas y que intenta hacer su función de manera dócil.

También es importante aclarar que Google contempla avisar al interlocutor que acceda a esta herramienta, que quien le contesta es una máquina.

Esto con la idea de no engañar a los usuarios y ser transparente en el servicio de una herramienta muy avanzada, que por el momento parece sólo beneficiara a empresas.

No cabe duda que Google Duplex marcará un hito en la y que seguramente no dejará indiferente a nadie.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

44 + = 53