Cómo funcionan los asistentes de voz y quién les pone voz
Los asistentes de voz están entrando cada vez más en nuestras vidas. Mucha gente aún no ha empezado a utilizarlas activamente, pero negar su marcha un tanto triunfal es, como mínimo, ilógico. La llegada masiva de los asistentes de voz comenzó en los tiempos del iPhone 4S y Siri. Desde entonces, tenemos que ser sinceros, no se ha vuelto mucho más inteligente, lo cual es extraño. Además de ella, también están Alexa, Google Assistant, Cortana, Alice, Portal e incluso la reciente Marusya del grupo Mail.ru. Todos ellos tienen un objetivo en común: hacer que los usuarios sientan la presencia de un asistente virtual que cumplirá cualquier (casi) petición. La pregunta es: ¿por qué hablan con voces femeninas y quién les pone voz?
Cómo funciona el asistente de voz
En primer lugar, conviene aclarar cómo empiezan a hablar los asistentes de voz. A pesar del aparente realismo de su voz, y a veces incluso de la entonación, hay un ordenador detrás de cada frase, no una persona real. Es el que sintetiza las letras y las palabras, juntándolas en una sola frase. Aunque los seres humanos también tienen su aparato del habla unido a él.
Naturalmente, no es posible trasladar toda la base y todos los desarrollos de reconocimiento de texto y síntesis de voz a un teléfono móvil. Por ello, los asistentes sólo funcionan cuando están conectados a la Red. En otros casos, simplemente dicen que hay problemas con la conexión. Esta es casi la única frase que tienen fuera de línea.
Finalmente, su petición se envía al servidor para determinar lo que ha dicho, los datos se procesan y la respuesta vuela de vuelta. El asistente vuelve a interrogar al servidor: «¿Qué ha dicho?». Todo sucede en segundos o incluso en fracciones de segundo, pero, con pocas excepciones, así es como funciona.
Una vez procesada la orden por el servidor, ésta se devuelve como orden de retorno o se genera una consulta de búsqueda que da lugar a una respuesta de voz (en el caso del teléfono móvil, también una respuesta visual). En el primer caso, se enciende la luz, se abre la puerta, etc., y en el segundo se anuncia el tiempo o, por ejemplo, las últimas noticias.
Además, trabajar a través de un servidor permite hacer más versátiles los gadgets del hogar inteligente. De este modo, podrá asegurarse de que trabajen a distancia. Por ejemplo, para encender la tetera al acercarse a la casa, para encender la luz del garaje por adelantado o para encender el robot aspirador mientras se está trabajando.
¿Por qué los asistentes de voz hablan con voz femenina?
Para responder a esta pregunta, vale la pena remitirse a la psicología o, simplemente, plantearse la cuestión de a quién le gustaría oír la voz: ¿a un hombre o a una mujer? Los hombres responderán que femenino, y la opinión de las mujeres estará dividida. La voz de una mujer no repele a ninguno de ellos, aunque la de un hombre sea más bonita.
Ahí está la respuesta. Es que la voz femenina es tratada con más lealtad por toda la gente que la voz masculina. Sin embargo, si lo desea, algunos asistentes ofrecen también una versión masculina de la voz. Pero los fabricantes se resisten a introducir una función de selección por voz. En este caso, se pierde lo más importante: la actitud del usuario hacia el asistente como un asistente vivo, no como una máquina.
Además, se cree que una voz femenina es tranquilizadora y permite una actitud más relajada ante lo que ocurre. Por eso, en casi todos los aviones militares es la voz de una mujer la que anuncia las órdenes sobre la aproximación al ángulo crítico de ataque, la posible entrada en pérdida y otros momentos desagradables.
¿Qué voz crees que debería usar el asistente de voz si no se puede cambiar? Responde a continuación y discutamos en detalle sobre ello en nuestro chat de Telegram.
¿Cómo se expresan los asistentes de voz?
Cómo ya he dicho, muchos asistentes de voz trabajan con una voz totalmente sintética. Es decir, todo lo que dicen es una voz en off con cierto tono, afinación y otros ajustes. No hay ninguna persona real detrás. Un ejemplo de estos asistentes es el de Google.
Algunos asistentes de voz, por el contrario, están locutados por personas reales que son actores, locutores o hacen locuciones en la vida normal (anuncios, dibujos animados, gadgets). De este modo, la voz se vuelve más humana y el usuario no la percibe como un ordenador, sino como un asistente real. La psique es tal que es más fácil y agradable sentir la presencia de un humano que la de un trozo de metal «sin alma».
Para construir un modelo de voz, su propietario debe leer en voz alta muchas frases y sonidos típicos, que luego se procesan y generan en la propia voz del asistente. Cuantas más frases se graben, más viva será la voz y menos errores habrá.
Un ejemplo de la falta de desarrollo de la voz lo encontré mientras conducía por Estados Unidos. El navegador que recogí donde recogí el coche estaba en ruso. En lugar de «Hai Wei», el navegante dijo «Hwai». Las voces localizadas del navegador no son tan importantes como el asistente de voz, que debería estar en casi todas partes. Así que ahí me lo tomé con humor y me aseguré una vez más de que los creadores de voces para los asistentes hagan su trabajo con más responsabilidad. Ni una sola vez me he encontrado con esos fallos, por ejemplo con Alice.
¿Quién pone voz a los asistentes de voz?
Probablemente, la asistente de voz más famosa es Susan Bennett. Fue ella quien puso voz a la Siri original en inglés.
Nació en 1949 en Clinton, Nueva York, Estados Unidos. Susan ha dedicado toda su vida a las artes, dedicándose a la interpretación, e incluso ha probado suerte como productora. Aunque no tiene muchos papeles en el cine, pero sí muchos trabajos de doblaje.
Por ejemplo, ha puesto voz a anuncios de Ford, Coca-Cola, Fisher-Price, McDonald’s, Goodyear, VISA, Hot Pockets y Cartoon Network, entre otros. También es la voz del sistema de megafonía de Delta Air Lines en las terminales de todo el mundo, y de diversos sistemas de navegación y telefonía. Desde el 4 de octubre de 2011, ha inmortalizado su voz con Siri.
La versión rusa del asistente de Apple habla con la voz de Maria Konoplyanskaya. No es posible encontrar mucha información sobre ella, pero sí podemos decir que su experiencia como locutora no es tan amplia como la de Susan Bennett. Además, hay que señalar que su voz está muy procesada, pero en ella todavía se puede reconocer a su anfitriona.
Otra versión del asistente es Alexa de Amazon. La voz original también está basada en un ordenador, aunque posteriormente se decidió añadir una voz masculina y se eligió a Samuel L. Jackson como base. Cómo recordatorio, entre sus principales trabajos recientes está el papel de Furia en las películas de Marvel.
Mucha gente conoce un asistente de voz como Cortana de Microsoft. El asistente lleva el nombre de la heroína de la serie de juegos de ordenador Halo, que se lanzan en XBox y PC, obviando la PlayStation. En el original, la voz del asistente es la misma que pone voz a la heroína del juego, Jen Taylor.
Aquí llegamos a nuestra compatriota, que originalmente iba a llamarse Maya, pero este nombre se descartó, ya que es muy parecido al nombre del mes y puede provocar desencadenantes accidentales al pronunciar frases comunes. Acabó llamándose Alice. Entre otros requisitos para el nombre estaba la ausencia del sonido «er», que los niños pequeños no pronunciarían bien, y no debía ser común, de nuevo para eliminar los disparos accidentales. Sin embargo, en este sentido, los autores todavía reaseguraron y dieron la posibilidad de llamar al asistente con la palabra «Yandex». Si tienes a Alice en tu familia, está bien, pero si tienes a alguien que se llama Yandex, ya deberías pensártelo dos veces. Si dos niños se llaman Alice y Yandex, las autoridades deberían preocuparse.
La voz de Alicia es la de Tatiana Shitova, que pone voz a Scarlett Johansson, Charlize Theron y otras actrices en películas en ruso.
No he podido encontrar ninguna confirmación de esta versión, ni siquiera una mención a ella en ningún sitio, pero me parece muy extraña una coincidencia. En 2014 se estrenó la película de ciencia ficción Lucy, protagonizada por Scarlett Johansson. Al final de la película, la protagonista fue capaz de poner su mente, bombeada por una poderosa hormona, dentro de un ordenador. Cómo resultado, acabó en todos los ordenadores del mundo por una buena causa.
Así que, unos años después, Yandex lanza un asistente y habla con la voz de esa misma Lucy. Quizá sea una coincidencia, quizá no, pero el hecho me pareció muy interesante.
Cómo puedes ver, todos los asistentes son diferentes, pero el uso de una voz en directo en ellos ayuda mucho a utilizar todas las funciones, a hacerlo con gusto y a asimilar fácilmente lo que se dice. Por supuesto, seguirán evolucionando. Al final, cada uno de nosotros tendrá su propio Jarvis viviendo en casa que hará literalmente de todo. Por ahora, los asistentes sólo pueden ayudar, pero tenerlos en los altavoces ya facilita la vida. Lo más importante es que te acostumbras a ellos y empiezas a apreciarlos. Así que estamos esperando que se desarrolle esta tendencia tecnológica.