¿Por qué tantos asistentes virtuales tienen voz de mujer?
La tecnología que hace funcionar funciones como Siri, Alexa y Cortana utiliza por defecto la voz de una mujer por una razón: la mayoría de la gente la prefiere.
Los investigadores afirman que nos basamos inconscientemente en nuestros propios prejuicios culturales al tratar con asistentes de voz virtuales, tratándolos como seres sociales y viéndolos a través de una lente de género.
¿Es tu smartphone “sexista”? El auge de la tecnología de asistentes de voz (y las disparidades de género que existen desde hace tiempo en la industria tecnológica) hace que asistentes como Siri, Alexa y Cortana estén bajo la lupa debido a las afirmaciones de que promueven estereotipos de género y animan a los usuarios a tratar a las mujeres como serviles. Pero, ¿fomenta esta tecnología los prejuicios de género o sólo los refleja?
Las críticas a los asistentes de voz sexistas surgieron al mismo tiempo que los publicitados lanzamientos de las voces propias (muchas femeninas) que acompañan a los teléfonos inteligentes y otras tecnologías. Y las protestas no han hecho sino aumentar con la penetración de los asistentes de voz, que, según las previsiones, utilizarán 8400 millones de personas en todo el mundo a finales de 2024.
¿A qué se deben las objeciones? “Máquinas obedientes y serviciales que pretenden ser mujeres están entrando en nuestros hogares, coches y oficinas”, dijo Saniye Gülser Corat, directora de igualdad de género de la UNESCO, en una declaración que acompaña a un informe de la UNESCO de 2019 sobre asistentes de voz y género.
“Su servilismo de fabrica influye en cómo la gente habla a las voces femeninas y modela cómo las mujeres responden a las solicitudes y se expresan”.
La agencia de la ONU informa que “con raras excepciones”, los asistentes de voz son intencionalmente femeninos, una elección que las compañías tecnológicas dicen que está impulsada por un mercado que confía y prefiere las voces femeninas.
(Relacionado: La IA, clave para resolver los problemas de salud femenina más olvidados)
Decisiones rápidas
“La voz es supercompleja, muy multidimensional”, afirma Naim Zirau, coautor de un estudio de 2021 sobre asistentes de voz, género y tono mientras trabajaba como investigador en la Universidad de St. Gallen en Suiza. Factores como la edad, el sexo del oyente, la demografía y su comprensión de la tarea del asistente de voz parecen influir en cómo reaccionamos ante una voz de género.
El equipo de Zirau desarrolló una interfaz de voz y pidió a los sujetos que reservaran un vuelo o hicieran una encuesta financiera con la ayuda de voces de distintos tonos, asociados desde hace tiempo al sexo y al género debido a las hormonas que hacen que las voces masculinas sean generalmente más graves que las femeninas. Descubrieron que los oyentes tomaban decisiones instantáneas sobre el sexo de un asistente virtual cuando oían cada voz, y que el mero hecho de oír una voz que asociaban con un sexo determinado les hacía hacer suposiciones estereotipadas sobre el asistente informático en cuestión.
Los usuarios eran más propensos a atribuir estereotipos como “delicado” y “empático” a las voces codificadas como femeninas, mientras que las voces codificadas como masculinas sonaban “dominantes”. Además, los participantes asignaron sistemáticamente un género a una voz de género neutro, incluso cuando se les dio la opción de decir que estaban indecisos. “La gente tiene una percepción muy dualista del género”, afirma Zirau.
Algunos investigadores afirman que podemos tomar una decisión sobre el género de un hablante en sólo cinco segundos, pero a menudo nos contradecimos en nuestras preferencias. Una encuesta realizada en 2020, por ejemplo, descubrió que, aunque la mayoría de hombres y mujeres decían que querían oír una voz femenina en su altavoz inteligente, los acentos locales desempeñaban un papel importante a la hora de determinar la credibilidad de un orador, independientemente de su sexo. Y otras investigaciones muestran que la confianza de la gente en las voces de distintos géneros varía según los contextos sociales.
(Relacionado: ¿Por qué a algunos nos inquieta (y asusta) la inteligencia artificial?)
El efecto “las mujeres son maravillosas
¿Por qué resulta tan convincente codificar una voz computerizada como masculina o femenina? Chris Mayhorn, director del departamento de psicología de la Universidad Estatal de Carolina del Norte (EE. UU.), afirma que la culpa la tienen las normas sociales y una antigua tendencia a antropomorfizar las máquinas. “Cuando la gente oye una voz, acaba recurriendo casi automáticamente a las normas sociales”, explica, incluido el género binario.
Mayhorn es coautor de un estudio reciente que examina la influencia del género percibido en la percepción de los asistentes de voz por parte de los participantes. En general, los participantes confiaban más en una voz femenina para consejos sobre medicación y percibían las voces femeninas como “más benévolas” que las masculinas, un prejuicio social común que a veces se denomina “efecto de las mujeres maravillosas”.
No es que la gente asuma que los ordenadores o los asistentes de voz son humanos reales con género, dice Mayhorn. Más bien, es una prueba de cómo los humanos aportan inconscientemente sus propios prejuicios culturales, tratando a los ordenadores como seres sociales y viéndolos a través de una lente de género.
El marketing y las interfaces de usuario de las empresas tecnológicas han tenido los mismos efectos, ya que los asistentes de voz más populares tienen nombres femeninos y voces basadas en grabaciones de actores femeninos. Aunque muchas empresas tecnológicas han eliminado marcadores como “femenino” y “masculino” de sus opciones de voz, los asistentes de voz más populares se identificaban inicialmente como femeninos en sus sistemas operativos, los portavoces de las empresas se referían a ellos como femeninos e incluso estaban programados para responder al acoso sexista con comentarios de flirteo.
En 2017, una portavoz de Microsoft declaró al Wall Street Journal: “Para nuestros objetivos (crear un asistente útil, comprensivo y digno de confianza), una voz femenina era la mejor opción”. Otras empresas han sido más evasivas sobre sus razones para elegir voces codificadas como femeninas para hacer cosas como programar, manejar la correspondencia y enviar recordatorios: todas tareas que están abrumadoramente codificadas como femeninas en el hogar y el lugar de trabajo.
“Al final, lo que la gente busca es lo que aumenta el compromiso”, dice Zirau, que ahora trabaja como ingeniero senior de IA en IBM.
¿Un futuro de género neutro?
¿Podría haber en el futuro menos voces femeninas y más neutras? Tal vez. Aunque la mayoría de los asistentes de voz ofrecen voces masculinas y femeninas, las voces sin género siguen estando infrautilizadas a pesar de las múltiples propuestas de conceptos de voz sin género. Una excepción es Apple, que ahora etiqueta las voces genéricamente en lugar de por género y que ofrece una voz Siri de género neutro grabada por un miembro de la comunidad LGBTQ+. Sin embargo, esa voz no es la predeterminada del teléfono, y la investigación psicológica sobre cómo los usuarios reaccionan e interactúan con voces aparentemente sin género está aún en pañales.
Lo que está claro es que los asistentes de voz inteligentes, considerados tan novedosos hace apenas una década, son más populares que nunca. En 2022, se calcula que 142 millones de usuarios tenían asistentes de voz, y se prevé que esa cifra aumente hasta 157,1 millones de usuarios (casi la mitad de la población estadounidense) en 2026. La pandemia de COVID y el uso cada vez mayor de smartphones explican el vertiginoso aumento de los asistentes. Y Mayhorn dice que la investigación de su equipo muestra que los adultos mayores también están más comprometidos con los asistentes de voz que nunca. “Muchos de ellos tienen más experiencia con la asistencia por voz que los jóvenes universitarios”, afirma; “eso me dice que estamos empezando a ver la penetración de la tecnología en los hogares y que la gente está empezando a entender [su] valor y valía”.
Dada la aparente saturación de la tecnología (se prevé que más de la mitad de los estadounidenses utilizarán un asistente de voz en 2026), es fácil olvidar que los asistentes de voz siguen siendo relativamente nuevos, ya que el primer lanzamiento a gran escala se produjo hace apenas 13 años. Eso significa que aún hay tiempo para que las empresas y el público tengan en cuenta las posibles consecuencias de los estereotipos de género y la asistencia por voz. Aumentar la diversidad de género en el sector tecnológico también podría ayudar. Pero solo el tiempo dirá si las expectativas creadas por Siri, Alexa y sus homólogas codificadas en femenino, alimentadas por una sociedad que parece no poder abandonar el binario de género, podrán ser superadas.
Este artículo se publicó originalmente en inglés en nationalgeographic.com.