Se filtran más de 1.000 grabaciones de audio de asistentes privados, admite Google

Google ha sido atrapado en un error de privacidad sobre la recopilación de voces, y la compañía admitió que se filtraron más de 1,000 grabaciones de sonido a un sitio de noticias belga.

Al igual que internet, Google tiene un centro de trabajadores que escuchan las consultas del Asistente de Google de los usuarios para mejorar su inteligencia artificial. Se supone que estas grabaciones permanecen anónimas y, lo más importante, seguras en los servidores de Google.

Pero un contratista de la emisora ​​belga VRT NWS filtró más de 1.000 de estas grabaciones. Las grabaciones supuestamente contienen información confidencial, incluidas direcciones, según VRT. Para confirmar que las grabaciones eran reales, VRT «permitió que los flamencos comunes escucharan algunas de sus propias grabaciones». Estas personas podrían confirmar haber escuchado su propia voz en los clips de audio.

Si bien la filtración de esta información es suficientemente mala, 153 de las grabaciones fueron conversaciones grabadas sin la palabra de activación «Ok Google». Los parlantes inteligentes de Google escuchan estas palabras de activación y solo deberían comenzar a grabar algo una vez que se pronuncian. Entre estos clips de voz se encontraban conversaciones privadas, llamadas de negocios y cosas por el estilo, que los participantes casi con certeza no querían que se grabaran.

Google admitió la filtración en una publicación de blog, donde confirmó que un revisor de idiomas había violado las políticas de seguridad de la compañía y compartió las grabaciones con VRT.

«Nuestros equipos de respuesta de seguridad y privacidad se han activado sobre este tema, están investigando y tomaremos medidas», dijo el gerente de productos de búsqueda de Google, David Monsees. «Estamos llevando a cabo una Análisis completa de nuestras salvaguardas en este espacio para evitar que se repita una mala conducta como esta».

Es el último de una serie de errores de seguridad cometidos por empresas de voz. internet ha estado en los titulares mucho recientemente por la forma en que maneja las grabaciones de Alexa, con informes de que no está anonimizando suficientemente los datos.

Las empresas de voz utilizan trabajadores para escuchar grabaciones con el fin de «entrenar» a la IA. Es una práctica establecida, pero que muchos usuarios no conocen. Y eso es totalmente justo porque Google no dice que esté haciendo esto en sus políticas de privacidad.

OK, Google: es hora de ser más transparentes con nosotros

Google defendió la práctica en su publicación de blog, calificándola de «parte crítica» para mejorar el Asistente.

«Los expertos en idiomas solo revisan alrededor del 0,2 por ciento de todos los fragmentos de audio», dijo Monsees. «Los fragmentos de audio no están asociados con las cuentas de usuario como parte del proceso de Análisis, y los revisores no deben transcribir conversaciones de fondo u otros ruidos, y solo transcriban fragmentos que están dirigidos a Google».

Google también reconoció lo que llama «falsas aceptaciones», momentos en los que el Asistente cree haber escuchado las palabras de activación y comienza a grabar, cuando en realidad nunca se dio el comando de activación. Esto podría explicar las 153 grabaciones no deseadas, pero ese es un número significativo en un tamaño de muestra de 1,000. Así que extrapola eso, y no es una buena apariencia. Además, las políticas de Google establecen que solo se envían a Google las grabaciones previstas, lo que claramente no es el caso.

¿Entonces que puedes hacer? Puede desactivar el almacenamiento de datos de audio en su cuenta de Google si lo desea, o puede hacer que elimine automáticamente sus datos cada tres o 18 meses. Google prometió que estará «revisando oportunidades» para aclarar cómo se utilizan los datos. Ya era hora también.