¿Qué es FLoC de Google?

Los proyectos de aprendizaje automático dependen del acceso a conjuntos de datos a gran escala. Actualmente, los procesos comunes para la creación de modelos se han basado en recopilar los datos del usuario en servidores centrales. Esto significa, utilizar técnicas de seguimiento, como cookies de terceros y huellas digitales, pero en un mundo donde la privacidad se vuelve fundamental, este enfoque ha empezado a ser un inconveniente.

La importancia del uso y gestión de las cookies ha ido en aumento, en paralelo con la preocupación de los usuarios por conocer cómo se tratan sus datos, en relación con su privacidad, que aumenta exponencialmente día a día, lo que está obligando a los navegadores a ir abandonando paulatinamente este modelo.

Google Chrome presentó hace un tiempo Privacy Sandbox, pero ha sido en enero de 2021, cuando ha compartido su progreso en el camino para eliminar las cookies de terceros reemplazándolas con nuevas alternativas de privacidad. La propuesta es Federated Learning of Cohorts (FLoC).

FLoC es parte de Privacy Sandbox de Google, la nueva iniciativa para construir un navegador de privacidad diseñado para crear una web con publicidad similar a la actual, pero sin cookies de terceros. A pesar de mantener una web similar, cambiará por completo la forma en la que funcionan los mecanismos de publicidad. Asimismo, se espera que para el año 2022, Google elimine completamente el soporte para cookies de terceros.

¿Qué es el aprendizaje federado?

Esta API de Chrome se basa en el Federated Learning, una técnica de entrenamiento de modelos distribuidos donde los datos permanecen junto al usuario, es decir, los datos del cliente nunca se transmiten a ningún procesador o servidor central.

Los modelos generales se entrenan sin ver realmente los datos subyacentes, la construcción de estos modelos generales se lleva a cabo mediante el uso de modelos locales entrenados en conjuntos de datos personales. En otras palabras, este tipo de aprendizaje es un marco que permite construir un modelo colectivo en el cual se distrubuyen los datos entre los propietarios de los mismos sin su divulgación.

Así pues, muchos navegadores trabajan conjuntamente para formar un modelo centralizado sin intercambiar datos de muestra reales. Google propone que los navegadores creen grupos de usuarios con intereses similares en función de las URL visitadas. Estos datos permanecerían recopilados de forma local y nunca saldrían del dispositivo, alcanzando así el máximo nivel de privacidad.

Federated Learning of Cohorts (FLoC)

FLoC es una API que forma parte de los experimentos de Privacy Sandbox, dedicada a la privacidad de los usuarios. Así pues, se centra en crear grupos de usuarios que presenten hábitos de navegación similares, cuyo principio general es, que los clientes individuales no podrán ser distinguidos dentro de un grupo, ya que solo se conoce el identificador de dicho grupo y no del individuo.

Esta nueva tecnología utiliza una serie de algoritmos de aprendizaje automático para crear clusters dentro del navegador, por ello, los modelos individuales de publicidad personalizada son tan buenos como los generados a partir de cookies de terceros, ya que se parte de la premisa de que todos los usuarios del mismo grupo tienen intereses similares.

Lo más importante es que la información con la que se alimenta el algoritmo se mantenga en el navegador local y no se comparta a ningún otro servidor. El navegador solo expone el cohorte generado, de modo que represente a un grupo determinado de personas que, en conjunto con la privacidad diferencial, se aproveche al máximo la anonimidad.

Hacer que desaparezca un método tan establecido como las cookies de terceros es una tarea laboriosa y complicada. Es fundamental tener en cuenta tres pilares, el usuario y su privacidad, los editores web y los anunciantes. Google Chrome descarta eliminar las cookies inmediato, como así lo hicieron sus rivales Sarafi (Apple), Firefox o Edge (Microsoft).

Por otro lado, existen cosas como la medición y la prevención del fraude, que no pueden manejarse mediante FLoC, pero se han desarrollado nuevas propuestas como TURTLEDOVE, SPARROW o FLEDGE, para abordar estos usos. Asimismo, FLoC no está exento de riesgos, ya que el algoritmo de aprendizaje automático podría construir grupos de personas involuntariamente que revelen categorías sensibles como raza, sexualidad o enfermedades mentales. Google sigue trabajando con este problema reconfigurando el algoritmo o bloqueando estos grupos.

Ventajas adicionales a la privacidad

Se debe conocer que Privacy Sandbox incluye propuestas de marketing para crear e implementar su audiencia a los anunciantes sin el uso de cookies. Una de estas propuestas es FLEDGE, que almacena información sobre las ofertas y presupuestos de diferentes campañas en un servidor confiable. Además, FLoC y FLEDGE no solo exploran alternativas que preservan la privacidad, sino que también ayudan a los compradores a decidir cuanto ofrecer por los anuncios.

Dentro de la zona de pruebas de privacidad de Chrome se han propuesto una serie de tecnologías que permiten medir el rendimiento de las campañas publicitarias sin cookies de terceros, de tal forma que se continúa protegiendo la privacidad a la par que se respaldan los requisitos de los anunciantes. Estas tecnologías son los informes a nivel de eventos y agregados, que permiten a los modelos reconocer patrones de los datos y brindar una medición precisa sobre los grupos de usuarios con intereses afines.

Asimismo, Google busca evaluar cómo se pueden utilizar las API de medición de conversiones de propuestas junto con sus propios productos de medición. Por ejemplo, implementar el etiquetado en la web con una etiqueta global o usar Google Tag Manager.

Otro fin importante de Privacy Sandbox es proteger a las personas de técnicas de rastreo al dejar su huella . Gnatcatcger es la nueva propuesta de Chrome para enmascarar direcciones IP y proteger la identidad de las personas sin interferir con las operaciones normales de un sitio web, evitando así la identificación de los usuarios sin su consentimiento.

Por último, el uso de FLoC junto con la API Trust Token permitirá a las empresas distinguir al usuario real de los fraudulentos sin exponer las identidades de las personas en el proceso. De este modo, se mejorará la detección de fraudes en dispositivos móviles al mismo tiempo que se protege al usuario.

Primeras pruebas en 2021

El sistema FLoC empezará a probarse de manera pública en marzo de 2021, para dar cabida a anunciantes privados a continuación este mismo año. Estas pruebas extendidas a los anunciantes facilitarán a Google feedback  completo sobre el modelo.

Hasta ahora, las pruebas de simulación realizadas han dado resultados positivos. Los equipos de Chrome aseguran que, al utilizar audiencias basadas en intereses, FLoC puede proporcionar una señal de reemplazo efectiva para cookies de terceros.

Es requisito indispensable que las webs lo usen para que sustituya las cookies de terceros, pero existen opiniones negativas sobre el monopolio de datos, ya que puede afectar a la competencia. Además, la EFF cree que puede dar lugar a la segmentación de la población vulnerable, pero Google prohíbe en su política mostrar anuncios personalizados basados en categorías sensibles como raza, sexualidad o que puedan provocar enfermedades psiquiátricas.

En qué se basa la alternativa a las cookies de Google

FLoC se basa en asignar a cada usuario a una cohorte. A un grupo de otros miles de usuarios con quien se compartan los intereses. De esta manera, al agrupar los intereses, no se especifican los datos en concreto sobre el usuario y se mantiene su privacidad, según describe Google. Una categorización por grupos que se quedaría en el navegador, donde únicamente se enviaría al algoritmo el ID de la cohorte.

Floc Api

Según las primeras pruebas de Google, su sistema FLoC es efectivo al 95% para los anunciantes a la hora de identificar correctamente los intereses particulares y realizar conversiones. La idea de FLoC es obtener un sistema suficiente difuso para complicar la identificación de datos personales pero suficiente concreto para que los anunciantes puedan enviar de manera apropiada sus anuncios.

Disponible a partir de Chrome 90

El nuevo sistema estará disponible de manera pública a partir de abril con el lanzamiento de Google Chrome 90, donde los usuarios podrán ver los primeros controles para ajustar su privacidad respecto al rastreo de intereses. Inicialmente, según explica Google, el usuario solo podrá activar o desactivar FLoC y no habrá más personalización, pero el objetivo es que progresivamente el usuario pueda tener un mejor control.

En juego está un negocio de miles de millones de euros. Las cookies han servido durante años a muchos anunciantes, que ahora deberán cambiar su manera de trabajar, pues Google ya ha avisado que «no hay marcha atrás».

Cookies

Por el momento únicamente estará disponible para pruebas y no será hasta el segundo trimestre de 2021 cuando Google empiece a ofrecerlo a los anunciantes. Google ya ha iniciado contactos con la industria para empezar a ver resultados de este proyecto y obtener más datos sobre porcentajes de conversión. Unos datos