El gigante tecnológico Meta se ha embarcado en una nueva fase de desarrollo de inteligencia artificial (IA) generativa en Europa, utilizando contenido público compartido por adultos en plataformas como Facebook e Instagram. Este avance, anunciado desde el 15 de abril de 2025, representa un hito significativo en la evolución de sus sistemas de IA y destaca la relevancia de la infraestructura de la nube en el ecosistema de datos masivos.
Meta ha comenzado a utilizar publicaciones, comentarios e interacciones públicas generadas en la Unión Europea (UE) para entrenar sus modelos de lenguaje de gran escala (LLMs). Este proceso también incluye las consultas hechas al asistente Meta AI, lanzado recientemente en aplicaciones de mensajería como Messenger, WhatsApp y Facebook, extendiéndose ahora al continente europeo de manera gradual.
El entrenamiento de estos modelos requiere acceso constante a grandes volúmenes de datos textuales que representen el lenguaje y los contextos culturales de operación. Meta argumenta que los datos europeos ayudarán a refinar el entendimiento de dialectos locales y expresiones culturales, algo crucial para modelos que buscan interactuar de manera natural y contextual.
A pesar de que el uso de contenido público para el entrenamiento de IA no es nuevo, lo que distingue el enfoque de Meta es el cumplimiento riguroso de un marco regulatorio más exigente. Tras postergar el entrenamiento en Europa en 2024, a la espera de una evaluación reguladora, la empresa recibió en diciembre el visto bueno del Comité Europeo de Protección de Datos. Ahora, su estrategia de recopilación y utilización de datos se coordina con la Comisión de Protección de Datos de Irlanda.
El respeto a la normativa se sostiene en varios aspectos técnicos, como la exclusión de mensajes privados y contenido de menores, y la implementación de un formulario accesible para que los usuarios de la UE puedan oponerse al uso de sus datos públicos.
El anuncio resalta la importancia de las infraestructuras cloud, fundamentales para llevar a cabo operaciones intensivas de almacenamiento, procesamiento y redes de baja latencia. El entrenamiento multimodal con información de millones de usuarios europeos exige clústeres GPU especializados y sistemas de almacenamiento eficientes. Además, la trazabilidad y la anonimización de datos son esenciales para cumplir con auditorías y regulaciones.
El uso de contenido generado por usuarios plantea cuestiones sobre la soberanía tecnológica y la gestión ética de la información. A medida que se invierten recursos en la construcción de centros de datos y redes interconectadas, el contenido de usuarios se convierte en el recurso indispensable que alimenta la inteligencia artificial.
Este movimiento de Meta reactiva el debate sobre la dependencia tecnológica de plataformas estadounidenses y subraya la necesidad de una estrategia europea de IA que considere tanto la infraestructura como los datos. La experiencia muestra que el recurso más valioso de la economía digital es el usuario, y su interacción se convierte en la base para una inteligencia artificial que predice y genera contenido, utilizando la nube como eje de poder digital.
Meta señala una tendencia emergente: el entrenamiento de IA con datos públicos regionalizados para ofrecer experiencias más personalizadas. Sin embargo, este proceso plantea preguntas técnicas y éticas sobre su implementación, y el sector cloud debe garantizar que la innovación sea compatible con la protección de los derechos digitales europeos.