El gran robo del siglo Editorial

Óscar López, mucho ruido y pocas nueces, o cómo la transformación digital de España está en manos de un lobista de las tecnoligarquías que no respeta los derechos de autor

Johann Heinrich Wilhelm Tischbein Diogenes Searching for an Honest Man 1780
Diógenes buscando un hombre honesto (en este artículo no aparece). Atribuido a Johann Heinrich Wilhelm Tischbein

El jueves catorce de mayo, Óscar López acudió al I Encuentro Internacional de Derechos Digitales de Barcelona que ha organizado el Gobierno y Mobile World Capital, para participar en una sesión titulada con cierto pesimismo bíblico Profecía y poder: el futuro de la democracia en la era de la IA. Le acompañaba la filósofa de Oxford Carissa Véliz, autora de Privacy is Power, y moderaba el periodista Pipo Serrano. El ministro para la Transformación Digital y de la Función Pública desplegó allí una de sus oratorias predilectas, esa en la que España aparece como vanguardia regulatoria mundial frente a un puñado de oligarcas tecnológicos sin escrúpulos. Aseguró que «cuanto más conocemos, más nos radicalizamos en la conciencia de que vamos tarde», lamentó que existe «un poder en muy pocas manos» que está definiendo «el modelo energético del futuro, la educación, la seguridad, la defensa o la privacidad de los datos», advirtió que, sin alianza entre potencias medias, «el sur global se va a convertir en una pila y un archivo que va a aumentar las cuentas millonarias de cinco poderosos» y enumeró los logros ministeriales con la cadencia memorizada del camarero de barrio cuando recita el Menú del día. La Carta de Derechos Digitales, el Observatorio, la AESIA, el reglamento europeo, la mayoría de edad digital, la prohibición de los deepfakes sexuales, los treinta mil millones en chips y semiconductores, las cátedras universitarias inundadas. Hasta encontró tiempo para una buena frase, esa según la cual no quiere que en el futuro, cuando se celebren juicios sobre lo ocurrido con las redes y la IA, «aparezcan ingenieros diciendo que también se les fue de las manos». Véliz, sentada a su lado, recordaba mientras tanto que la inteligencia artificial es «una máquina de predicción» heredera del astrólogo medieval y el Oráculo de Delfos, y que estamos «obedeciendo las órdenes de estos tecnólogos disfrazadas de profecías».

Ahora bien, si nos saltamos la palabrería ministerial, resulta que quien hoy denuncia a los cinco poderosos es el mismo ministro que dirige el departamento responsable de ALIA, el modelo fundacional español presentado por Pedro Sánchez en HispanIA 2040 y entrenado en el Barcelona Supercomputing Center a partir de Common Crawl, ese repositorio de trescientos mil millones de páginas web donde figuraba prácticamente toda la producción editorial española sin autorización de sus titulares. CEDRO ha denunciado que cincuenta mil libros publicados en España fueron usados sin permiso para alimentar modelos generativos, citando a Pérez-Reverte, María Dueñas, Almudena Grandes, Aramburu, Mendoza, y editoriales como Planeta o Anagrama. Su director general, Jorge Corrales, lo ha definido como «una oportunidad perdida para volver a conectar la actuación de algunos gobiernos y de las grandes empresas tecnológicas con los valores de la sociedad». La abogada Eva Moraga lo explicó con más crudeza en el Senado el pasado junio. El Estado entrenó su IA sin el permiso de sus titulares. Lo conté en su día en estas mismas páginas, en aquella primera entrega del Gran robo del siglo dedicada al saqueo de Dialnet por el BSC. El ministerio se escuda en la directiva europea de minería de textos y datos, una norma concebida para la investigación académica que jamás contempló el entrenamiento industrial de modelos generativos, y exige al autor que se ponga él mismo la pegatina del opt out en cada rincón de internet donde aparezca su obra. La carga de la prueba recae sobre el expoliado. Y a Common Crawl, además, hay que sumarle otro ingrediente del que el BSC nunca habla con detalle. Las cifras del modelo no cuadran con los corpus oficialmente declarados, y todo apunta a que ALIA hereda también el corpus de su predecesor, MarIA, construido sobre el Archivo Web de la Biblioteca Nacional de España, esto es, el barrido sistemático del dominio .es que la BNE viene capturando desde 2009 y que en su día cedió al BSC sin pedir permiso a los titulares de los millones de páginas allí almacenadas. No hace falta filtrar nada para confirmarlo: basta con preguntárselo a Gemini, la IA de Google, para que la propia competencia describa con todo lujo de detalles cómo ALIA «hereda y aprovecha directamente» los recursos de MarIA, citando como fuentes la propia BNE, el portal datos.gob.es del Gobierno, la documentación técnica del BSC y reportajes de prensa. El expolio lo documenta la competencia, y las pruebas las firma, sin saberlo, el propio Estado expoliador1. Tal es el modelo humanista del que López presume mientras señala con el dedo a Silicon Valley.

A esa apropiación originaria le sigue, en perfecta continuidad lógica, la negativa del Gobierno a obligar a las grandes plataformas a compensar a los titulares por el uso masivo de sus obras. Frente a quienes, como yo y otros editores, sostenemos que entrenar un modelo fundacional sobre obras protegidas exige licencia y remuneración, López prefiere financiar con dinero público proyectos de IA aplicados a los propios medios para que estos se digan a sí mismos lo que ya saben. Mientras tanto, su Kit Digital, esa ayuda estrella que recita con orgullo en todos los actos del PSOE, ha funcionado como una transferencia opaca al sector intermediario de los llamados agentes digitalizadores. Una marabunta de consultoras y holdings facturando bonos a pymes y autónomos que en muchos casos recibieron páginas web con un solo seguidor en Facebook, ordenadores un 50% más caros que si se compran en Media Markt y plataformas inservibles. Y a todo esto se añaden los retrasos sistemáticos de hasta dos años en los pagos a los agentes, inhabilitaciones sin resolución administrativa, IVA e IRPF no cubiertos por la subvención y, en el reverso del relato oficial, una plataforma de afectados en Facebook con decenas de testimonios y demandas colectivas en preparación. El cuadro es el contrario del de una transformación digital. Es una redistribución hacia arriba travestida de modernización.

Y ahora viene la segunda parte, que yo le llamo la ChapuzIA: el Kit Digital para medios con foco en Inteligencia Artificial, esos ciento veinticuatro millones del Plan de Acción por la Democracia que López defendió ante el Consejo de Ministros con la coartada del artículo veinte de la Constitución y la lucha contra los bulos. El propio reparto desmiente la retórica. Las primeras adjudicaciones de la línea de IA, seis millones y medio repartidos entre dieciocho proyectos, han ido a parar al Grupo Godó, Prisa, Vocento, Prensa Ibérica, Europa Press, El Confidencial, eldiario.es y la editora de Gara. Arsenio Escolar, presidente de CLABE, la mayor asociación de editores de España con ciento noventa y una empresas y mil trescientas cabeceras, lleva meses advirtiendo de lo evidente. Que estas ayudas, si no se segmentan, terminarán concentrándose en los mismos grupos que históricamente han monopolizado la publicidad institucional, dejando fuera a los medios emergentes, locales, especializados y técnicos. Que la dotación es insuficiente. Que falta auditoría, transparencia y un sistema de medición de audiencias homologable. Su llamamiento, formulado en sede parlamentaria, es educado. La traducción menos diplomática es que el ministerio, con un brazo, autoriza el saqueo cultural por parte de las tecnoligarquías y, con el otro, reparte ayudas para que los grandes grupos mediáticos digieran sin protestar el resultado de ese saqueo. Mientras tanto, los autores, los editores independientes y las pequeñas redacciones que sostienen el pluralismo real cargan dos veces, primero como expoliados, después como excluidos del reparto.

A quien aún quiera concederle a López el beneficio de la ingenuidad, le conviene repasar la escena del pasado septiembre en el Congreso de los Diputados. Una jornada institucional, programa cuidadosamente armado, mesa redonda sobre «derechos digitales, bienestar y competencias para el futuro», y un cierre institucional firmado por el propio ministro. El plato fuerte era la presentación de The Future Report: Teens and Tech – A Spanish and European Perspective, un informe de Google con colorines, números grandes y muy poca letra que asegura, tras encuestar a más de siete mil adolescentes europeos, que el ochenta por ciento de los chicos españoles utiliza ya YouTube para aprender materias escolares. La conclusión flotaba sobre el escenario sin necesidad de enunciarse. Si los chavales ya lo usan, lo lógico es darle entrada oficial al currículo. Quien presentaba el informe en sala era Brian Crowley, director de Trust & Safety de Google. Quien lo acompañaba en la mesa, junto al secretario de Estado de Juventud y a una diputada socialista, era Miguel Escassi, director de Asuntos Públicos de Google Iberia. Quien clausuraba con el sello ministerial era Óscar López. Y quien había sido, antes de aterrizar en Google, asesor de Transformación Digital de Nadia Calviño durante la definición de la Agenda España Digital 2025 y del propio Plan de Recuperación, era el mismo Escassi. La puerta giratoria, en estado puro, abierta de par en par en la sede de la soberanía nacional. Me llevan los demonios cuando escucho hablar al señor Ministro de los malos que son los tecnoligarcas mientras legitima el desembarco de una plataforma publicitaria, con el agoritmo más adictivo de todos lo tiempos, en las aulas españolas.

La maniobra recuerda, como tantas veces, a la del iPad de Apple en la década pasada. Primero se documenta un uso espontáneo. Después se contrata un informe que lo cuantifique. A continuación, se presenta el informe en sede institucional. Más tarde se firman convenios con comunidades autónomas. Al final, una generación entera se ha educado dentro del ecosistema corporativo de una empresa privada extranjera y la conversación sobre soberanía digital se ha vuelto académica, porque la soberanía ya se entregó hace tres reformas administrativas. Doce de las diecisiete comunidades autónomas españolas tienen ya convenios con Google o Microsoft para que sus centros educativos usen gratuitamente sus suites. Google va ocho a cinco. Los datos de millones de menores españoles circulan por servidores cuya jurisdicción no pisamos. Mientras tanto nos tenemos que tragar al ministro casiforniano denunciar en Barcelona que «el «poder está en muy pocas manos» es el mismo que pone la rúbrica institucional al desembarco de una de esas pocas manos en la enseñanza pública. Telita.

Escuchar a Óscar López hablando de soberanía digital y de IA humanista tiene un nivel de cinismo muy acorde con los tiempos que vivimos. La transformación digital de España, contada por él, es un relato en el que el Estado entrena modelos con obras protegidas, financia con dinero público a las grandes consultoras, reparte ayudas a los grandes grupos mediáticos para que escriban la versión amable de la historia y abre simultáneamente las puertas de las aulas a Google bajo el envoltorio retórico de la lucha contra los cinco poderosos. Es una arquitectura perfecta: indignación filosófica frente a Silicon Valley, mientras se firman contratos, se realizan informes a la carta, se hacen convenios autonómicos, asumen el expolio cultural, y activan las puertas giratorias para que los plenarios institucionales les bailen el agua. Carissa Véliz cerró la sesión de Barcelona con una sentencia que cobra otro sentido si uno la lee con el ministro a la izquierda. «Hay batallas en la vida que son tan importantes que hay que estar en el lado correcto de la historia sin plantearse si vas a ganar o perder, porque estar en el lado incorrecto de la historia no es una opción». El gran robo del siglo no lo están perpetrando solo Silicon Valley y los gigantes chinos. Lo está facilitando, también, los de este ministerio que se presenta como su antagonista mientras pasea de la mano de sus lobistas por el Congreso de los Diputados.

1 Consultada Gemini sobre si para entrenar ALIA se utilizó el corpus de MarIA, la respuesta es afirmativa y aporta el detalle: ALIA «hereda y aprovecha directamente los recursos y el conocimiento acumulado» del proyecto anterior, cuya base eran los archivos web de la Biblioteca Nacional de España, y «se apoya en esa misma base de datos patrimonial» integrándola «en una receta de datos mucho más grande, diversa y multilingüe» en la que el castellano y las lenguas cooficiales representan en torno al veinte por ciento del total, frente al cuarenta por ciento del inglés. Las fuentes citadas son: la nota oficial de la BNE, que indica que MarIA ha sido creada por el Barcelona Supercomputing Center y entrenada en el superordenador MareNostrum con archivos de la Biblioteca Nacional de España, publicada bajo el titular El archivo de la web española, campo de entrenamiento lingüístico para sistemas de inteligencia artificial; el portal oficial datos.gob.es, donde se documenta que el proyecto fue promovido por la Secretaría de Estado para la Digitalización y la Inteligencia Artificial y desarrollado por el Centro Nacional de Supercomputación, basado en los archivos web de la Biblioteca Nacional de España; la documentación técnica del BSC en el ALIA Kit, donde figura la genealogía de la familia Salamandra; la Fundación Rafael del Pino, que documenta el uso adicional de Common Crawl; y el reportaje de El Debate del 27 de enero de 2025, que cuantifica la composición del corpus en un veinte por ciento de castellano y lenguas cooficiales frente a un ochenta por ciento de otros idiomas, con predominio del inglés.

SUSCRIPCIÓN MENSUAL

5mes
Ayudas a mantener Jot Down independiente
Acceso gratuito a libros y revistas en PDF
Descarga los artículos en PDF
Guarda tus artículos favoritos
Navegación rápida y sin publicidad
 
 

SUSCRIPCIÓN ANUAL

35año
Ayudas a mantener Jot Down independiente
Acceso gratuito a libros y revistas en PDF
Descarga los artículos en PDF
Guarda tus artículos favoritos
Navegación rápida y sin publicidad
 
 

SUSCRIPCIÓN ANUAL + FILMIN

105año
Ayudas a mantener Jot Down independiente
1 AÑO DE FILMIN
Acceso gratuito a libros y revistas en PDF
Descarga los artículos en PDF
Guarda tus artículos favoritos
Navegación rápida y sin publicidad
 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*