“Intelixencia Artificial Xenerativa e dereitos de autoría: do mito da máquina que pensa á realidade da reprodución literal e do puro cálculo matemático”, artigo de Jorge Corrales, Director xeral de CEDRO

Desde CEDRO:
A experiencia e as análises efectuadas nos últimos anos veñen confirmar que os contidos editoriais protexidos polo Dereito de Autoría son utilizados para o desenvolvemento dos sistemas de intelixencia artificial xenerativa (IAX) e como, en distintos formatos e de diferentes formas, son reproducidos en todas as fases de desenvolvemento dese sistema.

Esta explotación das obras, de acordo coa normativa e xurisprudencia europea, exixe a autorización dos seus autores e editoras e unha remuneración xusta por estes usos, algo que parecen esquecer os desenvolvedores, privados e públicos, deste software de IA.

Como non podía ser doutro xeito, a formulación arriba exposta, en relación á utilización de obras protexidas, veu ser referendada por un representante do Barcelona Supercomputing Center (BSC) nun obradoiro sobre IA e dereitos de autoría, organizado pola Comisión de Asuntos Xurídicos do Parlamento Europeo, o pasado 4 de xuño.

O representante do BSC puxo de manifesto que no desenvolvemento da IAX «cada fase –inxestión, procesamento, aprendizaxe– necesariamente implica acceder e copiar contido protexido, non simplemente ideas».

E isto é así porque na contorna dixital, tradicionalmente as obras, por exemplo os libros, xornais, revistas e partituras, representáronse mediante un código binario –secuencias de ceros e uns–, que permite almacenar e procesar a información. Esta codificación almacenaba implicitamente tamén a información relativa á orde das palabras e a súa posición no texto. Trátase, pois, de estándares que permitían e permiten a reprodución dixital de obras, xerando unha especie de ciclo de tradución entre a linguaxe humana e a linguaxe das máquinas, permitindo que estas o entendan.

Algúns dos primeiros desenvolvementos modernos da IAX seguían a idea secuencial da era binaria. Pero non hai que deixarse enganar, esta tecnoloxía naceu co obxectivo de reducir o custo de almacenamento da información e aumentar a eficiencia na súa xestión. Con todo, agora, co desenvolvemento dos modelos baseados en Transformers, os procedementos de tradución da linguaxe humana á linguaxe das máquinas mudaron.

A tecnoloxía Transformers permite reproducir de xeito literal a información e a expresión orixinal da obra. De acordo coa RAG, literal significa: «Conforme ao sentido propio e exacto das palabras do texto.». A diferenza doutros sistemas que codifican as palabras en formato binario –ceros e uns–, os Transformers utilizan representacións vectoriais multidimensionais, mediante unha técnica coñecida como embedding.

Esta técnica de embedding codifica a seguinte información:

– Vector de tokens da palabra: reproduce a palabra.
– Vector de posición: reproduce a posición da palabra na frase, texto, etc. Sen a inclusión desta información de posición non se podería desenvolver a parte de valor semántico (significado) e de contexto do modelo.
– Vector de significado (semántica): reproduce o significado que o/a autor/a deu á palabra no texto.
– Vector de contexto: reproduce a relación da palabra co contexto.

Por tanto, e sen necesidade sequera de ser preguntado sobre o acceso lexítimo ás obras que son utilizadas para o desenvolvemento das aplicacións de IAX, o representante do BSC afirmou que, na fase de “inxestión” –preparación do repositorio inicial de obras, coñecido tecnicamente como “dataset”– é preciso acceder e reproducir obras protexidas. Isto implica que na primeira etapa no desenvolvemento da IAX se require a reprodución dixital de todas as obras incluídas no repositorio, para o que é necesaria a autorización dos seus titulares de dereitos. E este punto é chave antes de analizar se cabería a aplicación do límite de minaría de textos e datos previsto no artigo 4 da Directiva 2019/790, que permitiría o uso das obras sen autorización para algúns fins, xa que antes sería preciso contar con ese acceso lexítimo ás mencionadas publicacións para que fose legal.

Así mesmo, cando o representante do BSC recoñece que na fase de procesamento resulta imprescindíbel reproducir as obras para transformar cada palabra en tokens, unidades mínimas que o modelo utiliza para operar (polo referido custo de almacenamento e de cálculo), e demais vectores comentados.

Neles inclúense as características semánticas e contextuais do contido, quer dicir, a expresión orixinal das obras protexidas polos dereitos de autoría. Polo que tamén aquí sería preciso o permiso dos titulares. Múltiple é a xurisprudencia do TXUE que o confirma: «…a protección do dereito de autoría abrangue as expresións mais non as ideas, procedementos, métodos de operación ou conceptos matemáticos en si…». Véxase, neste sentido, a sentenza de 2 de maio de 2012, SAS Institute, C‑406/10. Cuestión tamén sinalada polo propio BSC na súa presentación.

De igual xeito, o representante do BSC explicou que durante a fase de adestramento dun modelo de IAX tamén é necesario acceder e reproducir contidos protexidos como parte do proceso técnico, mais neste caso en forma dos referidos vectores obtidos no paso anterior. Estes vectores, unha vez introducidos en forma de matrices na rede neuronal, permiten realizar cálculos matemáticos –como a obtención de derivadas– para reducir o erro entre o valor real e o que devolve o modelo.  Por tanto, esta fase implica necesariamente outra reprodución máis, efectuada nun formato diferente da obra nacida directamente do/a autor/a.

O representante do BSC expuxo, ademais, que na fase de xeración do modelo –quer dicir, cando este é utilizado polos usuarios– non se produce acceso nin reprodución directa das obras ou de reproducións das obras orixinais do/a autor/a por parte do modelo de intelixencia artificial xenerativa.

Agora ben, aínda que o modelo non accede directamente ás obras ou ás expresións no devandito de xeración, os resultados que xera (comunmente denominados outputs) poden reproducir parcial ou totalmente contidos protexidos e, tamén, transformalos e comunicalos publicamente. A pesar diso, os desenvolvedores, ao meu xuízo, non implementan conscientemente medidas tecnolóxicas que bloqueen estes resultados que afectan directa e gravemente os dereitos de autoría, a normal explotación das obras e ao traballo realizado por autores/as e editores/as. Ademais, hai que ter en conta que os modelos desenvoltos polo BSC, como MarIA e ALIA, foron postos a disposición de usuarios empresariais con fins comerciais.

Por certo, o representante do BSC tamén advirte na súa intervención sobre a dificultade de garantir a rastrexabilidade do uso dos contidos protexidos nas respostas ou resultados (output) das aplicacións de IAX. Esta cuestión xa foi contemplada polo lexislador: tanto o artigo 17 da Directiva 2014/26/UE como o artigo 167 da Lei de Propiedade Intelectual estabelecen que a responsabilidade de informar sobre os usos das obras é unha obriga que recae no usuario do material protexido, unha cualificación que o propio BSC non cuestiona.

Por tanto, a existencia de dificultades técnicas para garantir a rastrexabilidade, a información sobre a orixe das obras utilizadas para obter eses resultados, non encaixan coa obriga legal de respecto aos dereitos dos titulares nin xustifica a falta de remuneración aos mesmos. Esta obriga é claramente do desenvolvedor e, en ningún caso, pode trasladarse aos titulares, quen deben dar a autorización e recibir a remuneración que lexitimamente lles corresponde.

É importante sinalar a necesidade de estabelecer medidas de seguridade eficientes sobre as bases de datos vectoriais que moitos dos desenvolvedores utilizan para almacenar os embeddings –é dicir, as representacións vectoriais de obras protexidas–, pois non está claro que sexan irreversíbeis e que permita reconstruír as obras, en todo ou en parte, o que incrementa o risco de infraccións contra os dereitos de autoría.

Como resumo, un novo cambio de tecnoloxía para reproducir obras ou a súa expresión orixinal, quer dicir, de codificación binaria a embedding, propiciou un debate que non é real e que foi motivado por intereses que ameazan con desartellar aínda máis os principios fundamentais da nosa sociedade.

Habemos lembrar que, durante os últimos trinta anos desenvolvéronse políticas de rent seeking –segundo as denomina a teoría económica– sobre os dereitos de autores e editoras. Estas políticas, baseadas en conceptos legais como fair use ou límites ou excepcións ao dereito de autoría, potenciaron a medio e longo prazo os seguintes resultados:

– O desenvolvemento de barreiras de entrada que limitan a competencia no mercado de servizos dixitais, apoderando aquelas empresas que puideron desenvolver accións de venda cruzada de produto a prezo 0.
– O desenvolvemento de inestabilidade nas contornas sociais, ao primar nesas empresas unicamente obxectivos económicos, obviando a súa responsabilidade sobre cuestións sociais e medioambientais.
– A debilitación do impacto social dos valores do sector da cultura escrita e, por tanto, a do propio sector e a sociedade.

Por todo isto, e co obxectivo de acadar o pleno respecto aos dereitos de autoras e editores no escenario que presenta a IAX, é fundamental analizar axeitadamente os intereses que non se fan explícitos e que están detrás destes novos desenvolvementos tecnolóxicos. Sen esquecer, claro é, ir alén dunha simple análise de conflito de intereses, que en moitos casos é disfrazado de escasa capacidade orzamentaria a curto prazo.

E acabo cunha pregunta: así como no seu momento, co desenvolvemento da tecnoloxía dixital baseada en código binario, foi necesario un tempo para acordar un modelo de reprodución da obra –como o foi o código ASCII–, non estaremos, talvez, ante unha situación similar? Acaso non veremos, co tempo, a creación dun novo modelo para a reprodución da obra ou da expresión da obra no espazo multidimensional dos embeddings?”

Marilar Aleixandre anticipou os problemas da serie Adolescencia: “Aínda me piden, 17 anos despois, falar en institutos da novela de dúas rapazas violadas”

Entrevista de Olalla Sánchez a Marilar Aleixandre en La Voz de Galicia:
“(…) – La Voz de Galicia (LVG): A obra céntrase non tanto na violación física como na social de despois…
– Marilar Aleixandre (MA): Si, inspirada no mito de Medusa, castigada despois de ser violada a levar serpes por cabeleira, eu quería reflectir como nos días seguintes á violación, as rapazas descobren, ao igual que a Medusa, que moitos non se atreven a miralas en fite, intentando facer repensar sobre quen debe avergoñarse. A distinta postura dos pais das mozas, que se debaten entre denunciar ou non, polas complicacións que lles pode ocasionar, é algo central.
– LVG: Como fora e é recibida a obra?
– MA: Sempre moi ben. Os rapaces nunca tiveron problemas co libro. Cun argumento tratado de maneira delicada, hai que confiar neles cando se trata de chamarlle ás cousas polo seu nome. Iso si, lembro comentarios, illados, duns comerciais, cando a obra se traducira tamén ao castelán [está tamén en éuscaro e inglés], de que era un tema que non interesaba nos institutos… Non obstante, aínda agora, 17 anos despois de publicarse, seguen chamándome de distintos centros para ir falar sobre ela. Hai pouco contactáronme dun para unha charla sobre as mulleres na Academia. En plena polémica polas mandas, eu propuxen a cambio un debate cos estudantes sobre A Cabeza de Medusa. Ao comezo no centro tiñan reservas por se non era un libro adecuado para cuarto da ESO, algo que eu non entendía. Ao final fíxose, e mentres eu lles introducía en porcentaxes de mulleres que foran acosadas e violadas, trasladando o cálculo a cantas das cen nenas alí presentes lles podería pasar, unha rapaza da primeira fila ergueu a man e relatou: «Eu fun violada». Case caio. Pensei en como mudara todo. Antes era algo que se ocultaba…
– LVG: Aínda así, moitos falan de regresión entre os mozos ante o auxe do feminismo…
– MA: O risco de volver para atrás sempre existe; vémolo agora con todo o que acontece. Pero as mulleres adoptaron a perspectiva feminista e iso é importante. Eu nas presentacións en institutos noto que cada vez hai máis preguntas de rapaces. Algo que tamén percibo é que, fronte a series que poñen en dúbida o papel dos mestres, moitos están atentos ao que acontece, tratando de facerlles ver bulos das redes. (…)”

Xosé Manuel Beiras: “Eu son disciplinado, o que non son é obediente”

Entrevista de Marga do Val a Xosé Manuel Beiras en Nós Diario:
“(…) – Marga do Val (MV): A Asociación de Escritoras e Escritores en Lingua Galega vaino homenaxear coa Letra E de Escritor. Como vive esta palabra “Escritor”, o político, o economista e, sobre todo, quen se dedicou na vida a ser profesor?
– Xosé Manuel Beiras (XMB): É o que son. Fundamentalmente a miña profesión é esa, profesor. Teño o de político, porque nacín nun país anómalo, no 36, porque a miña mocidade foi a partir dos anos cincuenta e porque xa no 63 me comprometín coa fundación do PSG. Estiven na clandestinidade, mais seguín co meu camiño para ser o que quería, un profesor de sistemas económicos, que gañou a cátedra en marzo do ano 70, contra todo prognóstico. Cando en 1985 entro como deputado, xa formaba parte do BNG desde o proceso constituínte do ano 1982. Era Catedrático con dedicación exclusiva, tiña compatibilidade xurídica para seguir sendo catedrático en activo por ser elixido por sufraxio universal, pero non tiña compatibilidade económica, entón propúxenlle ao reitorado reducir a dedicación e os ingresos. Como mo negaron, decidín que non deixaba de exercer na cátedra e entrei no Parlamento sen cobrar salario e exercendo a miña docencia en condición de dedicación exclusiva, ao mesmo tempo que era daquela, o único deputado do BNG. Polo tanto, profesor é a miña profesión.
En canto á escrita, sempre dixen que eu non era escritor. Tíveno claro desde moi novo, na época universitaria nos anos cincuenta, eu entrei na universidade aos 16 anos, en que se vai formando aquel grupo, sobre todo de rapaces, que escribían; grupo que Borobó chamou Xeración de La Noche, que se presentaban aos premios das Festas Minervais e que os copaban todos: Mourullo, Ferrín, Franco Grande, Bernardino Graña e Xohana Torres, a única muller.
Entón daquela eu non era escritor, xa que entendía como escritor quen escribía literatura de ficción ou poesía. Despois si que escribín moito ensaio. É certo que se dicía de min que tiña moita vocación literaria, de estilo. Por iso o meu primeiro libro con repercusión, O atraso económico de Galiza, non é só un libro de economía, tamén foi valorado un compoñente literario. Paco Fernández Rei salientou nun artigo que o que fago na escrita deste texto é recuperar moito léxico dos oficios e dotalo do valor abstracto propio do ensaio, por exemplo dicir “trebellos de análise”, no canto de “instrumentos de análise”. Hai unha creatividade na recuperación do léxico, digamos referido a obxectos materiais, do léxico da fala do común, unha adaptación aplicada á ciencia, á escrita.
Nun traballo sobre o Beiras tradutor, a profesora Esperanza Mariño recuperou textos meus literarios, esquecidos, publicados entre os 11 e os 15 anos na revista Vamos da Preceptoría de don Xesús Pereira, entre 1948 e 1952. Está o único poema que escribín na miña vida. Bouza Brey dicíame que eu tiña dotes de poeta e quería convencerme para que escribise poesía. Non o fixen.
– MV: Entón é merecido este premio, tamén pola súa implicación na AELG. O primeiro en recibir a Letra E foi o seu amigo Antón Avilés de Taramancos.
– XMB: Avilés máis que un amigo, foi un irmán. Aos poucos anos de estar constituída a AELG hai unha crise interna entre dous sectores, por un desencontro; procúrase unha solución de consenso para establecer a paz interna, e nese momento a tríade que ocupa a Presidencia, a Vicepresidencia e a Secretaría da asociación somos Uxío Novoneyra, Avilés de Taramancos e mais eu. Avilés si que era un grande escritor, un dos grandes poetas do último terzo do século XX. No plano político fixemos campaña xuntos. Foi un gran Concelleiro de Cultura en Noia.

[Pode lerse a entrevista a Xosé Manuel Beiras íntegra no Sermos Galiza deste sábado, 14 de xuño, que acompaña o xornal]