“Intelixencia Artificial Xenerativa e dereitos de autoría: do mito da máquina que pensa á realidade da reprodución literal e do puro cálculo matemático”, artigo de Jorge Corrales, Director xeral de CEDRO

Desde CEDRO:
A experiencia e as análises efectuadas nos últimos anos veñen confirmar que os contidos editoriais protexidos polo Dereito de Autoría son utilizados para o desenvolvemento dos sistemas de intelixencia artificial xenerativa (IAX) e como, en distintos formatos e de diferentes formas, son reproducidos en todas as fases de desenvolvemento dese sistema.

Esta explotación das obras, de acordo coa normativa e xurisprudencia europea, exixe a autorización dos seus autores e editoras e unha remuneración xusta por estes usos, algo que parecen esquecer os desenvolvedores, privados e públicos, deste software de IA.

Como non podía ser doutro xeito, a formulación arriba exposta, en relación á utilización de obras protexidas, veu ser referendada por un representante do Barcelona Supercomputing Center (BSC) nun obradoiro sobre IA e dereitos de autoría, organizado pola Comisión de Asuntos Xurídicos do Parlamento Europeo, o pasado 4 de xuño.

O representante do BSC puxo de manifesto que no desenvolvemento da IAX «cada fase –inxestión, procesamento, aprendizaxe– necesariamente implica acceder e copiar contido protexido, non simplemente ideas».

E isto é así porque na contorna dixital, tradicionalmente as obras, por exemplo os libros, xornais, revistas e partituras, representáronse mediante un código binario –secuencias de ceros e uns–, que permite almacenar e procesar a información. Esta codificación almacenaba implicitamente tamén a información relativa á orde das palabras e a súa posición no texto. Trátase, pois, de estándares que permitían e permiten a reprodución dixital de obras, xerando unha especie de ciclo de tradución entre a linguaxe humana e a linguaxe das máquinas, permitindo que estas o entendan.

Algúns dos primeiros desenvolvementos modernos da IAX seguían a idea secuencial da era binaria. Pero non hai que deixarse enganar, esta tecnoloxía naceu co obxectivo de reducir o custo de almacenamento da información e aumentar a eficiencia na súa xestión. Con todo, agora, co desenvolvemento dos modelos baseados en Transformers, os procedementos de tradución da linguaxe humana á linguaxe das máquinas mudaron.

A tecnoloxía Transformers permite reproducir de xeito literal a información e a expresión orixinal da obra. De acordo coa RAG, literal significa: «Conforme ao sentido propio e exacto das palabras do texto.». A diferenza doutros sistemas que codifican as palabras en formato binario –ceros e uns–, os Transformers utilizan representacións vectoriais multidimensionais, mediante unha técnica coñecida como embedding.

Esta técnica de embedding codifica a seguinte información:

– Vector de tokens da palabra: reproduce a palabra.
– Vector de posición: reproduce a posición da palabra na frase, texto, etc. Sen a inclusión desta información de posición non se podería desenvolver a parte de valor semántico (significado) e de contexto do modelo.
– Vector de significado (semántica): reproduce o significado que o/a autor/a deu á palabra no texto.
– Vector de contexto: reproduce a relación da palabra co contexto.

Por tanto, e sen necesidade sequera de ser preguntado sobre o acceso lexítimo ás obras que son utilizadas para o desenvolvemento das aplicacións de IAX, o representante do BSC afirmou que, na fase de “inxestión” –preparación do repositorio inicial de obras, coñecido tecnicamente como “dataset”– é preciso acceder e reproducir obras protexidas. Isto implica que na primeira etapa no desenvolvemento da IAX se require a reprodución dixital de todas as obras incluídas no repositorio, para o que é necesaria a autorización dos seus titulares de dereitos. E este punto é chave antes de analizar se cabería a aplicación do límite de minaría de textos e datos previsto no artigo 4 da Directiva 2019/790, que permitiría o uso das obras sen autorización para algúns fins, xa que antes sería preciso contar con ese acceso lexítimo ás mencionadas publicacións para que fose legal.

Así mesmo, cando o representante do BSC recoñece que na fase de procesamento resulta imprescindíbel reproducir as obras para transformar cada palabra en tokens, unidades mínimas que o modelo utiliza para operar (polo referido custo de almacenamento e de cálculo), e demais vectores comentados.

Neles inclúense as características semánticas e contextuais do contido, quer dicir, a expresión orixinal das obras protexidas polos dereitos de autoría. Polo que tamén aquí sería preciso o permiso dos titulares. Múltiple é a xurisprudencia do TXUE que o confirma: «…a protección do dereito de autoría abrangue as expresións mais non as ideas, procedementos, métodos de operación ou conceptos matemáticos en si…». Véxase, neste sentido, a sentenza de 2 de maio de 2012, SAS Institute, C‑406/10. Cuestión tamén sinalada polo propio BSC na súa presentación.

De igual xeito, o representante do BSC explicou que durante a fase de adestramento dun modelo de IAX tamén é necesario acceder e reproducir contidos protexidos como parte do proceso técnico, mais neste caso en forma dos referidos vectores obtidos no paso anterior. Estes vectores, unha vez introducidos en forma de matrices na rede neuronal, permiten realizar cálculos matemáticos –como a obtención de derivadas– para reducir o erro entre o valor real e o que devolve o modelo.  Por tanto, esta fase implica necesariamente outra reprodución máis, efectuada nun formato diferente da obra nacida directamente do/a autor/a.

O representante do BSC expuxo, ademais, que na fase de xeración do modelo –quer dicir, cando este é utilizado polos usuarios– non se produce acceso nin reprodución directa das obras ou de reproducións das obras orixinais do/a autor/a por parte do modelo de intelixencia artificial xenerativa.

Agora ben, aínda que o modelo non accede directamente ás obras ou ás expresións no devandito de xeración, os resultados que xera (comunmente denominados outputs) poden reproducir parcial ou totalmente contidos protexidos e, tamén, transformalos e comunicalos publicamente. A pesar diso, os desenvolvedores, ao meu xuízo, non implementan conscientemente medidas tecnolóxicas que bloqueen estes resultados que afectan directa e gravemente os dereitos de autoría, a normal explotación das obras e ao traballo realizado por autores/as e editores/as. Ademais, hai que ter en conta que os modelos desenvoltos polo BSC, como MarIA e ALIA, foron postos a disposición de usuarios empresariais con fins comerciais.

Por certo, o representante do BSC tamén advirte na súa intervención sobre a dificultade de garantir a rastrexabilidade do uso dos contidos protexidos nas respostas ou resultados (output) das aplicacións de IAX. Esta cuestión xa foi contemplada polo lexislador: tanto o artigo 17 da Directiva 2014/26/UE como o artigo 167 da Lei de Propiedade Intelectual estabelecen que a responsabilidade de informar sobre os usos das obras é unha obriga que recae no usuario do material protexido, unha cualificación que o propio BSC non cuestiona.

Por tanto, a existencia de dificultades técnicas para garantir a rastrexabilidade, a información sobre a orixe das obras utilizadas para obter eses resultados, non encaixan coa obriga legal de respecto aos dereitos dos titulares nin xustifica a falta de remuneración aos mesmos. Esta obriga é claramente do desenvolvedor e, en ningún caso, pode trasladarse aos titulares, quen deben dar a autorización e recibir a remuneración que lexitimamente lles corresponde.

É importante sinalar a necesidade de estabelecer medidas de seguridade eficientes sobre as bases de datos vectoriais que moitos dos desenvolvedores utilizan para almacenar os embeddings –é dicir, as representacións vectoriais de obras protexidas–, pois non está claro que sexan irreversíbeis e que permita reconstruír as obras, en todo ou en parte, o que incrementa o risco de infraccións contra os dereitos de autoría.

Como resumo, un novo cambio de tecnoloxía para reproducir obras ou a súa expresión orixinal, quer dicir, de codificación binaria a embedding, propiciou un debate que non é real e que foi motivado por intereses que ameazan con desartellar aínda máis os principios fundamentais da nosa sociedade.

Habemos lembrar que, durante os últimos trinta anos desenvolvéronse políticas de rent seeking –segundo as denomina a teoría económica– sobre os dereitos de autores e editoras. Estas políticas, baseadas en conceptos legais como fair use ou límites ou excepcións ao dereito de autoría, potenciaron a medio e longo prazo os seguintes resultados:

– O desenvolvemento de barreiras de entrada que limitan a competencia no mercado de servizos dixitais, apoderando aquelas empresas que puideron desenvolver accións de venda cruzada de produto a prezo 0.
– O desenvolvemento de inestabilidade nas contornas sociais, ao primar nesas empresas unicamente obxectivos económicos, obviando a súa responsabilidade sobre cuestións sociais e medioambientais.
– A debilitación do impacto social dos valores do sector da cultura escrita e, por tanto, a do propio sector e a sociedade.

Por todo isto, e co obxectivo de acadar o pleno respecto aos dereitos de autoras e editores no escenario que presenta a IAX, é fundamental analizar axeitadamente os intereses que non se fan explícitos e que están detrás destes novos desenvolvementos tecnolóxicos. Sen esquecer, claro é, ir alén dunha simple análise de conflito de intereses, que en moitos casos é disfrazado de escasa capacidade orzamentaria a curto prazo.

E acabo cunha pregunta: así como no seu momento, co desenvolvemento da tecnoloxía dixital baseada en código binario, foi necesario un tempo para acordar un modelo de reprodución da obra –como o foi o código ASCII–, non estaremos, talvez, ante unha situación similar? Acaso non veremos, co tempo, a creación dun novo modelo para a reprodución da obra ou da expresión da obra no espazo multidimensional dos embeddings?”

O sector literario exixe que o uso da intelixencia artificial respecte as autorías

Desde Nós Diario:
“Nunha época de revolución tecnolóxica continua, a intelixencia artificial (IA) está mudando as dinámicas actuais en case todos os aspectos da vida e, por suposto, nin a cultura en xeral, nin a literatura en concreto, son unha excepción.
Precisamente, a oposición do sector cultural, que demanda pór couto ás tecnolóxicas no seu abuso da propiedade intelectual, obrigou a pasada semana o Ministerio de Cultura a retirar o Real Decreto para regular a intelixencia artificial xenerativa.
Neste sentido, Jorge Corrales, director xeral do Centro Español de Derechos Reprográficos (Cedro), impartiu esta sexta feira no Museo do Pobo Galego, en Compostela, unha conferencia titulada A Intelixencia Artificial. Retos actuais para a creación cultural.
Pouco antes de comezar este acto, no que estivo presente Nós Diario, Corrales atendeu este xornal. Segundo sinalou, “a propiedade intelectual, os dereitos de autor e a intelixencia artificial son aspectos cruciais no futuro inmediato da cultura escrita”.
Ao respecto, explicou, “o actual desenvolvemento dos sistemas de IA e os usos que se derivan disto deixan fóra actualmente un recoñecemento xusto dos dereitos dos autores e das autoras, xa que estas colaboran, sen ningunha dúbida, na xeración de valor que estes modelos achegan”. Porén, acrecentou, “as titulares vense rexeitadas do reparto de valor que se produce no emprego destas ferramentas”.
“É fundamental que se entendan todos os amplos espectros dos defectos que xeran as novas tecnoloxías e que, independentemente do tipo de cada unha delas, haxa unha máxima no uso de obras nestes produtos que sexa: Autorización, remuneración e transparencia na declaración dos usos”, defendeu.
O presidente da Asociación de Escritoras e Escritores en Lingua Galega (AELG), Cesáreo Sánchez Iglesias, foi o encargado de introducir o relator, e tamén atendeu Nós Diario antes de comezar o acto. “A preocupación da AELG polas lóxicas que ten a intelixencia artificial é que traen dificultades para unha cultura como a nosa se non hai unha lexislación protectora que incorpore as novas formas de empregar a tecnoloxía dunha forma respectuosa co noso idioma e co noso sistema literario”, expuxo.
“Unha cultura como a nosa precisa estar nesta nova maneira de traballo e de ver o mundo, porque a IA crea formas de ver o mundo, mais é determinante que sexa respectada a propiedade intelectual nos fondos cos que hai que prover o software da intelixencia artificial”, engadiu.
“Temos que ter en conta que isto pode acabar nas mans das grandes plataformas, de feito é o que ten máis posibilidades de acontecer, sen que teña ningún beneficio para os creadores e as creadoras nin para a cultura”, afirmou o presidente da AELG.
Por este motivo, sinalou, “é un momento clave no que nos debemos achegar ao que significa todo o que está a pasar, algo que pode revolucionar as distintas artes e culturas, mais tendo claro que os dereitos de autor, aínda que sexan individualizados, tamén son garantes de que é respectada unha cultura e un idioma, así como de non descapitalizar a creación de maneira que haxa toda unha serie de plataformas que fan negocio”.
“A intelixencia artificial é algo que se compra e que se vende, así como os produtos que se elaboran con ela, e non se poden obviar todas as leis que existen sobre propiedade intelectual”, acrecentou. Ao respecto, concluíu Sánchez Iglesias, “pedimos que haxa autorización dos autores e das autoras, que haxa unha valoración económica do traballo de aquelas persoas que queiran ceder os seus contidos, e que haxa transparencia na trazabilidade do que se entrega á IA”. (…)”

Compostela: conferencia A Intelixencia Artificial. Retos actuais para a creación cultural, por Jorge Corrales, director xeral de CEDRO


O 7 de febreiro, ás 17:00 horas, no Museo do Pobo Galego, en Santiago de Compostela, o director xeral de CEDRO, Jorge Corrales, impartirá unha conferencia baixo o título A Intelixencia Artificial. Retos actuais para a creación cultural. O acto será introducido por Cesáreo Sánchez Iglesias, presidente da AELG.

A entrada é libre e gratuíta para todas as persoas interesadas. Non é necesaria inscrición previa.

Compostela: Xornada técnica na Biblioteca de Galicia. Intelixencia artificial: novas posibilidades para as bibliotecas, o 7 de febreiro

A inscrición poderá realizarse até completar as 100 prazas dispoñibles, nesta ligazón.

Entrevista a Jorge Corrales, director xeral de Cedro, no Diario Cultural

Desde o Diario Cultural da Radio Galega:
“Jorge Corrales, director xeral de Cedro, participa nun encontro en Galicia con integrantes da AELG e da AGE. “É necesario permitir unha compatibilidade total do cobro da pensión de xubilación co cobro das obras que están protexidas por dereitos de autor”. A entrevista pode escoitarse aquí.”

CEDRO solicita unha mellora da protección dos dereitos de autor

Jorge Corrales, director xeral do Centro Español de Derechos Reprográficos (CEDRO), participou hoxe nun encontro con escritores/as e editoras galegos. Nesta sesión formativa puxo de manifesto a necesidade de que se modifiquen algúns aspectos do marco legal vixente de modo que se poida garantir unha protección eficiente dos dereitos de propiedade intelectual do sector do libro, as revistas e os xornais.

Nesta sesión, promovida pola AELG (Asociación de Escritoras e Escritores en Lingua Galega) e a AGE (Asociación Galega de Editoras), Corrales incidiu na urxencia de que se asegure unha remuneración adecuada para os autores e editoras polas copias, tanto en papel como dixitais, que das súas obras que se fan con fins colectivos en empresas, en administracións públicas e centros educativos. Tamén pediu que se incrementen os recursos públicos destinados á loita contra a pirataría en internet.

Por outra banda, tamén solicitou os cambios legais oportunos para que os autores poidan recibir unha remuneración polo préstamo público das súas obras e que se faga, ademais, un esforzo para conseguir a plena compatibilidade da pensión de xubilación dos autores coa percepción dos seus dereitos de propiedade intelectual. Neste sentido, o director de CEDRO apuntou que “ambas as medidas son fundamentais para fomentar a actividade creativa, cuxos resultados reverten positivamente no desenvolvemento do patrimonio cultural común, do nivel educativo e do económico”.

CEDRO, que este ano fai o seu trixésimo aniversario, ten asociados 24.392 autores e editoras, dos cales teñen o seu domicilio en Galicia 1.051 autores e 67 editoriais. Pedro Sánchez, responsable do seu Departamento de Socios, lembrou os beneficios que a afiliación a CEDRO lles reportan a este colectivo.

Sobre CEDRO
CEDRO ten como misión representar e defender os lexítimos intereses de autores e editoras de libros e publicacións periódicas, facilitando e promovendo o uso legal das súas obras. Na actualidade ten como membros 24.392 escritores, tradutores, xornalistas e editoriais do Estado, e representa en España máis corenta entidades similares doutros países.

Sobre os relatores
Jorge Corrales é o director xeral de CEDRO desde marzo de 2017. Anteriormente dirixía o Departamento Económico e Tecnolóxico da Entidade. Licenciado en Ciencias Económicas pola Universidade de Alcalá, desenvolveu a súa traxectoria profesional nos sectores tecnolóxico, químico e, nos últimos 10 anos, no da propiedade intelectual.

Pedro Sánchez é o xefe do Departamento de Socios de CEDRO desde xaneiro de 2018, tras tres anos dirixindo o departamento de Licenzas nesta Entidade. Licenciado en Dereito e Historia pola Universidade Complutense de Madrid, ten unha ampla experiencia na área de Recursos Humanos.

CEDRO, 30 anos coa cultura. Encontro con autoras-es e editoras

CEDRO, 30 anos coa cultura. Encontro con autoras-es e editoras é unha actividade organizada por CEDRO, AGE e a AELG, que terá lugar a cuarta feira 14 de marzo de 2018, entre as 18:30 e as 20:00 horas no Auditorio do Consello da Cultura Galega (Pazo de Raxoi, Praza do Obradoiro), en Santiago de Compostela.

Nesta sesión representantes de CEDRO explicarán os avances conseguidos no trinta anos de existencia desta Entidade e explicarán cales son os cambios lexislativos necesarios para que os colectivos autorais e editoriais poidan desenvolver a súa actividade nun marco de seguridade xurídica e que garantan a protección eficiente dos seus dereitos de propiedade intelectual. Así mesmo, presentarán os servizos e beneficios que esta asociación ofrece a autores/as e editoras.

  • 18:30-18:40 Presentación.

Mercedes Queixas, Secretaria xeral da Asociación de Escritoras e Escritores en Lingua Galega (AELG).

  • 18:40-19:15 Necesidades lexislativas dos colectivos autorais e editoriais.

Jorge Corrales, director xeral de CEDRO.

  • 19:15-20:00 Beneficios de ser socio/a de CEDRO.

Pedro Sánchez, xefe do Departamento de Socios de CEDRO.

Organizan:
– AELG (Asociación de Escritoras e Escritores en Lingua Galega)
– AGE (Asociación Galega de Editoras)
– CEDRO (Centro Español de Derechos Reprográficos)

Jorge Corrales é o director xeral de CEDRO desde marzo de 2017. Anteriormente dirixía o Departamento Económico e Tecnolóxico da Entidade. Licenciado en Ciencias Económicas pola Universidade de Alcalá, desenvolveu a súa traxectoria profesional nos sectores tecnolóxico, químico e, nos últimos 10 anos, no da propiedade intelectual.

Pedro Sánchez é o xefe do Departamento de Socios de CEDRO desde xaneiro de 2018, tras tres anos dirixindo o departamento de Licenzas nesta Entidade. Licenciado en Dereito e Historia pola Universidade Complutense de Madrid, ten unha ampla experiencia na área de Recursos Humanos.