¡®The New York Times¡¯ demanda a OpenAI y Microsoft por infracci¨®n de derechos de autor
El diario asegura que millones de art¨ªculos se han utilizado para entrenar chatbots que ahora compiten con ¨¦l. Es la primera reclamaci¨®n de un medio estadounidense a empresas creadoras de IA
El diario The New York Times ha demandado a OpenAI y Microsoft por infracci¨®n de derechos de autor, alegando que la tecnolog¨ªa de inteligencia artificial de estas empresas copi¨® ilegalmente millones de art¨ªculos para entrenar ChatGPT y otros servicios de informaci¨®n que ahora compiten con el contenido original del diario.
La denuncia, presentada este mi¨¦rcoles en el Tribunal Federal de Distrito de Manhattan (Nueva York), es la ¨²ltima de una serie de demandas que pretenden limitar el supuesto scraping (cribado) de amplias franjas de contenido de todo Internet -sin compensaci¨®n alguna a los autores o las empresas editoras- para entrenar los llamados modelos de inteligencia artificial de gran lenguaje. Actores, escritores, periodistas y otros creadores que publican sus obras en Internet temen que la IA saque partido de sus contenidos originales y ofrezca chatbots competitivos y otras fuentes de informaci¨®n sin la debida compensaci¨®n a la fuente.
Pero la demanda del Times reviste singular importancia por tratarse de la primera procedente de un gran medio de EE UU que se enfrenta a OpenAI y Microsoft, las marcas de IA m¨¢s reconocidas. La reclamaci¨®n recuerda de alguna forma las que constituyeron el prolongado litigio que medios de comunicaci¨®n de todo el mundo han mantenido contra Facebook y Google por reproducir contenido sin compensar a las empresas editoras, y que Australia legisl¨® con una iniciativa pionera.
En la demanda, sostiene el diario, el ¡°uso ilegal del trabajo de The Times por parte de Microsoft y OpenAI para crear productos de inteligencia artificial que compitan con ¨¦l amenaza la capacidad del diario para prestar ese servicio¡±. El peri¨®dico explica que OpenAI y Microsoft utilizaron otras fuentes en su ¡°copia a gran escala¡±, pero ¡°hicieron especial hincapi¨¦ en el contenido del Times¡± buscando ¡°aprovecharse de la enorme inversi¨®n del Times en su periodismo, utiliz¨¢ndolo para crear productos sustitutivos sin permiso ni pago¡±.
El rotativo neoyorquino es uno de los principales medios de EE UU, incluida la CNN, que a principios de este a?o a?adieron c¨®digo a sus sitios web para bloquear el rastreador web de OpenAI, GPTBot, y evitar as¨ª que escanee sus plataformas en busca de contenidos.
La compa?¨ªa descubri¨® hace meses que su trabajo se hab¨ªa utilizado para hacer rodar los grandes modelos ling¨¹¨ªsticos de las empresas de IA. En abril, empez¨® a negociar con OpenAI y Microsoft una compensaci¨®n justa y c¨®mo fijar los t¨¦rminos de un acuerdo. Pero, incapaz de llegar a un entendimiento con las dos tecnol¨®gicas, ha optado por la v¨ªa judicial. Microsoft y OpenAI alegan que divulgar contenido del Times entra dentro de los l¨ªmites de un ¡°uso justo o leg¨ªtimo¡±, ya que, independientemente de que se trate de material protegido por derechos de autor, lo que persiguen es un ¡°fin transformador¡±.
Pero, explica el texto de la demanda, ¡°no hay nada transformador en utilizar el contenido de The Times sin pagar para crear productos que sustituyan a The Times y le roben audiencia¡±, una suerte de suced¨¢neo informativo gratuito. ¡°Dado que los resultados de los modelos GenAI de los demandados compiten con el contenido utilizado para entrenarlos y lo imitan estrechamente, copiar obras del Times con ese fin no es un uso justo¡±.
Las herramientas de IA pueden ¡°generar resultados que recitan el contenido del Times textualmente, lo resumen fielmente e imitan su estilo expresivo, como demuestran decenas de ejemplos. Estas herramientas tambi¨¦n atribuyen err¨®neamente informaci¨®n falsa al Times¡±, afirma la denuncia. Es decir, el pirateo por herramientas de IA no solo priva al diario de ingresos por suscripciones, licencias, publicidad y afiliados, subraya la demanda, tambi¨¦n incurre en el preocupante pantano de la desinformaci¨®n. A menudo, el motor de b¨²squeda Bing de Microsoft, que se actualiz¨® a principios de este a?o con la tecnolog¨ªa de OpenAI, ¡°copia y categoriza¡± el contenido del diario para producir respuestas m¨¢s largas y detalladas que los motores de b¨²squeda tradicionales, recuerda la demanda.
La vicepresidenta ejecutiva y consejera general de The New York Times, Diane Brayton, comunic¨® esta ma?ana a los empleados la acci¨®n judicial, asegurando que la empresa ¡°reconoce el potencial de [la IA generativa] para el p¨²blico y para el periodismo¡±. ¡°Pero, al mismo tiempo, creemos que el ¨¦xito de GenAI y de las empresas que la desarrollan no tiene por qu¨¦ producirse a expensas de las instituciones period¨ªsticas¡±, seg¨²n el mensaje de Brayton a la plantilla, al que tuvo acceso la CNN. ¡°El uso de nuestro trabajo para crear herramientas GenAI debe venir con permiso y un acuerdo que refleje el valor justo de ese trabajo, como establece la ley¡±.
Microsoft y OpenAI no se han pronunciado por el momento acerca de la denuncia.
Puedes seguir a EL PA?S Tecnolog¨ªa en Facebook y X o apuntarte aqu¨ª para recibir nuestra newsletter semanal.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.