La Inteligencia Artificial está enfrentando uno de sus más mediáticos problemas luego de que la comediante Sarah Silverman demandó a Meta y OpenIA por haber utilizado su obra sin su consentimiento en ChatGPT.
De acuerdo con la estadounidense, ChatGPT fue alimentada con “The Bedwetter: stories of courage, redemption”, una serie de anécdotas recopiladas en su libro y que cuenta con la protección de derechos de autor en el país del Norte.
Para que ChatGPT funcione, se va nutriendo de lo existente en internet como el espacio “Colossal Clean Crawled Corpus”, el cual contiene miles de blogs personales y libros que no necesariamente fueron subidos cumpliendo con las leyes.
Junto con un par de novelistas interpuso el recurso legal en un juzgado de California. Los tres se dieron cuenta del “robo” de información cuando solicitaron a ChatGPT un resumen detallado de sus obras, la cual se les otorgó sin problema alguno, por lo que comenzaron a investigar sus causas.
En su momento, tanto OpenAI y Meta publicaron las fuentes con que nutrieron a su creación entre ellas “Proyecto Gutenberg”, a las que la comediante califica de estar hechos a partir de bibliotecas ilegales.
Los otros libros que provocaron la demanda son “Sandman slim”, de Richard Kadrey y “Ararat”, de Christopher Golden.
La controversia generada en el sector escrito no es algo nuevo. En marzo pasado, el Sindicato de Escritores de EU (WGA), que ahora ha paralizado a Hollywood con una huelga de dos meses, subrayó que IA debía verse como una herramienta y no como un escritor.
La AI permite que cualquier persona escriba una idea a desarrollar y comenzara a recabar ideas de internet (a veces textuales) para formar una historia. Los adoradores de la tecnología han dicho que eso ayudará a acortar tiempos a los creativos.
La WGA ha fijado que un material generado por IA no puede ser considerado material literario o de origen, equivalente a novelas, obras de teatro o adaptaciones, por tratarse de una “regurgitación de lo que ha ingerido previamente”.
Meta afirmó en un artículo que utilizó un rastreador de libros ilegal para alimentar su modelo LLaMA ChatGPT
La demanda expone que estos datos tienen orígenes ilícitos: en un artículo de Meta que detalla a su modelo LLaMA, la empresa señala las fuentes de sus conjuntos de datos de entrenamiento, y una de ellas es ThePile. A esta fuente, según señala la denuncia, se le ha descrito como “una copia del contenido del rastreador privado Bibliotik”, y esta es una de las conocidas “bibliotecas en la sombra”, que son “flagrantemente ilegales”.
La semana pasada OpenAI recibió otras dos demandas: una iniciada por otros dos autores, Paul Tremblay y Mona Awad; y la otra, una demanda colectiva que acusa a ChatGPT y Dall-e de violar la privacidad y el copyright de millones de usuarios de internet.
(Con información de El Universal)