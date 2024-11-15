No hay duda de que algunos ejecutivos de la industria de los medios de comunicación han visto la inteligencia artificial (IA) con ansiedad. Pero una sala de redacción en el futuro sin ninguna herramienta de IA es altamente improbable.
Según Nieman Lab1, las principales redacciones de todo el país han estado diseñando nuevas funciones e iniciativas en torno a cómo desarrollar y utilizar herramientas y procesos de IA, manteniendo al mismo tiempo los estándares éticos y editoriales.
Medios de comunicación como The New York Times, Associated Press, The Washington Post, ESPN y Semafor ya han manifestado abiertamente su intención de invertir en iniciativas para explorar cómo se puede utilizar la tecnología de IA junto con los periodistas humanos.
Este artículo analizará cómo se está utilizando la IA en el periodismo, cómo las principales publicaciones están planteando su estrategia de IA y qué opinan los analistas de la industria sobre el futuro del periodismo.
Antes de que la IA generativa se popularizara, las organizaciones de noticias ya utilizaban el machine learning y alguna forma de tecnología de IA para ayudarles con el monitoreo de redes sociales2, administrar grandes conjuntos de datos utilizados en las noticias3 y organizar flujos de trabajo4 para productos digitales.
Los reporteros se han beneficiado de los servicios de transcripción basados en el procesamiento de lenguaje natural, como Otter y Trint. Las organizaciones de noticias han utilizado algoritmos de IA de plataformas como CrowdTangle y ChartBeat para analizar la participación de la audiencia y rastrear los temas de tendencia en las redes sociales.
Experimentos tempranos como la aplicación de noticias Artifact5, impulsada por IA, adelantaron algunas de las posibles formas en que la IA podría hacer las noticias más divertidas, con características como resumir noticias al estilo de la generación Z.
La mayoría de las veces, este tipo de herramientas permitían a los periodistas escalar su información, reducir el trabajo tedioso y descifrar relaciones o patrones dentro de los datos que extraían de múltiples fuentes.
La novedad que introduce la IA generativa es que es capaz de producir contenidos como textos escritos, audio, video e imágenes. En algunos casos de uso, la IA generativa puede ayudar a los editores y reporteros a traducir y transformar sus historias para diferentes canales de distribución. Sin embargo, la tecnología también puede ser secuestrada por actores maliciosos para producir desinformación y deepfakes, lo que dificulta el trabajo de los periodistas.
La tecnología de la IA ha llegado a un punto de inflexión; las industrias están yendo más allá del revuelo y trabajando para comprender prácticamente lo que la IA puede y no puede hacer. Pero para mantenerse al día con la innovación y el cambio, las empresas deben experimentar con diferentes formas de utilizar la IA. Esto incluye las salas de redacción.
Los analistas de la industria de los medios predicen que la IA generativa puede aliviar parte del trabajo de backend más tedioso en las salas de redacción6. Estas incluyen tareas como etiquetado, categorización, adición de metadatos, titulares y sugerencias de SEO, edición, organización de investigaciones, procesamiento de permisos y moderación de comentarios7.
La IA generativa también podría ser útil para tareas lingüísticas que no requieren introducir nueva información que no esté ya presente en el documento en el que se está trabajando, según sugiere un informe del Reuters Institute. Estos incluyen resumen, traducción, simplificación, reescritura en diferentes estilos y extracción de textos para redes sociales, boletines y guiones.
Iniciativas como el proyecto JournalismAI del centro de estudios de periodismo Polis de la London School of Economics (LSE) han estado recopilando estudios de caso8 sobre cómo se está desplegando la IA en las salas de redacción de todo el mundo. A continuación, se indican algunas formas en las que la industria de las noticias ya está utilizando la IA:
Recopilación de noticias
Producción de noticias
Participación de la audiencia
Las principales publicaciones, como AP, Bloomberg y Reuters, ya utilizan computadoras y cierto grado de automatización para buscar noticias en todo el mundo.
Por ejemplo, Bloomberg creó su propio modelo de lenguaje grande (LLM)9 entrenado con documentos financieros que curaron y los datos en Bloomberg Terminal. Dijo que este modelo mejora las tareas de procesamiento de lenguaje natural, como el análisis de sentimientos, el reconocimiento de entidades nombradas y la clasificación de noticias relacionadas con términos financieros.
Por otro lado, Semafor ha colaborado con Microsoft y OpenAI para construir un “feed de noticias de última hora de múltiples fuentes” impulsado por IA”10 llamado Signals. Esta herramienta de IA se centra en la investigación y ayuda a los periodistas de Semafor a buscar fuentes de noticias en diferentes idiomas de todo el mundo. En última instancia, los editores humanos evalúan y verifican las fuentes, escriben resúmenes y citan la información original a través de enlaces relevantes.
AP utiliza IA11 para automatizar ciertas historias de ganancias corporativas sintetizando información de comunicados de prensa, informes de analistas y rendimiento bursátil. Había dicho que esta capacidad permite a sus reporteros centrarse en informes más detallados. También está experimentando con el uso de la IA para detectar noticias de última hora a partir de alertas en las redes sociales. Tanto el Financial Times12 como el Wall Street Journal13 están trabajando en modelos de IA que pueden predecir temas de tendencia para informar a los periodistas sobre posibles noticias y encontrar deficiencias en la cobertura14.
La IA también puede dar a conocer investigaciones relevantes como punto de partida para la presentación de informes de investigación. Los modelos lingüísticos de IA pueden ayudar a los periodistas a centrarse en las secciones de interés dentro de grandes cantidades de documentos, independientemente del formato. En el caso de las publicaciones locales de vigilancia, la IA también podría identificar anomalías en los informes de auditoría gubernamentales para dar pistas a sus reporteros16. La IA también puede procesar grandes conjuntos de datos a partir de registros de financiamiento de campañas, legislación estatal, quejas civiles, presupuestos municipales y resumir el contenido de esos documentos para ayudar a los reporteros17. Un periódico local en Noruega, iTromsø, incluso diseñó su propia herramienta impulsada por IA para eliminar datos de archivos municipales, clasificar documentos por relevancia y extraer información clave que podría convertirse en pistas para historias.
Las herramientas impulsadas por IA también pueden tomar y organizar notas de conferencias locales o reuniones del ayuntamiento, clasificar consejos y crear transcripciones de videos grabados. Muchas salas de redacción están utilizando software de IA de voz a texto para la transcripción y traducción.
Reuters descubrió que los resúmenes y aspectos destacados de la IA18 facilitan a los reporteros la búsqueda de personas y momentos clave en videos archivados. Los videos destacados de IA también se han vuelto útiles en los informes deportivos. ESPN utiliza la IA para identificar los momentos destacados de los clips y generar resúmenes a escala19.
Existe una suite de herramientas de IA que pueden ayudar a los periodistas a corregir, redactar titulares y elaborar borradores. En una publicación de octubre20, The New York Times dijo que no utiliza la IA para escribir artículos. Sin embargo, lo utilizan para filtrar los datos utilizados en los informes de investigación, hacer versiones de audio de sus artículos y ofrecer recomendaciones de artículos. A veces, puede utilizar la IA generativa para redactar posibles titulares, resúmenes de artículos y primeras traducciones de sus historias del inglés al español. Todo esto se hace con supervisión humana y pasa por ediciones antes de su publicación.
The Washington Post se asoció con la empresa de software de texto a voz Eleven Labs para ofrecer audio generado por IA que acompañará algunos de sus boletines21. Este audio se puede agregar a una lista de reproducción en la aplicación de The Post junto con otras ofertas, como episodios de podcast y artículos de audio.
La BBC ha experimentado previamente con herramientas automatizadas22 que podrían generar un "corte preliminar" de sus programas de video y audio.
Las aplicaciones de NLP, como la herramienta automatizada de verificación de hechos de Newtral y FactStream de Duke Reporter's Lab, pueden ayudar a identificar declaraciones que deben verificarse. Y los editores parecen aprobar en general la corrección y edición de textos asistida por IA.
Se están probando y desarrollando herramientas de IA para detectar deepfakes. Sin embargo, los expertos advierten23 que solo deberían servir como punto de partida de un proceso de verificación.
A medida que las publicaciones compiten por la atención, los resúmenes de IA prometen atraer lectores. En las primeras pruebas, impulsó la cantidad de lectores de una emisora pública en Noruega24 y un diario en Sudáfrica25. Un pequeño periódico sueco descubrió que incluir resúmenes generados por IA aumentaba el tiempo que los lectores dedicaban a leer un artículo26.
La función de resumen de IA también se puede presentar a los lectores en forma de chatbot. Por ejemplo, The Washington Post tiene un chatbot de IA entrenado en artículos de archivo que puede responder preguntas de los lectores sobre ciencia climática. The Post diseñó la herramienta junto con ingenieros de Virginia Tech27. La IA utiliza generación aumentada por recuperación (RAG, por sus siglas en inglés) y está entrenada en los archivos de The Post. Genera un resumen basado en la información que extrae de los artículos del archivo. El modelo también indicará si no tiene suficiente información para responder a una pregunta del lector. Además, enumera los artículos a los que hace referencia y les dice a los lectores que consulten para verificarlos.
The Financial Times ha desplegado un chatbot similar con ayuda de Anthropic que responde a las preguntas de los suscriptores sobre eventos recientes, así como sobre temas más amplios. El chatbot está en fase beta, pero cuando periodistas de The Verge lo probaron a principios de 2024, descubrieron que sus respuestas contenían incongruencias28. Un estudio de JournalismAI29 encontró que estas herramientas tenían dificultades para resumir artículos más largos, especialmente aquellos que eran más creativos que directos.
Más allá de las tareas estrictamente lingüísticas, la IA puede ayudar a captar la atención de los lectores mediante la gestión de muros de pago dinámicos30 para aumentar las suscripciones y la retención. La IA también puede utilizar los comportamientos, hábitos y recorridos de los lectores para recomendar contenidos y personalizar las experiencias de los usuarios. Una buena curaduría de IA podría animar a las personas a estar más informadas al llevarlas a historias que podrían gustarles, así como a otras que normalmente no leen.
A pesar de los estudios de casos prometedores, todavía hay una constelación de riesgos asociados con las herramientas de IA generativa. Estos incluyen cuestiones pendientes en torno a la precisión, la transparencia, la imparcialidad, la privacidad y la infracción de la propiedad intelectual.
Las historias generadas por IA han suscitado una controversia masiva no solo por estar mal escritas, sino también por plagio e inexactitudes fácticas. A medida que más motores de búsqueda despliegan resúmenes de IA, existe la preocupación de que estas características den la apariencia de autoridad al incluir enlaces a fuentes. Pero pueden sacar los hechos de contexto y dar desinformación31. Y dependiendo de la fuente de sus datos de entrenamiento, los modelos de IA podrían amplificar los sesgos existentes.
Aunque es fácil señalar a chatbots como ChatGPT, el Reuters Institute 6 señaló que las organizaciones de noticias no pueden evitar fácilmente este problema. El desarrollo interno de modelos patentados es un desafío. Incluso las salas de redacción más grandes pueden no tener un archivo lo suficientemente grande como para proporcionar todos los datos de entrenamiento que un LLM podría necesitar.
La mejor solución sería afinar o instruir los modelos existentes, pero esos métodos pueden acarrear sus propios problemas en materia de seguridad, estabilidad e interpretabilidad.
A pesar de las impresionantes hazañas que puede realizar la IA generativa, en última instancia carece de una comprensión coherente del mundo32. Como resultado, la IA no puede examinar la calidad de las fuentes y, a veces, pueden ser engañadas. Por ejemplo, Wired33 descubrió que los productos de IA de Google, Microsoft y Perplexity han estado presentando respuestas de IA basadas en una ciencia racial ampliamente desacreditada porque hay una falta de información de alta calidad en la web. Además, los modelos de IA pueden tener alucinaciones y aún están aprendiendo a transmitir incertidumbre.
Anteriormente, las publicaciones publicaban sus datos y código junto con el trabajo producido mediante el uso de machine learning o IA. Ahora, hay una demanda aún mayor de responsabilidad y explicabilidad algorítmicas: la audiencia quiere saber cuándo se produce contenido por parte de la IA34. Incluso entonces, algunos estudios iniciales han demostrado que las audiencias tienden a confiar menos en el contenido de las noticias cuando se marca como generado por IA.
El periodismo se basa en una relación entre el escritor y el lector. Mantener la confianza es fundamental. Y a medida que la IA se utiliza cada vez más en diferentes niveles de producción de noticias, las empresas de medios intentan ser lo más transparentes posible en sus divulgaciones.
En una guía publicada por The New York Times35 en mayo de 2024, sus editores dijeron que la IA generativa se utilizará como herramienta al servicio de su misión de descubrir la verdad y ayudar a más personas a comprender el mundo. La tecnología se utiliza con orientación humana y revisión, y los editores explican cómo se creó el trabajo y los pasos que tomaron para mitigar el riesgo, el sesgo y la inexactitud.
“La relación entre un periodista y la IA no es diferente al proceso de desarrollar fuentes o cultivar reparadores”, según lo expresó Columbia Journalism Review36. "Al igual que con las fuentes humanas, las inteligencias artificiales pueden tener conocimientos, pero no están libres de subjetividad en su diseño; también deben contextualizarse y calificarse".
Existe una tendencia hacia una mayor transparencia en los sistemas de IA en diversas industrias. Sin embargo, las empresas siguen negociando las compensaciones entre más código fuente y seguridad.
La llegada de la IA está complicando los términos de una relación en evolución entre las grandes empresas tecnológicas y la industria de los medios de comunicación. En las últimas décadas, las organizaciones de noticias estuvieron al frente de las plataformas tecnológicas que distribuyen su contenido. Debido a los modelos de negocio conflictivos, existen demandas en curso en las que los editores han argumentado que los gigantes tecnológicos están monopolizando los ingresos por publicidad y el tráfico y utilizando su contenido sin una compensación justa37. La IA parece estar empeorando este problema.
Algunos ejecutivos de medios dijeron a New York Magazine 19 que les preocupa que los resúmenes de IA en motores de búsqueda como Google faciliten a los agregadores “estafar su contenido” e inundar la web con información de baja calidad.
Un informe de Tow Report de 202438 en Columbia Journalism Review señaló que debido a que la IA personalizada es difícil de desarrollar internamente, las organizaciones de noticias deben confiar en las empresas de tecnología. Además, la búsqueda mejorada por IA podría afectar la participación de la audiencia y afianzar el control de las plataformas tecnológicas sobre el ecosistema de la información.
Sin embargo, esta vez las empresas de medios tienen una ventaja en las negociaciones con las empresas tecnológicas. La IA solo puede trabajar con información existente. La IA no puede salir al mundo y recopilar nueva información o experiencias o interactuar con otros seres humanos. El contenido de noticias es una valiosa fuente de información en tiempo real en un contexto que puede mejorar la calidad de los modelos fundacionales, “que sufren de sesgo, desinformación y spam”, según un comentario del Brookings Institute39. De hecho, los artículos de noticias constituyen una cantidad sustancial del conjunto de datos utilizado para entrenar a los LLM populares, según una investigación del Washington Post40.
Es importante destacar que los sistemas de IA siempre están ávidos de más datos. Y las empresas tecnológicas están agotando rápidamente41 los datos de entrenamiento disponibles públicamente para estos modelos. Sin nuevos datos de alta calidad, estos modelos podrían degradarse e incluso colapsar.
Esto significa que los medios de comunicación podrían tener más poder para definir la relación que van a tener con las empresas que desarrollan sistemas de IA. Y hay un mayor incentivo para que las empresas tecnológicas trabajen junto con las empresas de medios o se enfrenten a problemas con la propiedad intelectual.
Tal como está la situación, algunas editoras están demandando a empresas de IA por infracción de derechos de autor, mientras que otras están firmando acuerdos de licencia42.
Esto pone de manifiesto la necesidad de una infraestructura legal actualizada en torno a la propiedad intelectual y la compensación. The Washington Post43 descubrió que a veces los resúmenes de IA permitían a las plataformas tecnológicas sortear las regulaciones anteriores que les obligaban a pagar a las editoras por el contenido, especialmente el contenido detrás de los muros de pago.
Aunque todavía hay hitos legales que sortear, hay un futuro en el que las empresas de IA y las organizaciones de noticias pueden colaborar de manera mutuamente beneficiosa. La clave es la comunicación abierta y el diálogo. En lugar de dar por sentado que saben44 lo que la gente necesita, los desarrolladores de IA deberían preguntar a los stakeholders de cada industria cuáles son las herramientas y los servicios que resultarían beneficiosos para los usuarios.
