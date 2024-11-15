No hay duda de que algunos ejecutivos del sector de los medios de comunicación han visto la inteligencia artificial (IA) con inquietud. Pero una redacción en el futuro sin herramientas de IA es muy poco probable.
Según Nieman Lab1, las principales salas de redacción de todo el país han estado diseñando nuevos roles e iniciativas en torno a cómo desarrollar y utilizar herramientas y procesos de IA manteniendo la ética y los estándares editoriales.
Los editores de noticias como el New York Times, Associated Press, el Washington Post, ESPN y Semafor ya se han mostrado abiertos a invertir en iniciativas para explorar cómo la tecnología de IA puede utilizarse junto con periodistas humanos.
Este artículo analizará cómo se está utilizando la IA en el periodismo, cómo las principales publicaciones están pensando en su estrategia de IA y qué creen los analistas del sector que podría aportar el futuro del periodismo.
Antes de que la IA generativa se popularizara, las organizaciones de noticias ya utilizaban el machine learning y algún tipo de tecnología de IA para ayudarles con la monitorización de las redes sociales2, la gestión de grandes conjuntos de datos utilizados en las noticias3 y la organización de flujos de trabajo4 para productos digitales.
Los periodistas han obtenido un beneficio de los servicios de transcripción basados en el procesamiento del lenguaje natural, como Otter y Trint. Las organizaciones de noticias han utilizado algoritmos de IA de plataformas como CrowdTangle y ChartBeat para analizar la participación de la audiencia y rastrear los temas de tendencia en las redes sociales.
Experimentos tempranos como la aplicación de noticias Artifact5, con IA, adelantaron algunas de las posibles formas en que la IA podría hacer las noticias más divertidas, con características como resumir noticias al estilo de la generación Z.
La mayoría de las veces, este tipo de herramientas permitían a los periodistas escalar su información, reducir el trabajo tedioso y descifrar relaciones o patrones dentro de los datos que extraían de múltiples fuentes.
La novedad que introduce la IA generativa es que es capaz de producir contenidos como textos escritos, audio, vídeo e imágenes. En algunos casos de uso, la IA generativa puede ayudar a editores y reporteros a traducir y transformar sus historias para diferentes canales de distribución. Sin embargo, los malos actores también pueden secuestrar la tecnología para producir desinformación y deepfakes, lo que dificulta el trabajo de los periodistas.
La tecnología de IA ha llegado a un punto de inflexión; los sectores están dejando atrás las exageraciones y trabajando para comprender de forma práctica lo que la IA puede y no puede hacer. Pero para seguir el ritmo de la innovación y el cambio, las empresas deben experimentar con diferentes formas de utilizar la IA. Esto incluye las salas de redacción.
Los analistas del sector de los medios de comunicación predicen que la IA generativa puede aliviar parte del trabajo de fondo más tedioso en las redacciones6. Estas incluyen tareas como etiquetar, categorizar, añadir metadatos, sugerencias de titulares y SEO, corrección de estilo, organización de la investigación, procesamiento de permisos y moderación de comentarios7.
La IA generativa también podría ser útil para tareas lingüísticas que no requieran introducir nueva información que no esté ya presente en el documento en el que trabaja, según sugiere un informe 6 del Instituto Reuters. Entre ellas se incluyen el resumen, la traducción, la simplificación, la reescritura en diferentes estilos y la extracción de textos para redes sociales, boletines y guiones.
Iniciativas como el proyecto JournalismAI del Think tank periodístico Polis de la London School of Economics (LSE) han estado recopilando casos de éxito8 sobre cómo se está implementando la IA en redacciones de todo el mundo. Estas son algunas de las formas en las que los sectores de las noticias ya utilizan la IA:
Recopilación de noticias
Producción de noticias
Participación del público
Las principales publicaciones como AP, Bloomberg y Reuters ya han estado utilizando ordenadores y cierto grado de automatización para buscar noticias en todo el mundo.
Por ejemplo, Bloomberg ha creado su propio modelo de lenguaje de gran tamaño (LLM)9 entrenado con documentos financieros que han curado y los datos en Bloomberg Terminal. Según afirmó, este modelo mejora las tareas de procesamiento del lenguaje natural, como el análisis de opiniones, el reconocimiento de entidades nombradas y la clasificación de noticias relacionadas con términos financieros.
Por otro lado, Semafor ha colaborado con Microsoft y OpenAI para construir un “feed de noticias de última hora multifuente”10 con IA llamado Signals. Esta herramienta de IA se centra en la investigación y ayuda a los periodistas de Semafor a buscar fuentes de noticias en diferentes idiomas de todo el mundo. En última instancia, los editores humanos evalúan y verifican las fuentes, escriben resúmenes y citan la información original a través de enlaces relevantes.
AP utiliza la IA11 para automatizar ciertas historias de ganancias corporativas sintetizando la información de los comunicados de prensa, los informes de los analistas y el rendimiento de las acciones. Había dicho que esta capacidad permite a sus reporteros centrarse en informes más detallados. También está experimentando con el uso de la IA para detectar noticias de última hora a partir de las alertas de las redes sociales. Tanto el Financial Times12 como el Wall Street Journal13 están trabajando en modelos de IA capaces de predecir los temas de tendencia para informar a los periodistas sobre posibles historias y encontrar lagunas en la cobertura14.
La IA también puede aportar investigaciones relevantes como punto de partida para el periodismo de investigación. Los modelos de lenguaje de IA pueden ayudar a los reporteros a centrarse en las secciones de interés15 dentro de montones de documentos, independientemente de su formato. En el caso de las publicaciones de vigilancia locales, la IA podría identificar anomalías en los informes de auditoría de gobierno con el fin de sacar a la luz pistas para sus reporteros16. La IA también puede procesar grandes conjuntos de datos procedentes de registros de financiación de campañas, legislación estatal, demandas civiles, presupuestos municipales y resumir el contenido de esos documentos para ayudar a los reporteros17. Un periódico local de Noruega, iTromsø, incluso diseñó su propia herramienta con IA para eliminar datos de archivos municipales, clasificar documentos por relevancia y extraer información clave que podría convertirse en pistas para historias.
Las herramientas con IA también pueden tomar y organizar notas de conferencias o reuniones del ayuntamiento, clasificar consejos y crear transcripciones de vídeos grabados. Muchas redacciones utilizan software de IA para convertir voz en texto con fines de transcripción y traducción.
Reuters ha descubierto que los resúmenes y resúmenes de la IA18 facilitan a los periodistas la búsqueda de personas y momentos clave en los vídeos archivados. Los vídeos destacados de la IA también se han vuelto útiles en los reportajes deportivos. ESPN utiliza la IA para identificar los momentos más destacados de los clips y generar recapitulaciones a escala19.
Existe un conjunto de herramientas de IA que pueden ayudar a los periodistas a corregir pruebas, redactar titulares e idear esquemas. En un post publicado en octubre20, el New York Times afirmó que no utiliza IA para escribir artículos. Sin embargo, lo utilizan para filtrar datos de periodismo de investigación, crear versiones en audio de sus artículos y ofrecer recomendaciones de artículos. A veces, pueden utilizar la IA generativa para redactar posibles titulares, resúmenes de artículos y primeras traducciones de sus historias del inglés al español. Todo esto se hace con supervisión humana y se edita antes de su publicación.
The Washington Post se asoció con la empresa de software de texto a voz Eleven Labs para ofrecer audio generado por IA que acompañará a algunos de sus boletines21. Este audio se puede añadir a una lista de reproducción en la aplicación de The Post junto con otras ofertas como episodios de pódcast y artículos de audio.
La BBC ha experimentado previamente con herramientas automatizadas22 que podrían ofrecer un 'corte preliminar' de sus programas de vídeo y audio.
Las aplicaciones de PLN, como la herramienta automatizada de verificación de hechos de Newtral y el FactStream de Duke Reporter's Lab, pueden ayudar a identificar las declaraciones que deben verificarse. Y los editores parecen aprobar en general la corrección de pruebas y la edición asistida por IA.
Se están probando y desarrollando herramientas de IA para detectar deepfakes. Sin embargo, los expertos advierten23 que solo deberían servir como punto de partida de un proceso de verificación.
Mientras las publicaciones compiten por la atención, los resúmenes de IA muestran potencial para atraer lectores. En las primeras pruebas, aumentó el número de lectores de una cadena pública de Noruega24 y de un diario de Sudáfrica25. Un pequeño periódico sueco descubrió que incluir resúmenes de IA aumentaba el tiempo que los lectores dedicaban a un artículo26.
La función de resumen de IA también se puede presentar a los lectores en forma de chatbot. Por ejemplo, The Washington Post tiene un chatbot de IA entrenado en artículos de archivo que puede responder a las preguntas de los lectores sobre ciencia climática. El Post diseñó la herramienta junto con ingenieros de Virginia Tech27. La IA utiliza generación aumentada por recuperación (RAG) y está entrenada en los archivos de The Post. Genera un resumen basado en la información que extrae de los artículos del archivo. El modelo también indicará si no tiene suficiente información para responder a una pregunta del lector. Además, enumera los artículos a los que hace referencia e indica a los lectores que los consulten para verificarlos.
The Financial Times ha implementado un chatbot similar con ayuda de Anthropic que responde a las preguntas de los suscriptores sobre eventos recientes, así como sobre temas más amplios. El chatbot está en fase beta, pero cuando periodistas de The Verge lo probaron a principios de 2024, descubrieron que sus respuestas contenían inconsistencias28. Un estudio de JournalismAI29 concluyó que estas herramientas tenían dificultades para resumir artículos más largos, especialmente aquellos que eran más creativos que directos.
Además de las tareas estrictamente lingüísticas, la IA puede ayudar a captar la atención de los lectores al gestionar los muros de pago dinámicos30 para aumentar las suscripciones y la retención. La IA también puede utilizar los comportamientos, hábitos y recorridos de los lectores para recomendar contenidos y personalizar las experiencias de los usuarios. Una buena curación de la IA podría animar a las personas a estar más informadas al llevarles a historias que podrían gustarles y otras que normalmente no leen.
A pesar de los casos de éxito prometedores, todavía hay una constelación de riesgos asociados con las herramientas de IA generativa. Entre ellas se incluyen cuestiones pendientes en torno a la precisión, la transparencia, la imparcialidad, la privacidad y la infracción de la propiedad intelectual.
Las historias generadas por la IA han suscitado una controversia masiva no solo por estar mal escritas, sino también por plagio e imprecisiones fácticas. A medida que más motores de búsqueda implementan las características de la IA, existe la preocupación de que estas características den la apariencia de autoridad al incluir enlaces a las fuentes. Pero pueden sacar los hechos de contexto y desinformación31. Y dependiendo de la fuente de sus datos de entrenamiento, los modelos de IA podrían amplificar los sesgos existentes.
Aunque es fácil señalar a chatbots como ChatGPT, el Reuters Institute 6 señaló que las organizaciones de noticias no pueden evitar fácilmente este problema. Desarrollar modelos patentados internamente es un desafío. Es posible que incluso las redacciones más importantes no tengan un archivo lo suficientemente grande como para proporcionar todos los datos de formación que un LLM podría necesitar.
La mejor solución sería afinar u optimizar los modelos existentes, pero esos métodos pueden traer sus propios problemas en cuanto a seguridad, estabilidad e interpretabilidad.
A pesar de las impresionantes proezas que pueden realizar las IA generativas, en última instancia carecen de una comprensión coherente del mundo32. Como resultado, la IA no puede examinar la calidad de las fuentes y, a veces, pueden ser engañadas. Por ejemplo, Wired33 descubrió que los productos de IA de Google, Microsoft y Perplexity han estado publicando respuestas de IA basadas en una ciencia racial ampliamente desacreditada porque falta información de alta calidad en la web. Además, los modelos de IA pueden alucinar y aún están aprendiendo a transmitir la incertidumbre.
Anteriormente, las publicaciones publicaban sus datos y código junto con el trabajo producido mediante el machine learning o la IA. Ahora, hay una demanda aún mayor de responsabilidad y explicabilidad algorítmica: la audiencia quiere saber cuándo el contenido está siendo producido por IA34. Incluso entonces, algunos de los primeros estudios han demostrado que el público tiende a confiar menos en el contenido de las noticias cuando se marca como generado por la IA.
El periodismo se basa en la relación entre el escritor y el lector. Mantener la confianza es fundamental. Y a medida que la IA se utiliza cada vez más en los diferentes niveles de producción de noticias, las empresas de medios de comunicación intentan ser lo más transparentes posible en sus divulgaciones.
En una guía publicada por The New York Times35 en mayo de 2024, sus editores dijeron que la IA generativa se utilizará como herramienta al servicio de su misión de descubrir la verdad y ayudar a más personas a comprender el mundo. La tecnología se utiliza con orientación y revisión humanas, y los editores explican cómo se creó el trabajo y los pasos que tomaron para mitigar el riesgo, el sesgo y la imprecisión.
"La relación entre un periodista y la IA no es diferente al proceso de desarrollar fuentes o cultivar soluciones", como dijo Columbia Journalism Review36. "Al igual que con las fuentes humanas, las inteligencias artificiales pueden estar bien informadas, pero no están libres de subjetividad en su diseño; también necesitan ser contextualizadas y calificadas".
Existe una tendencia hacia una mayor transparencia en los sistemas de IA en diversas sectores. Sin embargo, las empresas siguen negociando los compromisos entre códigos de código fuente más abiertos y seguridad.
La llegada de la IA está complicando los términos de una relación en evolución entre las grandes empresas tecnológicas y el sector de noticias. En las últimas décadas, las organizaciones de noticias han estado al frente de las plataformas tecnológicas que distribuyen su contenido. Debido a los contradictorios modelos de negocio, hay demandas en curso en las que los editores sostienen que los gigantes tecnológicos monopolizan los ingresos por publicidad, el tráfico y el uso de su contenido sin una compensación justa37. La IA parece estar agravando este problema.
Algunos ejecutivos de los medios de comunicación dijeron a New York Magazine 19 que les preocupa que los resúmenes de IA en motores de búsqueda como Google faciliten a los agregadores "estafar su contenido" e inunden la web con información de baja calidad.
Un Tow Report38 de 2024 publicado en Columbia Journalism Review señaló que, dado que la IA personalizada es difícil de desarrollar internamente, las organizaciones de noticias deben confiar en las empresas de tecnología. Además, la búsqueda mejorada por la IA podría afectar a la participación del público y afianzar el control de las plataformas tecnológicas sobre el ecosistema de la información.
Sin embargo, las empresas de medios de comunicación tienen esta vez una ventaja en las negociaciones con las empresas tecnológicas. La IA solo puede trabajar con información existente. La IA no puede ir por el mundo y recopilar nueva información, experiencias o interactuar con otros humanos. El contenido de las noticias es una valiosa fuente de información en tiempo real en un contexto que puede mejorar la calidad de los modelos fundacionales, "que sufren de sesgo, desinformación y spam»", según un comentario del Instituto Brookings39. De hecho, los artículos de noticias constituyen una cantidad sustancial del conjunto de datos utilizado para entrenar a los LLM populares, según una investigación del Washington Post40.
Es importante destacar que los sistemas de IA siempre están ávidos de más datos. Y las empresas tecnológicas se están quedando rápidamente sin41 datos de entrenamiento disponibles públicamente para estos modelos. Sin nuevos datos de alta calidad, estos modelos podrían degradarse e incluso colapsar.
Esto significa que los medios de comunicación podrían tener más poder a la hora de definir su relación con las empresas que desarrollan estos sistemas. Y hay un mayor incentivo para que las empresas tecnológicas colaboren con los medios o enfrenten problemas con la propiedad intelectual.
Tal como están las cosas, unos pocos editores están demandando a empresas de IA por infracción de derechos de autor, mientras que otros firman acuerdos de licencia42.
Esto pone de manifiesto la necesidad de un marco legal actualizado en torno a la propiedad intelectual y la compensación. El Washington Post43 descubrió que, a veces, los resúmenes de la IA permitían a las plataformas tecnológicas eludir las normas anteriores que les obligaban a pagar a los editores por el contenido, especialmente el contenido detrás de los muros de pago.
Aunque aún existen puntos de referencia legales por recorrer, existe un futuro en el que las empresas de IA y las organizaciones de noticias pueden colaborar de forma mutuamente beneficiosa. La clave es la comunicación abierta y el debate. En lugar de dar por sentado que saben44 lo que la gente necesita, los desarrolladores de IA deberían preguntar a las partes interesadas del sector sobre las herramientas y servicios que serían beneficiosos para los usuarios.
