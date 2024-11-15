Il ne fait aucun doute que certains dirigeants du secteur des médias d’information perçoivent l’intelligence artificielle (IA) avec inquiétude. En revanche, une salle de rédaction sans outils d’IA est très peu probable.
Selon Nieman Lab1, les principales rédactions du pays ont conçu de nouveaux rôles et initiatives sur la manière de développer et d'utiliser des outils et des processus d'IA tout en maintenant l'éthique et les normes éditoriales.
Des éditeurs de presse tels que le New York Times, l’Associated Press, le Washington Post, ESPN et Semafor se sont déjà montrés ouverts à l’idée d’investir dans des initiatives visant à découvrir comment la technologie d’IA peut être utilisée aux côtés de journalistes humains.
Cet article examinera la façon dont l'IA est utilisée dans le journalisme, comment les principales publications pensent à leur stratégie en matière d'IA et ce que les analystes du secteur prévoient pour l'avenir du journalisme.
Avant que l'IA générative ne devienne populaire, les organisations de presse utilisaient déjà le machine learning et une forme quelconque de technologie d'IA pour les aider dans la surveillance des médias sociaux2, la gestion de grands jeux de données utilisés dans les articles de presse3 et l’organisation des workflows d'ingénierie4 pour les produits numériques.
Les journalistes ont tiré avantage des services de transcription basés sur le traitement automatique du langage naturel comme Otter et Trint. Les entreprises de presse ont utilisé des algorithmes d'IA issus de plateformes telles que CrowdTangle et ChartBeat pour analyser l'engagement du public et suivre les sujets tendance sur les réseaux sociaux.
DE premières expériences, comme l’application d’actualités Artifact5 alimentée par l’IA, ont dévoilé certaines des manières dont l’IA pourrait rendre l’actualité plus amusante, avec des fonctionnalités telles que la synthèse des actualités dans le style de la génération Z.
Plus souvent que pas, ces outils permettaient aux journalistes de dimensionner leur reportage, de réduire les tâches inutiles et de déchiffrer des relations ou des modèles au sein des données qu’ils extraient de multiples sources.
L’IA générative apporte une nouveauté : elle est capable de produire des contenus tels que des textes écrits, de l’audio, de la vidéo et des images. Dans certains cas d’utilisation, l’IA générative peut aider les rédacteurs et les journalistes à traduire et à transformer leurs articles en fonction des différents canaux de distribution. Cependant, cette technologie peut aussi être détournée par des personnes mal intentionnées pour produire de la désinformation et des deepfakes, ce qui complique la tâche des journalistes.
La technologie de l'IA a atteint un point d'inflexion ; les secteurs vont au-delà du battage médiatique et s'efforcent de comprendre concrètement ce que l'IA peut et ne peut pas faire. Mais pour rester en phase avec l'innovation et le changement, les entreprises doivent expérimenter différentes manières d'utiliser l'IA. Cela vaut également pour les salles de presse.
Les analystes du secteur des médias prévoient que l'IA générative peut alléger certaines des tâches de fond les plus chronophages dans les salles de rédaction6. Ces tâches comprennent notamment l’étiquetage, la catégorisation, l’ajout de métadonnées, les suggestions de titres et de référencement, la révision, l’organisation de la recherche, le traitement des autorisations et la modération des commentaires7.
L’IA générative peut également être utile pour les tâches linguistiques qui ne nécessitent pas d’introduire de nouvelles informations ne figurant pas déjà dans le document sur lequel elle travaille, selon un rapport 6 du Reuters Institute. Il s’agit notamment de la synthèse, de la traduction, de la simplification, de la réécriture dans différents styles et de l’extraction de textes pour les réseaux sociaux, les newsletters et les scripts.
Des initiatives comme le projet JournalismAI du think tank journalistique Polis de la London School of Economics (LSE) ont collecté des études de cas8 sur la manière dont l’IA est déployée dans les rédactions du monde entier. Voici quelques façons dont le secteur de l’information utilise déjà l’IA :
Collecte d’informations
Production d'actualités
Engagement du public
De grandes publications comme AP, Bloomberg et Reuters utilisent déjà des ordinateurs et un certain degré d’automatisation pour rechercher des informations dans le monde entier.
Par exemple, Bloomberg a créé son propre grand modèle de langage (LLM)9 entraîné sur les documents financiers qu'ils ont organisés et les données sur le terminal Bloomberg. Il indique que ce modèle améliore les tâches de traitement automatique du langage naturel telles que l’analyse des sentiments, la reconnaissance d’entités nommées et la classification des actualités liées aux termes financiers.
Semafor, pour sa part, a collaboré avec Microsoft et OpenAI pour créer un « flux d’actualités multi-sources »10 alimenté par l’IA et appelé Signals. Cet outil d’IA est axé sur la recherche et aide les journalistes de Semafor à rechercher dans des sources d’information dans différentes langues à travers le monde. Les rédacteurs humains évaluent et vérifient les sources, rédigent des résumés et citent les informations originales à l'aide de liens pertinents.
AP utilise l'IA11 pour automatiser certains articles sur les résultats des entreprises en synthétisant les informations provenant des communiqués de presse, des rapports d'analystes et de la performance boursière. L’entreprise a déclaré que cette capacité permettait à ses organisations de se concentrer sur des rapports plus détaillés. Elle expérimente également l'utilisation de l'IA pour détecter les événements d'actualité à partir des alertes des médias sociaux. Le Financial Times12 et le Wall Street Journal13 travaillent tous deux sur des modèles IA capables de prédire les sujets d'actualité afin d'informer les journalistes sur les sujets potentiels et de trouver des lacunes dans la couverture14.
L’IA peut également faire apparaître des recherches pertinentes comme point de départ pour la production de rapports d’investigation. Les modèles linguistiques d’IA peuvent aider les journalistes à cibler les sections d’intérêt15 dans une multitude de documents, quel qu’en soit le format. Pour les publications locales de surveillance, l’IA peut aussi identifier des anomalies dans les rapports d’audit du gouvernement afin de fournir des pistes à ses journalistes16. L'IA peut également traiter de grands ensembles de données provenant de dossiers de financement de campagne, de la législation étatique, de plaintes civiles, de budgets municipaux et résumer le contenu de ces documents pour aider les journalistes17. Un journal local norvégien, iTromsø, a même conçu son propre outil alimenté par l'IA pour extraire des données des archives municipales, classer les documents par ordre de pertinence et extraire des informations clés susceptibles de devenir des pistes d'articles.
Les outils alimentés par l’IA pourraient également prendre et organiser des notes lors de conférences locales ou de réunions d’un conseil municipal, trier des conseils et créer des transcriptions de vidéos enregistrées. De nombreuses rédactions utilisent certains logiciels de synthétisation par IA pour la transcription et la traduction.
Reuters a constaté que les points forts et les résumés de l’IA18 permettent aux journalistes de rechercher plus facilement les personnes et les moments clés dans les vidéos archivées. Les temps forts des vidéos d’IA sont également devenus utiles dans les rapports sportifs. ESPN utilise l’IA pour identifier les moments forts des clips et générer des récapitulatifs à l’échelle19.
Il existe une suite d'outils d'IA qui peuvent aider les journalistes à se relire, à rédiger des titres et à élaborer des plans. Dans un billet publié en octobre20, le New York Times a déclaré qu'il n'utilisait pas l'IA pour rédiger des articles. Cependant, ils l’utilisent pour passer au crible les données utilisées dans les rapports d’investigation, créer des versions audio de leurs articles et proposer des recommandations d’articles. Parfois, ils peuvent utiliser l'IA générative pour rédiger des titres potentiels, des résumés d'articles et les premières traductions de leurs articles de l'anglais vers l'espagnol. Tout cela se fait sous la supervision humaine et passe par des modifications avant publication.
Le Washington Post s’est associé à la société de logiciels de synthèse vocale Eleven Labs pour proposer de l’audio généré par IA accompagnant certaines de ses newsletters écrites21. Ce contenu audio peut être ajouté à une playlist dans l'application The Post, ainsi qu'à d'autres offres, telles que des épisodes de podcast et des articles audio.
La BBC a déjà expérimenté des outils automatisés22 qui pourraient proposer un « montage brut » de leurs programmes vidéo et audio.
Les applications de TALN, comme l'outil automatisé de vérification des faits de Newtral et FactStream du Duke Reporter's Lab, peuvent aider à identifier les déclarations qui doivent être vérifiées. Et les éditeurs semblent approuver en général la relecture et l’édition de texte assistées par l’IA.
Des outils d'IA destinés à détecter les deepfakes sont en cours de test et de développement. Cependant, les experts avertissent23 qu’ils ne devraient servir que de point de départ à un processus de vérification.
Alors que les publications se rivalisent pour attirer l'attention, les résumés optimisés par l'IA promettent d'attirer les lecteurs. Lors des premiers tests, il a augmenté la lectorat d’un diffuseur public en Norvège24 et d’un quotidien en Afrique du Sud25. Un petit journal suédois a constaté que l'inclusion de résumés d'IA augmentait le temps que les lecteurs consacraient à un article26.
La fonctionnalité de résumé de l’IA peut également être présentée aux lecteurs sous la forme d’un chatbot. Par exemple, le Washington Post dispose d'un chatbot IA entraîné sur des articles d’archives qui peut répondre aux questions des lecteurs sur la science du climat. The Post a conçu cet outil avec des ingénieurs de Virginia Tech27. L’IA utilise la génération augmentée de récupération (RAG) et est entraînée sur les archives du Post. Elle génère un résumé basé sur les informations qu’elle extrait des articles des archives. Le modèle indique également s’il ne dispose pas de suffisamment d’informations pour répondre à une question d'un lecteur. En outre, il énumère les articles auxquels il se réfère et indique aux lecteurs de les consulter pour vérification.
Le Financial Times a déployé un chatbot similaire avec l'aide d'Anthropic qui répond aux questions des abonnés sur les événements récents ainsi que sur des sujets plus larges. Le chatbot est en phase de test bêta, mais lorsque des journalistes de The Verge l’ont testé début 2024, ils ont constaté que ses réponses contenaient des incohérences28. Une étude de JournalismAI29 a montré que ces outils avaient du mal à résumer les articles plus longs, en particulier ceux qui étaient plus créatifs que factuels.
En dehors des tâches strictement linguistiques, l'IA peut contribuer à l'engagement des lecteurs en gérant des paywalls dynamiques30 afin d’augmenter le nombre d’abonnements et la fidélisation. L'IA peut également utiliser les comportements, les habitudes et les parcours des lecteurs pour recommander du contenu et personnaliser l'expérience utilisateur. Une bonne organisation par l'IA pourrait inciter les gens à s’informer davantage en les orientant vers des articles qu’ils aimeraient, ainsi que vers ceux qu’ils ne liraient pas normalement.
Malgré des études de cas prometteuses, il existe encore une multitude de risques associés aux outils d’IA générative. Cela inclut des questions en suspens concernant l’exactitude, la transparence, l’équité, la vie privée et la violation de la propriété intellectuelle.
Les articles générés par l'IA ont suscité une vive controverse, non seulement parce qu'ils étaient mal écrits, mais aussi parce qu'ils contenaient des plagiats et des inexactitudes factuelles. À mesure que de plus en plus de moteurs de recherche déploient des résumés optimisés par l’IA, il est préoccupant de constater que ces fonctionnalités donnent une apparence d'autorité en incluant des liens vers des sources. Mais ils peuvent sortir les faits de leur contexte et donner de fausse information31. Et selon la source de leurs données d’entraînement, les modèles IA pourraient amplifier les biais existants.
Bien qu’il soit facile de pointer du doigt les chatbots comme ChatGPT, le Reuters Institute 6 a noté que les organisations de presse ne peuvent pas facilement contourner ce problème. Le développement de modèles propriétaires en interne est difficile. Même les plus grandes salles de rédaction ne disposent pas d'archives suffisamment importantes pour fournir toutes les données d'entraînement dont un LLM pourrait avoir besoin.
La meilleure solution serait d'affiner ou optimiser les prompts des modèles existants, mais ces méthodes peuvent présenter leurs propres problèmes de sécurité, de stabilité et d'interprétabilité.
Malgré les prouesses impressionnantes que peut réaliser l'IA générative, il lui manque en fin de compte une compréhension cohérente du monde32. Par conséquent, l'IA n'est pas en mesure de vérifier la qualité des sources, et elle peut parfois se faire duper. Par exemple, Wired33 a constaté que les produits d'IA de Google, Microsoft et Perplexity ont fait apparaître des réponses d'IA basées sur une science de l'ethnie largement démentie, en raison du manque d'informations de qualité sur le web. En plus de cela, les modèles IA peuvent avoir des hallucinations, et ils apprennent encore à transmettre l'incertitude.
Auparavant, les journaux publiaient leurs données et leur code avec les travaux réalisés grâce au machine learning ou à l’IA. Aujourd’hui, la demande de responsabilité et d’explication algorithmique est encore plus forte : les publics veulent savoir quand le contenu est produit par l’IA34. Malgré cela, certaines études préliminaires ont montré que le public a tendance à faire moins confiance aux contenus d’information lorsqu’ils sont marqués comme étant générés par l’IA.
Le journalisme repose sur la relation entre le journaliste et le lecteur. Maintenir la confiance est primordial. Et comme l’IA est de plus en plus utilisée à différents niveaux de la production d’informations, les entreprises de médias s’efforcent d’être aussi transparentes que possible dans leurs divulgations.
Dans une directive publiée par le New York Times35 en mai 2024, ses éditeurs ont déclaré que l’IA générative sera utilisée comme un outil au service de leur mission visant à découvrir la vérité et à aider plus de gens à comprendre le monde. La technologie est utilisée avec l'avis et le contrôle d'un être humain, et les éditeurs expliquent comment le travail a été créé et les mesures qu'ils ont prises pour limiter les risques, les préjugés et les inexactitudes.
« La relation entre un journaliste et l'IA n'est pas sans rappeler le processus qui consiste à développer des sources ou à trouver des solutions », comme l'explique la Columbia Journalism Review36. « Comme pour les sources humaines, les intelligences artificielles sont peut-être bien informées, mais elles ne sont pas exemptes de subjectivité dans leur conception. Elles doivent également être contextualisées et qualifiées. »
Il existe une tendance vers une plus grande transparence dans les systèmes d'IA à travers divers secteurs. Cependant, les entreprises négocient encore les compromis entre davantage de code open source et la sécurité.
L’arrivée de l’IA complique les termes d’une relation en pleine évolution entre les grandes entreprises technologiques et le secteur des médias d’information. Au cours des dernières décennies, les organisations de presse ont été en conflit avec les plateformes technologiques qui distribuent leur contenu. En raison de modèles commerciaux contradictoires, des poursuites sont en cours dans le cadre desquelles des éditeurs font valoir que les géants de la technologie monopolisent les recettes publicitaires et le trafic en utilisant leur contenu sans compensation équitable37. L’IA semble aggraver ce problème.
Certains dirigeants de médias ont déclaré au New York Magazine 19 qu'ils craignaient que les résumés par IA dans les moteurs de recherche tels que Google ne facilitent la tâche des agrégateurs qui « pillent leur contenu » et inondent le Web d'informations de piètre qualité.
Un Rapport Tow38 publié en 2024 dans la Columbia Journalism Review notait que, comme l'IA personnalisée est difficile à développer en interne, les organisations de presse doivent s'appuyer sur des entreprises technologiques. En outre, la recherche améliorée par l’IA pourrait avoir un impact sur l’engagement du public et renforcer le contrôle des plateformes technologiques sur l’écosystème de l’information.
Cependant, les entreprises de médias ont cette fois une longueur d’avance dans les négociations avec les entreprises technologiques. L’IA ne peut fonctionner qu’avec les informations existantes et ne peut pas aller dans le monde et recueillir de nouvelles informations et expériences ou interagir avec d’autres humains. Le contenu des actualités est une source précieuse d’informations en temps réel dans un contexte susceptible d’améliorer la qualité des modèles de fondation, « qui sont biaisés, faux ou malveillants », selon un commentaire du Brookings Institute39. En réalité les articles de presse constituent une partie importante du jeu de données utilisé pour entraîner des LLM populaires, selon une enquête du Washington Post40.
Il est important de noter que les systèmes d’IA sont toujours avides de davantage de données. Et les entreprises technologiques sont rapidement à court41 de données d'entraînement accessibles au public pour ces modèles. Sans nouvelles données de qualité, ces modèles risquent de se dégrader, voire de s'effondrer.
Cela signifie que les médias ont plus de Power pour définir la relation qu’ils auront avec les entreprises qui développent des systèmes d’IA. En outre, les entreprises technologiques sont davantage incitées à collaborer avec les entreprises de médias, sous peine de se heurter à des problèmes de propriété intellectuelle.
À l'heure actuelle, une poignée d'éditeurs poursuivent les entreprises d'IA pour violation des droits d'auteur, tandis que d'autres signent des accords de licence42.
Cela met en évidence la nécessité d'un cadre des exigences actualisé en matière de propriété intellectuelle et de rémunération. Le WashingtonPost43 a constaté que les résumés d'IA permettaient parfois aux plateformes technologiques de contourner les réglementations antérieures les obligeant à payer les éditeurs pour le contenu, en particulier le contenu se trouvant derrière des murs payants.
Bien qu’il soit encore temps de parcourir des repères juridiques, il existe un avenir où les entreprises de l’IA et les organisations de l’actualité pourront collaborer de manière mutuellement bénéfique. La clé est une communication et une discussion ouvertes. Au lieu de partir du principe qu'ils connaissent les besoins des utilisateurs, les développeurs d'IAdevraient demander aux parties prenantes du secteur quels outils et services seraient utiles aux utilisateurs.
