Malgré des études de cas prometteuses, il existe encore une multitude de risques associés aux outils d’IA générative. Cela inclut des questions en suspens concernant l’exactitude, la transparence, l’équité, la vie privée et la violation de la propriété intellectuelle.

Les articles générés par l'IA ont suscité une vive controverse, non seulement parce qu'ils étaient mal écrits, mais aussi parce qu'ils contenaient des plagiats et des inexactitudes factuelles. À mesure que de plus en plus de moteurs de recherche déploient des résumés optimisés par l’IA, il est préoccupant de constater que ces fonctionnalités donnent une apparence d'autorité en incluant des liens vers des sources. Mais ils peuvent sortir les faits de leur contexte et donner de fausse information31. Et selon la source de leurs données d’entraînement, les modèles IA pourraient amplifier les biais existants.

Bien qu’il soit facile de pointer du doigt les chatbots comme ChatGPT, le Reuters Institute 6 a noté que les organisations de presse ne peuvent pas facilement contourner ce problème. Le développement de modèles propriétaires en interne est difficile. Même les plus grandes salles de rédaction ne disposent pas d'archives suffisamment importantes pour fournir toutes les données d'entraînement dont un LLM pourrait avoir besoin.

La meilleure solution serait d'affiner ou optimiser les prompts des modèles existants, mais ces méthodes peuvent présenter leurs propres problèmes de sécurité, de stabilité et d'interprétabilité.

Malgré les prouesses impressionnantes que peut réaliser l'IA générative, il lui manque en fin de compte une compréhension cohérente du monde32. Par conséquent, l'IA n'est pas en mesure de vérifier la qualité des sources, et elle peut parfois se faire duper. Par exemple, Wired33 a constaté que les produits d'IA de Google, Microsoft et Perplexity ont fait apparaître des réponses d'IA basées sur une science de l'ethnie largement démentie, en raison du manque d'informations de qualité sur le web. En plus de cela, les modèles IA peuvent avoir des hallucinations, et ils apprennent encore à transmettre l'incertitude.

Auparavant, les journaux publiaient leurs données et leur code avec les travaux réalisés grâce au machine learning ou à l’IA. Aujourd’hui, la demande de responsabilité et d’explication algorithmique est encore plus forte : les publics veulent savoir quand le contenu est produit par l’IA34. Malgré cela, certaines études préliminaires ont montré que le public a tendance à faire moins confiance aux contenus d’information lorsqu’ils sont marqués comme étant générés par l’IA.

Le journalisme repose sur la relation entre le journaliste et le lecteur. Maintenir la confiance est primordial. Et comme l’IA est de plus en plus utilisée à différents niveaux de la production d’informations, les entreprises de médias s’efforcent d’être aussi transparentes que possible dans leurs divulgations.

Dans une directive publiée par le New York Times35 en mai 2024, ses éditeurs ont déclaré que l’IA générative sera utilisée comme un outil au service de leur mission visant à découvrir la vérité et à aider plus de gens à comprendre le monde. La technologie est utilisée avec l'avis et le contrôle d'un être humain, et les éditeurs expliquent comment le travail a été créé et les mesures qu'ils ont prises pour limiter les risques, les préjugés et les inexactitudes.

« La relation entre un journaliste et l'IA n'est pas sans rappeler le processus qui consiste à développer des sources ou à trouver des solutions », comme l'explique la Columbia Journalism Review36. « Comme pour les sources humaines, les intelligences artificielles sont peut-être bien informées, mais elles ne sont pas exemptes de subjectivité dans leur conception. Elles doivent également être contextualisées et qualifiées. »

Il existe une tendance vers une plus grande transparence dans les systèmes d'IA à travers divers secteurs. Cependant, les entreprises négocient encore les compromis entre davantage de code open source et la sécurité.