ニュースメディア業界の幹部の中に、人工知能（AI）を不安に感じている人がいることは間違いありません。しかし、AIツールのないニュースルームが将来的に誕生する可能性は極めて低いです。
Nieman Lab1によると、国または地域の主要なニュースルームは、倫理と編集基準を維持しつつAIツールやプロセスを開発・活用する方法に関する新たな役割やイニシアチブを設計しています。
すでに、New York Times、 Associated Press、ワシントン・ポスト、ESPN、Samaforなどのニュース発行機関は、AIテクノロジーを人間のジャーナリストと一緒にどのように利用できるかを探る取り組みへの投資に前向きです。
この記事では、ジャーナリズムの分野でAIがどのように活用されているか、一流の出版物がAI戦略についてどのように考えているか、業界アナリストがジャーナリズムの未来についてどのように考えているかについて見ていきます。
生成AIが普及する以前から、組織はすでに機械学習や何らかの形のAI技術を使って、ソーシャルメディアのモニタリング2、ニュース記事で使われる大規模なデータセットの管理3、デジタル製品のエンジニアリング・ワークフローの整理4などを支援していました。
レポーターは、OtterやTrintなどの自然言語処理ベースの文字起こしサービスを利用してきました。ニュース組織は、CrowdTangleやChartBeatなどのプラットフォームのAIアルゴリズムを使用して、オーディエンスのエンゲージメントを分析し、ソーシャル・メディア上のトレンドのトピックを追跡してきました。
AI搭載のニュース・アプリArtifact5のような初期の試みでは、Z世代向けのニュース要約などの主要な機能で、AIがニュースをより楽しくできることをほのめかしていました。
多くの場合、この種のツールのおかげで、ジャーナリストは報道の規模を拡張し、煩雑な作業を削減し、複数のソースからかき集めたデータ内の関係性やパターンを解読することができました。
生成AIがもたらす斬新さは、書かれたテキスト、音声、ビデオ、画像などのコンテンツを生成できることです。場合によっては、生成AIは、編集者やレポーターがストーリーを翻訳し、さまざまな配信チャネル向けにストーリーを変換するのに役立ちます。しかし、このテクノロジーは悪意のある攻撃者によって乗っ取られる可能性があり、偽情報やディープフェイクを作成するため、ジャーナリストの仕事が困難になります。
AIテクノロジーは転換点を迎えており、各業種は誇張ではなく、何ができ、何ができないのかを実践的に理解しようと取り組んでいます。しかし、イノベーションと変化に対応するために、企業はAIのさまざまな使用方法を試す必要があります。これはニュースルームも含まれます。
メディア業界のアナリストは、生成AIがニュースルームの面倒なバックエンド業務を軽減できると予測しています6。これには、タグ付け、分類、メタデータの追加、見出しやSEOの提案、コピー編集、研究の整理、許可の処理、コメントのモデレート7といった作業が含まれます。
ロイター・インスティテュートの報告書 6によれば、生成AIは、作業中の文書にすでに存在しない新たな情報を導入する必要のない言語作業にも役立つ可能性があるそうです。これらには、要約、翻訳、簡略化、さまざまなスタイルへの書き換え、ソーシャルメディア、ニュースレター、スクリプト用のコピーの抽出が含まれます。
ロンドン・スクール・オブ・エコノミクス（LSE）のジャーナリズム・シンクタンク、PolisによるJournalismAIプロジェクトのような取り組みでは、世界中のニュースルームでどのようにAIがデプロイされているかについてのお客様事例を集めています8。業種・業務で既にAIが活用されている方法をいくつか紹介します。
ニュース収集
ニュース制作
オーディエンスとの関わり
AP社、Bloomberg、Reuters社などの大手出版物では、すでにコンピューターとある程度の自動化を使用して、世界中のニュースを検索しています。
例えば、ブルームバーグは、自社でキュレートした金融文書とブルームバーグ・ターミナル上のデータで学習させた独自の大規模言語モデル（LLM）9を作成しました。このモデルにより、センチメント分析、固有表現抽出、金融用語に関連するニュース分類などの自然言語処理タスクが改善されると言われています。
一方、SemaforはMicrosoftやOpenAIと協力し、SignalというAI搭載の「マルチソース速報ニュースフィード」10を構築しました。このAIツールは調査に焦点を当てており、Semafor社のジャーナリストが世界中のさまざまな言語でニュースソースを検索するのを支援します。人間の編集者は、最終的には情報源を評価し、検証し、要約を作成し、関連するリンクを使って元の情報を引用することができます。
APはAIを用いて11、プレスリリース、アナリストレポート、株価の動向から情報を統合することで、特定の企業決算報告を自動化しています。同社は、この機能により、レポーターがより詳細なレポートに集中できるようになると述べていました。また、AIを使用してソーシャル・メディア・アラートから最新のニュース・イベントを検知する実験も行っています。フィナンシャル・タイムズ12とウォール・ストリート・ジャーナル13はともに、トレンドトピックを予測してジャーナリストに記事の候補を伝えたり、報道範囲のギャップ14を発見したりできるAIモデルの開発に取り組んでいます。
AIは、調査報道の出発点として関連する調査を明らかにすることもできます。AIの言語モデルは、形式を問わず、膨大な文書の中から記者が関心のある部分を探し出す15のに役立ちます。地元の監視機関向け出版物の場合、AIが官公庁・自治体の監査報告書の異常を特定して、記者に手がかりを示す16場合もあります。AIはまた、選挙資金記録、州法、民事訴訟、自治体予算などの大規模なデータセットを処理し、それらの文書の内容を要約することで記者を支援することもできます17。ノルウェーの地元新聞である「iTromsø's」は、自治体のアーカイブからデータをスクレイピングし、関連性によって文書をランク付けし、記事のリードになり得る重要な情報を抽出するために、独自のAI搭載ツールを設計しました。
AI搭載ツールは、地域の会議や市議会ミーティングからメモを取得して整理したり、ヒントを分類したり、録画されたビデオのトランスクリプトを作成したりすることもできます。多くのニュースルームでは、文字起こしや翻訳にAIによる文字起こしソフトウェアを使用しています。
Reuters社は、AIによるハイライトと要約18により、レポーターは重要な人物や瞬間のアーカイブビデオから検索するのが容易になることに気づきました。AI動画ハイライトはスポーツレポートでも役に立っています。ESPN は AI を使用してクリップのハイライトを識別し、大規模に要約を生成します19 。
ジャーナリストが校正、見出しの下書き、アウトラインを作成するのに役立つAIツールのスイートがあります。ニューヨークタイムズは10月の投稿で20、記事の執筆にAIは使用していないと述べました。ただし、調査レポートに使用されるデータを選別したり、記事の音声バージョンを作成したり、記事のおすすめを提供したりするためには使用しています。場合によっては、生成AIを使用して、見出しの候補、記事の要約、ストーリーの下訳を英語からスペイン語に翻訳することもあります。これらはすべて人間の監督のもとで行われ、公開前に編集されます。
ワシントン・ポスト紙は、テキスト読み上げソフトウェア会社のイレブン・ラボと提携し、AIが生成した音声を一部のニュースレターに添える21ことにしました。このオーディオは、ポッドキャストのエピソードやオーディオ・ファーストの記事などの他のサービスとともに、ワシントン・ポストのアプリのプレイリストに追加できます。
BBCは以前、映像・音声番組の「ラフカット」を作成する自動化ツール22の実験を行ったことがあります。
Newtralの自動ファクトチェックツールやDike Reporter's LabのFactStreamなどのNLPアプリケーションは、ファクトチェックが必要なステートメントを特定するのに役立ちます。また、編集者はAIを活用した校正と編集について基本的に容認しているようです。
ディープフェイクを検知するAIツールはテストおよび開発されています。しかし、れらは検証プロセスの出発点としてのみ機能するべきであると専門家は警告しています23。
各出版物が注目を集めようと競争する中、AIの要約は読者を引きつけることができることを示しています。初期のテストでは、ノルウェーの公共放送24と南アフリカの日刊紙25で閲覧数が増えました。スウェーデンのある小さな新聞社は、AIの要約を掲載することで、読者が 記事に費やす時間が長くなることを発見しました26。
AIの要約機能はチャットボットの形式で読者に提示することもできます。たとえば、ワシントン・ポストには、気候科学に関する読者の質問に答えることができるアーカイブ記事に基づいてトレーニングされたAIチャットボットがあります。ワシントン・ポスト紙はバージニア工科大学のエンジニア27と共同でこのツールを設計しました。AIは検索拡張生成（RAG）を使用し、ワシントン・ポストのアーカイブで学習されます。アーカイブ内の記事から取得した情報に基づいて要約を作成します。このモデルには、読者の質問に答えるのに十分な情報がないかどうかも示されます。また、参照記事をリストし、読者に内容を確認するするように指示します。
The Financial Times紙は、Anthropicを利用して、最近のイベントやより広範なトピックに関する購読者の質問に答える同様のチャットボットをデプロイしました。このチャットボットはベータテスト中ですが、『The Verge』の記者が2024年初めにテストしたところ、その答えに矛盾があることがわかりました28。JournalismAIによる調査29では、これらのツールは長い記事、特に創造的な記事の要約に苦労していることがわかりました。
厳密な言語タスク以外では、AIはダイナミック・ペイウォール30を管理することで、読者とのエンゲージメントを高め、購読率とリテンションを向上させることができます。AI は読者の行動、習慣、ジャーニーを使用してコンテンツを推奨し、ユーザー エクスペリエンスをパーソナライズすることもできます。優れたAIキュレーションは、興味をそそるような記事や通常は読んでいないような記事に顧客を誘導することで、より多くの情報を得られるように促すことができます。
有望なお客様事例にもかかわらず、生成AIツールに関連するさまざまなリスクがまだ存在します。これらには、正確性、透明性、公平性、プライバシー、知的財産侵害に関する未解決の問題が含まれます。
AIで生成されたストーリーは、文章が不完全であるだけでなく、盗作や事実の不正確さについても大きな論争を巻き起こしています。より多くの検索エンジンがAIをデプロイする中、これらの主要な機能がソースへのリンクを含めることで権威の存在感を与えるという懸念があります。しかし、AIは文脈から事実を取り出し、誤情報を伝えることがあります31。また、トレーニング・データのソースによっては、AIモデルが既存のバイアスを増幅させる可能性があります。
ChatGPTのようなチャットボットを非難するのは簡単ですが、ロイター・インスティチュート 6は、報道組織がこの問題を簡単に回避できないと指摘しています。社内で独自のモデルを開発することは困難です。どんな大きなニュースルームでも、LLMが必要とするすべてのトレーニング・データを供給するのに十分な大きさのアーカイブがない場合があります。
最良の解決策は、既存のモデルをファイン・チューニングするか、プロンプト・チューニングすることですが、そうした方法には、安全性、安定性、解釈可能性といった独自の問題がつきものです。
生成AIは素晴らしい偉業を成し遂げられるにもかかわらず、結局のところ、世界についての一貫した理解が欠けているのです32。その結果、AI は情報源の品質を検査することができず、時には騙されてしまう可能性があります。例えば、 Wired33は、Google、Microsoft、PerplexityのAI製品が、ウェブ上に高品質な情報が不足しているため、広く否定された人種科学に基づくAI回答を次々と提示していることを発見しました。その上、AIモデルはハルシネーションを起こすこともあるし、不確実性を伝える方法をまだ学んでいません。
以前、出版物はデータとコードを、機械学習やAIを使用して作成された成果と一緒に公開していました。現在、アルゴリズムによる説明責任と説明可能性に対する要求がさらに高まっています。読者は、コンテンツがどういうときにAIによって制作されるか34かを知りたがっています。それでも、いくつかの初期の調査では、AIが生成したものとしてマークされると、読者はニュース・コンテンツを信頼しなくなる傾向があることがわかっています。
ジャーナリズムはライターと読者の間の関係で成り立っています。信頼を維持することは最も重要です。そして、さまざまなレベルのニュース制作でAIがますます使用されるようになるにつれて、メディア企業は情報開示において可能な限り透明性を保つよう努めています。
2024年5月にNew York Timesが発表したガイダンス35では、編集者が、真実を明らかにし、より多くの人々が世界を理解できるようにするという使命を果たすためのツールとして、生成AIを使用すると述べています。このテクノロジーは人間によるガイダンスとレビューとともに使用され、編集者は仕事がどのように作成されたか、リスク、バイアス、不正確さを軽減するために取られた手順について説明します。
「ジャーナリストとAIの関係は、情報源の開拓やフィクサーの育成の過程と似て非なるものである」とコロンビア・ジャーナリズム・レビューは言います36。「人間の情報源と同様に、人工知能も知識は豊富かもしれませんが、設計においての主体性はありません。人工知能には文脈を与え、それを承認する必要もあります。」
さまざまな業界でAIシステムの透明性が高まる傾向にあります。しかし、企業はいまだに、より多くのオープンソースコードとセキュリティの間のトレードオフについて交渉中です。
AIの登場により、大手テクノロジー企業とニュースメディア業務との関係が複雑化しています。過去数十年、報道機関はコンテンツを配信するテクノロジー・プラットフォームを率いてきました。相反するビジネスモデルのため、ビッグ・テックが広告収入やトラフィックを独占し、公正な対価なしにコンテンツを利用していると出版社が主張する訴訟が続いています37。AIがこの問題をさらに悪化させているようです。
一部のメディア幹部はニューヨーク・マガジン 19に対し、Googleのような検索エンジンのAI要約が集約業者に「コンテンツの盗用」を容易にし、低品質な情報をウェブに溢れさせることを懸念していると語りました。
コロンビア・ジャーナリズム・レビューの2024年Tow Report38は、カスタムAIを社内で開発するのは難しいため、報道機関はテクノロジー企業に頼らざるを得ないと指摘しています。さらに、AIによって強化された検索はオーディエンスのエンゲージメントに影響を与え、技術プラットフォームによる情報エコシステムのコントロールを確立する可能性があります。
しかし、今回のテクノロジー企業との交渉では、メディア企業が優位な立場に立つことができます。AIは既存の情報でのみ機能します。AIは世界に出て新しい情報やエクスペリエンスを集めたり、他の人間と交流したりすることはできません。ブルッキングス研究所の論評39によれば、ニュース・コンテンツは、「偏向、誤情報、スパムに苦しんでいる」基盤モデルの質を向上させることができる、リアルタイムの貴重な情報源です。実際、Washington Post40の調査によると、人気のあるLLMのトレーニングに使用されるデータセットのかなりの量をニュース記事が占めています。
重要なのは、AIシステムは常により多くのデータを必要としているということです。そしてハイテク企業は、これらのモデルのために一般に利用可能なトレーニングデータをすぐに使い果たしてしまいます。41新しい高品質のデータがなければ、これらのモデルは劣化し、さらには崩壊する可能性もあります。
つまり、報道機関が AI システムを開発する企業との関係を定義する上で、より大きな力を持つ可能性があるということです。また、テクノロジー企業がメディア企業と協力したり、知的財産の問題に直面する際のインセンティブが高くなります。
現状では、少数の出版社がAI企業を著作権侵害で訴えており、他の出版社はライセンス契約を結んでいます42 。
これは、知的財産と報酬に関する法的フレームワークの更新の必要性を浮き彫りにしています。ワシントン・ポスト43は、AIによる要約によって、技術系プラットフォームが、コンテンツ、特にペイウォールの背後にあるコンテンツについて、出版社に対価を支払うことを義務づける以前の規制を回避できる場合があることを明らかにしました。
乗り越えなければならない法的目標はまだありますが、AI企業と報道組織が相互に有益な方法で協力できる未来があります。重要なのは、オープンなコミュニケーションと議論です。人々が何を必要としているかを知っていると思い込む44のではなく、AI開発者は、ユーザーにとって有益なツールやサービスについて、個々の業種の利害関係者に尋ねるべきです。
