뉴스 미디어 업계의 일부 경영진이 인공지능(AI)을 불안하게 바라보고 있다는 것은 의심의 여지가 없습니다. 그러나 AI 툴이 없는 미래의 뉴스룸은 거의 없을 것입니다.
Nieman Lab1에 따르면 국가의 주요 뉴스룸은 윤리 및 편집 기준을 유지하면서 AI 툴과 프로세스를 개발하고 사용하는 방법에 대한 새로운 역할과 이니셔티브를 설계하고 있습니다.
이미 New York Times, Associated Press, Washington Post, ESPN 및 Semafor와 같은 뉴스 출판사는 AI 기술을 인간 저널리스트와 함께 사용할 수 있는 방법을 모색하기 위한 이니셔티브에 투자하는 데 대해 개방적이었습니다.
이 문서에서는 저널리즘에서 AI가 어떻게 활용되고 있는지, 주요 언론사들이 AI 전략에 대해 어떻게 생각하고 있는지, 업계 분석가들이 생각하는 저널리즘의 미래는 어떤 모습일지 살펴봅니다.
생성형 AI가 대중화되기 전에 뉴스 조직은 이미 머신 러닝과 일종의 AI 기술을 사용하여 소셜 미디어 모니터링2, 뉴스 기사에 사용되는 대규모 데이터 세트 관리3, 디지털 제품의 엔지니어링 워크플로4 구성을 지원하고 있었습니다.
기자들은 Otter 및 Trint와 같은 자연어 처리 기반 트랜스크립션 서비스의 이점을 누리고 있습니다. 뉴스 조직은 CrowdTangle 및 ChartBeat와 같은 플랫폼의 AI 알고리즘을 사용하여 시청자 참여를 분석하고 소셜 미디어의 인기 주제를 추적합니다.
AI 기반 뉴스 앱인 Artifact5와 같은 초기 실험에서는 Z 세대 스타일로 뉴스 요약과 같은 기능을 통해 AI가 뉴스를 더 재미있게 만들 수 있는 몇 가지 잠재적인 방법을 제시했습니다.
언론인들은 이러한 유형의 도구를 통해 보도 규모를 확장하고, 바쁜 업무를 줄이며, 여러 소스에서 스크랩한 데이터 내의 관계나 패턴을 해독할 수 있는 경우가 많았습니다.
생성형 AI가 도입한 새로운 기능은 서면 텍스트, 오디오, 비디오 및 이미지와 같은 콘텐츠를 생성할 수 있다는 것입니다. 일부 사용 사례에서는 편집자와 기자가 다양한 배포 채널에 대한 기사를 번역하고 변형하는 데 생성형 AI가 도움이 될 수 있습니다. 그러나 악의적인 행위자가 이 기술을 탈취하여 허위 정보와 딥페이크를 생성할 수도 있어 저널리스트의 업무가 더 어려워질 수 있습니다.
AI 기술이 변곡점에 도달했습니다. 업계는 과대 광고를 넘어 AI가 할 수 있는 것과 할 수 없는 것을 실질적으로 이해하기 위해 노력하고 있습니다. 하지만 혁신과 변화에 발맞추기 위해 기업은 다양한 AI 활용 방법을 실험해야 합니다. 여기에는 뉴스룸도 포함됩니다.
미디어 업계 분석가들은 생성형 AI가 뉴스룸의 일부 지루한 백엔드 작업을완화할 수 있다고 예측합니다6. 여기에는 태그 지정, 분류, 메타데이터 추가, 헤드라인 및 SEO 제안, 교정, 연구 조직, 권한 처리 및 댓글 관리7 등의 작업이 포함됩니다.
Reuters Institute의 한 보고서6에서는 생성형 AI가 작업 중인 문서에 이미 존재하지 않는 새로운 정보를 추가할 필요가 없는 언어 작업에도 유용할 수 있다고 제안했습니다. 여기에는 요약, 번역, 단순화, 다른 스타일로의 재작성, 소셜 미디어·뉴스레터·스크립트용 문구 추출 등이 포함됩니다.
런던정경대(LSE) 저널리즘 싱크탱크인 폴리스(Polis)의 저널리즘 프로젝트 같은 이니셔티브는 전 세계 뉴스룸에서 AI가 어떻게 활용되고 있는지에 대한 8가지 사례 연구를 수집하고 있습니다. 다음은 뉴스 업계에서 이미 AI를 활용하고 있는 몇 가지 방법입니다.
Newsgathering
뉴스 제작
청중 참여
AP, Bloomberg, Reuters와 같은 주요 매체는 이미 컴퓨터와 자동화를 사용하여 전 세계의 뉴스를 검색하고 있습니다.
예를 들어, 블룸버그는 자신들이 큐레이션한 금융 문서와 블룸버그 터미널의 데이터를 기반으로 학습된 자체 대규모 언어 모델(LLM)9를 만들었습니다. 이 모델은 감정 분석, 명명된 엔티티 인식 및 금융 용어와 관련된 뉴스 분류와 같은 자연어 처리 작업을 개선한다고 합니다.
반면 Semafor는 Microsoft 및 OpenAI와 협력하여 AI 기반 '멀티 소스 속보 피드'10인 Signals를 구축했습니다. 이 AI 도구는 연구에 중점을 두고 있으며 Semafor 저널리스트가 전 세계의 다양한 언어로 된 뉴스 소스를 검색할 수 있도록 도와줍니다. 편집자는 궁극적으로 소스를 평가 및 확인하고, 요약을 작성하며, 관련 링크를 통해 원본 정보를 인용합니다.
AP는 AI를 사용11하여 보도 자료, 애널리스트 보고서 및 주식 성능을 종합하여 특정 기업 수익 사례를 자동화합니다. 이 능력을 통해 취재진이 보다 심층적인 보도에 집중할 수 있게 되었다고 합니다. 또한 AI를 사용하여 소셜 미디어 알림에서 속보 이벤트를 감지하는 실험도 진행하고 있습니다. Financial Times12와 Wall Street Journal13 은 인기 있는 주제를 예측하여 저널리스트에게 잠재적인 기사를 알리고 취재의 틈새14를 찾아내는 AI 모델을 연구하고 있습니다.
AI는 탐사보도의 출발점이 될 수 있는 관련 연구 자료를 발굴해 보여줄 수도 있습니다. AI 언어 모델은 문서 형식과 무관하게 방대한 자료 더미 속에서 기자들이 관심 있는 부분에 집중하도록15 도와줄 수 있습니다. 지역 감시 매체의 경우, AI는 정부 감사 보고서에서 이상 징후를 식별하여 기자들에게 취재 단서를 제공하는 데16 활용될 수 있습니다. AI는 정치자금 기록, 주 법률 문서, 민원, 시 예산 등 방대한 데이터 세트를 처리하고 문서 내용을 요약하여 기자들을 돕는 데17 활용될 수 있습니다.노르웨이의 지역 신문 iTromsø는 시 기록 보관소에서 데이터를 수집하고 문서의 관련성을 순위화하며, 기사로 이어질 수 있는 핵심 정보를 추출하는 자체 AI 기반 툴을 개발했습니다.
AI 기반 도구는 지역 회의나 시의회 회의에서 메모를 작성 및 정리하고, 팁을 분류하고, 녹화된 동영상의 녹취록을 만들 수도 있습니다. 많은 뉴스룸에서 전사 및 번역을 위해 일부 AI Speech to Text 소프트웨어를 사용하고 있습니다.
Reuters는 AI가 생성한 하이라이트와 요약18이 기자들이 아카이브 영상에서 핵심 인물과 순간을 더 쉽게 찾을 수 있도록 한다는 사실을 발견했습니다. AI 기반 영상 하이라이트는 스포츠 보도에서도 유용하게 활용되고 있습니다. ESPN은 AI를 사용해 하이라이트 클립을 식별하고 대규모로 요약 영상을 생성합니다19.
저널리스트가 헤드라인을 교정하고, 초안을 작성하고, 개요를 작성하는 데 도움이 되는 AI 도구 모음이 있습니다. 10월 게시물20에서 New York Times는 기사 작성에 AI를 사용하지 않는다고 밝혔습니다. 그러나 조사 보고에 사용되는 데이터를 선별하고, 기사의 오디오 버전을 만들고, 기사 추천을 제공하는 데는 이를 사용합니다. 때로는 생성형 AI를 사용하여 잠재적인 헤드라인, 기사 요약, 스토리의 첫 번째 번역을 영어에서 스페인어로 초안을 작성할 수도 있습니다. 이 모든 것은 사람의 감독 하에 이루어지며 게시 전에 편집을 거칩니다.
워싱턴 포스트는 Text to Speech 소프트웨어 회사인 Eleven Labs와 제휴하여 일부 서면 뉴스레터에 AI가 생성한 오디오를 제공했습니다21. 이 오디오는 팟캐스트 에피소드 및 오디오 우선 기사 등의 다른 서비스와 함께 The Post 앱의 재생 목록에 추가할 수 있습니다.
BBC는 이전에 자사 비디오 및 오디오 프로그램의 '러프 컷'을 만들어낼 수 있는 자동화 툴22을 실험한 바 있습니다.
NLP 애플리케이션, Newtral의 자동화된 팩트 확인 툴 및 Duke Reporter's Lab의 FactStream과 같은 것은 팩트 확인이 필요한 진술을 식별하는 데 도움이 될 수 있습니다. 그리고 편집자들은 일반적으로 AI를 이용한 교정 및 복사 편집을 긍정적으로 평가하는 것 같습니다.
딥페이크를 감지하는 AI 도구가 테스트되고 개발되고 있습니다. 그러나전문가들23은 검증 프로세스의 시작점으로만 활용해야 한다고 경고합니다.
언론사가 독자의 관심을 얻기 위해 경쟁하는 가운데, AI 요약은 독자층을 끌어들이는 데 유망한 가능성을 보여줍니다. 초기 테스트에서, AI 요약은 노르웨이의 공영 방송사24와 남아프리카공화국의 일간지25의 독자 수를 증가시키는 데 도움이 되었습니다. 스웨덴의 한 소규모 신문사는 기사에 AI 요약을 포함하면 독자들이 기사에 머무는 시간26이 증가한다는 사실을 발견했습니다.
AI 요약 기능을 챗봇 형태로 독자에게 제공할 수도 있습니다. 예를 들어, The Washington Post는 기후 과학에 대한 독자의 질문에 답할 수 있는 아카이브 기사로 훈련된 AI 챗봇을 보유하고 있습니다. The Post는 버지니아텍27 엔지니어들과 함께 이 툴을 설계했습니다. 이 AI는 검색 증강 생성(RAG)을 사용하며 The Post의 아카이브에 대한 학습을 거칩니다. 이 기능은 보관된 기사에서 가져온 정보를 바탕으로 요약을 생성합니다. 또한 모델은 독자의 질문에 답할 수 있는 정보가 충분하지 않은지 여부도 나타냅니다. 또한 참조하는 기사를 나열하고 독자에게 확인을 위해 참조하라고 알려줍니다.
The Financial Times는 Anthropic의 도움을 받아 최근 이벤트 및 광범위한 주제에 대한 구독자의 질문에 답변하는 챗봇을 배포했습니다. 이 챗봇은 베타 테스트 중이지만, 2024년 초에 The Verge의 기자들이 테스트했을 때 답변에 불일치가 있는 것을 발견했습니다28. JournalismAI29의 연구에 따르면 이러한 툴은 긴 기사, 특히 단순한 기사보다 창의적인 기사를 요약하는 데 어려움을 겪는 것으로 나타났습니다.
언어 작업 외에도 AI는 동적 페이월30을 관리하여 구독 및 유지율을 높임으로써 독자 참여를 도울 수 있습니다. 또한 AI는 독자 행동, 습관 및 여정을 사용하여 콘텐츠를 추천하고 사용자 경험을 개인화할 수 있습니다. 좋은 AI 큐레이션은 사람들이 평소에는 읽지 않는 이야기뿐만 아니라 좋아할 수도 있는 이야기를 통해 더 많은 정보를 얻을 수 있도록 유도할 수 있습니다.
유망한 사례 연구에도 불구하고, 생성형 AI 도구와 관련된 위험은 여전히 존재합니다. 여기에는 정확성, 투명성, 공정성, 개인정보 보호 및 지적 재산권 침해와 관련된 미해결 문제가 포함됩니다.
AI가 생성한 스토리는 제대로 작성되지 않았을 뿐만 아니라 표절과 사실의 부정확성으로 인해 많은 논란을 일으켰습니다. 더 많은 검색 엔진이 AI 요약을 배포함에 따라 이러한 기능이 출처에 대한 링크를 포함하여 권위 있는 것처럼 보이게 한다는 우려가 있습니다. 하지만 문맥에서 벗어나 사실을 왜곡하고 허위 정보를 제공31할 수있습니다. 그리고 학습 데이터의 소스에 따라 AI 모델은 기존 편향을 증폭시킬 수 있습니다.
Reuters Institute6는 ChatGPT와 같은 챗봇을 손가락질하기는 쉽지만, 뉴스 조직이 이 문제를 쉽게 피할 수는 없다고 지적했습니다 . 자체적으로 독점 모델을 개발하는 것은 어려운 일입니다. 아무리 규모가 큰 뉴스룸이라도 LLM에 필요한 모든 학습 데이터를 제공할 수 있을 만큼 큰 아카이브를 보유하고 있지 않을 수 있습니다.
가장 좋은 해결책은 기존 모델을 미세 조정하거나 프롬프트 조정하는 것이지만 이러한 방법에는 안전성, 안정성 및 해석 가능성과 관련된 자체적인 문제가 있을 수 있습니다.
생성형 AI는 놀라운 능력을 발휘할 수 있지만 궁극적으로 세상에 대한 일관된 이해가 부족합니다32. 따라서 AI는 소스의 품질을 검증할 수 없으며 때때로 속을 수 있습니다. 예를 들어, Wired33는 Google, Microsoft and Perplexity의 AI 제품들이 웹상에 고품질 정보가 부족해 널리 반박된 인종 과학에 기반한 AI 답변을 내놓고 있다고 밝혔습니다. 게다가 AI 모델은 할루시네이션을 일으킬 수 있으며, 불확실성을 전달하는 방법을 여전히 학습하는 중입니다.
이전에는 출판물에서 머신 러닝 또는 AI를 사용하여 생성된 작업과 함께 데이터와 코드를 게시했습니다. 이제 알고리즘 책임성과 설명 가능성에 대한 수요가 훨씬 더 높아져 시청자는 AI로 콘텐츠가 제작되는 시점을 알고 싶어 합니다34. 그럼에도 불구하고 일부 초기 연구에 따르면 시청자는 AI로 생성된 것으로 표시될 때 뉴스 콘텐츠를 덜 신뢰하는 경향이 있습니다.
저널리즘은 작가와 독자 간의 관계에 의존합니다. 신뢰를 유지하는 것이 가장 중요합니다. 또한 다양한 수준의 뉴스 제작에서 AI가 점점 더 많이 사용됨에 따라 미디어 회사는 가능한 한 투명하게 공개하려고 노력하고 있습니다.
2024년 5월 뉴욕타임즈가 발표한 가이드라인35에서, 편집자들은 생성형 AI가 진실을 밝히고 더 많은 사람이 세상을 이해하도록 돕는 그들의 사명을 수행하는 데 활용되는 툴이 될 것이라고 밝혔습니다. 이 기술은 인간의 안내와 검토 아래 사용되며, 편집자들은 작업이 어떻게 제작되었는지, 그리고 위험·편향·부정확성을 완화하기 위해 어떤 조치를 취했는지 설명합니다.
Columbia Journalism Review36는 “기자와 AI의 관계는 취재원을 개발하거나 고정 취재원을 구축하는 과정과 다르지 않다”고 표현했습니다. “인간 취재원과 마찬가지로, 인공지능은 박식할 수 있지만 설계상 주관성에서 자유롭지 않습니다. 따라서 맥락화와 신중한 검증이 필요합니다.”
다양한 산업 분야에서 AI 시스템의 투명성을 강화하는 추세입니다. 그러나 기업들은 여전히 더 많은 오픈 소스 코드와 보안 사이의 절충점을 협상하고 있습니다.
AI의 등장으로 대형 기술 기업과 뉴스 미디어 산업 간의 관계가 진화하는 조건이 복잡해지고 있습니다. 지난 수십 년 동안 뉴스 조직은 콘텐츠를 배포하는 기술 플랫폼을 잘 알고 있었습니다. 상충되는 비즈니스 모델로 인해 거대 기술 기업이 정당한 보상 없이37 콘텐츠를 사용함으로써 광고 수익과 트래픽을 독점하고 있다고 주장하는 퍼블리셔들의 소송이 진행 중입니다. AI가 이 문제를 더욱 악화시키는 것으로 보입니다.
일부 미디어 경영진은 New York Magazine19와의 인터뷰에서 Google과 같은 검색 엔진의 AI 요약으로 인해 애그리게이터가 '콘텐츠를 탈취'하고 품질이 낮은 정보로 웹을 범람하기가 더 쉬워지는 것이 우려된다고 말합니다.
Columbia Journalism Review에 실린 2024 Tow Report38에 따르면 맞춤형 AI는 자체 개발하기가 어렵기 때문에 뉴스 조직은 기술 회사에 의존해야 합니다. 또한 AI로 강화된 검색은 시청자 참여에 영향을 미치고 정보 에코시스템에 대한 기술 플랫폼의 통제력을 강화할 수 있습니다.
그러나 이번에는 미디어 기업들이 기술 기업과의 협상에서 우위를 점하고 있습니다. AI는 기존 정보로만 작업할 수 있습니다. AI는 세상에 나가 새로운 정보나 경험을 수집하거나 다른 인간과 상호 작용할 수 없습니다. Brookings Institute의 논평39에 따르면 뉴스 콘텐츠는 "편견, 허위 정보 및 스팸으로 인해 어려움을 겪는" 파운데이션 모델의 품질을 개선할 수 있는 맥락에서 실시간 정보의 귀중한 소스입니다. Washington Post40의 조사에 따르면 실제로 뉴스 기사는 인기 있는 LLM을 학습하는 데 사용되는 데이터 세트의 상당 부분을 차지합니다.
중요한 것은 AI 시스템은 항상 더 많은 데이터를 필요로 한다는 점입니다. 그리고 기술 기업들은 이러한 모델에 대한 공개적으로 사용 가능한 교육 데이터가 빠르게 고갈되고 있습니다41. 새로운 고품질 데이터가 없으면 이러한 모델은 성능이 저하되고 심지어 붕괴될 수도 있습니다.
이는 뉴스 매체가 AI 시스템을 개발하는 회사와의 관계를 정의하는 데 더 많은 힘을 가질 수 있다는 것을 의미합니다. 그리고 기술 기업이 미디어 기업과 협력하거나 지적 재산 문제에 직면하는 경우 더 높은 인센티브를 받을 수 있습니다.
현재 소수의 퍼블리셔는 저작권 침해로 AI 회사를 고소하고 있으며, 다른 퍼블리셔는 라이선스 계약을 체결하고 있습니다42.
이는 지적 재산권과 보상 체계에 대한 업데이트된 법적 프레임워크가 필요함을 강조합니다. 워싱턴포스트43는 때때로 AI 요약이 기술 플랫폼이 콘텐츠(특히 페이월 뒤에 있는 콘텐츠)에 대해 퍼블리셔에게 비용을 지불하도록 요구하던 기존 규제를 우회하게 만든다는 사실을 발견했습니다.
아직 해결해야 할 법적 랜드마크가 있지만, AI 기업과 뉴스 조직이 상호 이익이 되는 방식으로 협업할 수 있는 미래가 있습니다. 핵심은 열린 소통과 토론입니다. AI 개발자는 사람들에게 무엇이 필요한지 잘 알고 있다고 가정하는 대신44 개별 업계 이해관계자에게 사용자에게 도움이 될 툴과 서비스에 대해 물어봐야 합니다.
