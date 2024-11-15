Não há dúvida de que alguns executivos do setor de mídia de notícias veem a inteligência artificial (IA) com ansiedade. Mas uma redação no futuro sem ferramentas de IA é altamente improvável.
De acordo com o Nieman Lab1, as principais redações do país vêm criando novas funções e iniciativas voltadas para o desenvolvimento e uso de ferramentas e processos de IA, mantendo a ética e os padrões editoriais.
Editores de notícias como New York Times, Associated Press, Washington Post, ESPN e Semafor já têm mostrado abertura para investir em iniciativas para explorar como a tecnologia de IA pode ser usada ao lado de jornalistas humanos.
Este artigo analisa como a IA está sendo usada no jornalismo, como as principais publicações estão pensando sobre sua estratégia de IA e o que os analistas do setor acham que pode estar por vir para o futuro do jornalismo.
Antes da IA generativa se popularizar, as organizações de notícias já utilizavam aprendizado de máquina e alguma forma de tecnologia de IA para auxiliá-las no monitoramento de mídias sociais2, no gerenciamento de grandes conjuntos de dados usados em notícias3 e na organização de fluxos de trabalho de engenharia4 para produtos digitais.
Os repórteres têm obtido benefício de serviços de transcrição baseados em processamento de linguagem natural, como o Otter e o Trint. Organizações de notícias usaram algoritmos de IA de plataformas como CrowdTangle e ChartBeat para analisar a audiência e acompanhar tópicos de tendências nas redes sociais.
Os primeiros experimentos, como o aplicativo de notícias Artifact5 impulsionado por IA, provocaram algumas das possíveis maneiras pelas quais a IA pode tornar as notícias mais divertidas, com funcionalidades como resumir notícias no estilo do gen Z.
Mais frequentemente do que não, esses tipos de ferramentas permitiam que os jornalistas aumentassem suas reportagens, cortassem o trabalho ocupado e decifrassem relações ou padrões dentro dos dados que estão extraindo de várias fontes.
A novidade que a IA generativa introduz é a capacidade de produzir conteúdo como textos escritos, áudio, vídeo e imagens. Em alguns casos de uso, a IA generativa pode ajudar editores e repórteres a traduzir e transformar suas histórias para diferentes canais de distribuição. No entanto, a tecnologia também pode ser sequestrada por agentes mal-intencionados para produzir desinformação e deepfakes, o que dificulta o trabalho dos jornalistas.
A tecnologia de IA atingiu um ponto de inflexão; os setores estão indo além do hype e trabalhando para entender de forma prática o que a IA pode e não pode fazer. Contudo, para acompanhar o ritmo da inovação e das mudanças, as empresas devem experimentar diferentes formas de usar a IA. Isso inclui nas redações.
Analistas do setor de mídia preveem que a IA generativa pode aliviar parte do trabalho de back-end mais tedioso nas redações6. Isso inclui tarefas como marcação, categorização, adição de metadados, sugestões de títulos e SEO, edição de texto, organização de pesquisas, processamento de permissões e moderação de comentários7.
A IA generativa também pode ser útil para tarefas de linguagem que não exigem a introdução de novas informações que ainda não estão presentes no documento em que está trabalhando, sugeriu um relatório 6 do Reuters Institute. Isso inclui sumarização, tradução, simplificação, reescrita em diferentes estilos e extração de texto para redes sociais, boletins informativos e scripts.
Iniciativas como o projeto JournalismAI, do think tank de jornalismo Polis, da London School of Economics (LSE), têm vindo a recolher estudos de casosobre a forma como a IA está a ser implementada nas redações em todo o mundo. Aqui estão algumas maneiras pelas quais o setor de notícias já está usando a IA:
Coleta de notícias
Produção de notícias
Envolvimento da audiência
Grandes publicações como AP, Bloomberg e Reuters já usam computadores e algum grau de automação para procurar notícias em todo o mundo.
Por exemplo, a Bloomberg criou seu próprio grande modelo de linguagem (LLM)9 treinado com documentos financeiros que selecionou e os dados do Terminal Bloomberg. Ela disse que esse modelo melhora tarefas de processamento de linguagem natural, como análise de sentimento, named entity recognition e classificação de notícias relacionadas a termos financeiros.
A Semafor, por outro lado, colaborou com a Microsoft e a OpenAI para construir um “ feed de notícias de última hora de múltiplas fontes” impulsionado por IA chamado Signals. Essa ferramenta de IA está focada em pesquisa e ajuda os jornalistas da Semafor a pesquisar fontes de notícias em diferentes idiomas de todo o mundo. Os editores humanos avaliam e verificam as fontes, escrevem resumos e citam as informações originais por meio de links relevantes.
A AP usa IA11 para automatizar certas histórias de lucros corporativos, sintetizando informações de comunicados à imprensa, relatórios de analistas e desempenho das ações. Ela disse que esse recurso permite que seus relatores se concentrem em relatórios mais detalhados. Também está experimentando o uso de IA para detectar eventos de notícias de última hora a partir de alertas de mídias sociais. Tanto o Financial Times12 quanto o Wall Street Journal13 estão trabalhando em modelos de IA que podem prever tópicos em tendência para informar possíveis histórias para jornalistas e encontrar lacunas na cobertura14.
A IA também pode apresentar pesquisas relevantes como ponto de partida para reportagens investigativas. Os modelos de linguagem de IA podem ajudar os repórteres a se concentrar em seções de interesse15 em vastas quantidades de documentos, independentemente do formato. Para publicações de vigilância local, a IA também pode identificar anomalias em relatórios de auditoria do governo para obter pistas para seus repórteres16. A IA também pode processar grandes conjuntos de dados de registros financeiros de campanhas, legislação estadual, reclamações civis, orçamentos municipais e resumir o conteúdo desses documentos para auxiliar os repórteres17 .Um jornal local na Noruega, o iTromsø’s, até projetou sua própria ferramenta impulsionada por IA para vasculhar dados de arquivos municipais, classificar documentos por relevância e extrair informações importantes que podem se transformar em leads para histórias.
As ferramentas impulsionadas por IA também podem anotar e organizar anotações de conferências locais ou reuniões da câmara municipal, classificar as dicas e criar transcrições de vídeos gravados. Muitas redações estão usando algum software de speech to text de IA para transcrição e tradução.
A Reuters descobriu que os destaques e resumos de IA 18 facilitam a pesquisa de vídeos arquivados em busca de pessoas e momentos importantes. Os destaques de vídeo de IA também se tornaram úteis em reportagens esportivas. A ESPN usa a IA para identificar os destaques dos clipes e gerar recapitulações em escala19.
Há um pacote de ferramentas de IA que podem ajudar os jornalistas a revisar, redigir manchetes e criar esboços. Em um post em20 de outubro, o New York Times disse que não usa IA para escrever artigos. No entanto, eles a usam para filtrar dados usados para geração de relatórios investigativos, fazer versões de áudio de seus artigos e oferecer recomendações de artigos. Às vezes, eles podem usar a IA generativa para elaborar possíveis manchetes, resumos de artigos e primeiras traduções de suas histórias do inglês para o espanhol. Tudo isso é feito com supervisão humana e passa por edições antes da publicação.
O The Washington Post fez uma parceria com a empresa de software de text to speech Eleven Labs para oferecer áudio gerado por IA para acompanhar alguns de seus boletins informativos21. Esse áudio pode ser adicionado a uma lista de reprodução no aplicativo do The Post juntamente com outros serviços, como episódios de podcast e artigos que priorizam o áudio.
A BBC já fez experiências com ferramentas automatizadas22 que podem criar um "corte aproximado" de seus programas de vídeo e áudio.
As aplicações de NLP, como a ferramenta automatizada de verificação de fatos da Newtral e o FactStream da Duke Reporter Lab, podem ajudar a identificar declarações que precisam ser verificadas. E os editores parecem aprovar, em geral, a revisão e revisão de texto assistidas por IA.
Ferramentas de IA para detectar deepfakes estão sendo testadas e desenvolvidas. No entanto, especialistas alertam23 que eles devem servir apenas como ponto de partida de um processo de verificação.
Enquanto as publicações competem por atenção, os resumos de IA se mostram promissores para atrair leitores. Nos primeiros testes, ele aumentou o número de leitores para uma emissora pública na Noruega24 e para um jornal diário na Áfricado Sul 25. Um pequeno jornal sueco descobriu que incluir resumos de IA aumentava o tempo que os leitores gastavam em um artigo26.
A funcionalidade de resumo de IA também pode ser apresentada aos leitores na forma de um chatbot. Por exemplo, o The Washington Post tem um chatbot IA treinado em artigos de arquivo que pode responder a perguntas dos leitores sobre ciência do clima. O The Post projetou a ferramenta com engenheiros da Virgínia Tech27. A IA usa a geração aumentada de recuperação (RAG) e é treinada nos arquivos do The Post. Ela gera um resumo com base nas informações extraídas dos artigos no arquivo. O modelo também indicará se não tem informações suficientes para responder a uma pergunta do leitor. Além disso, lista os artigos que referencia e diz aos leitores para consultarem para verificação.
O Financial Times implementou um chatbot semelhante com a ajuda do Anthropic, que responde às perguntas dos assinantes sobre eventos recentes e tópicos mais amplos. O chatbot está em testes beta, mas quando jornalistas do The Verge o testaram no início de 2024, descobriram que suas respostas continham inconsistências28. Um estudo do JournalismAI29 constatou que essas ferramentas tinham dificuldades para resumir artigos mais longos, especialmente aqueles que eram mais criativos em vez de diretos.
Fora das tarefas estritamente linguísticas, a IA pode ajudar no engajamento do leitor gerenciando paywalls dinâmicos30 para aumentar as assinaturas e a retenção. A IA também pode usar comportamentos, hábitos e jornadas do leitor para recomendar conteúdo e personalizar as experiências do usuário. Uma boa seleção de IA pode estimular as pessoas a se tornarem mais informadas, levando-as a histórias que elas podem gostar, bem como histórias que elas normalmente não leem.
Apesar dos estudos de caso promissores, ainda há uma constelação de riscos associados às ferramentas de IA generativa. Isso inclui questões pendentes relacionadas a precisão, transparência, equidade, privacidade e violação de propriedade intelectual.
As histórias geradas por IA têm despertado uma grande discussão não só por serem mal escritas, mas também por seu plágio e imprecisões factuais. À medida que mais mecanismos de pesquisa implementam resumos de IA, existe preocupação de que essas funcionalidades deem aparência de autoridade ao incluir links para fontes. Porém, podem interpretar os fatos fora de contexto e dar desinformação31. E, dependendo da fonte de seus dados de treinamento, os modelos de IA podem ampliar os vieses existentes.
Embora seja fácil apontar o dedo para chatbots como o ChatGPT, o Reuters Institute 6 observou que a Organização de notícias não pode contornar facilmente esse problema. Desenvolver modelos proprietários internamente é um desafio. Mesmo as maiores redações podem não ter um arquivo grande o suficiente para fornecer todos os dados de treinamento que um LLM pode precisar.
A melhor solução seria realizar o ajuste fino ou ajustar por prompts os modelos existentes, mas esses métodos podem trazer seus próprios problemas de segurança, estabilidade e interpretabilidade.
Apesar dos feitos impressionantes que a IA generativa pode realizar, ela, em última análise,carece de uma compreensão coerente do mundo32. Como resultado, a IA não pode verificar a qualidade das fontes e, às vezes, pode ser enganada. Por exemplo, a Wired33 descobriu que os produtos de IA do Google, da Microsoft e da Perplexity têm apresentado respostas de IA baseadas em teorias raciais amplamente refutadas, devido à falta de informações de alta qualidade na internet. Além disso, os modelos de IA podem alucinar e ainda estão aprendendo a transmitir a incerteza.
Anteriormente, as publicações publicavam seus dados e códigos junto com o trabalho produzido usando aprendizado de máquina ou IA. Agora, há uma demanda ainda maior por responsabilidade e explicabilidade algorítmica: as audiências querem saber quando o conteúdo está sendo produzido pela IA34. Mesmo assim, alguns estudos iniciais mostraram que a audiência tende a confiar menos no conteúdo de notícias quando ele é marcado como gerado por IA.
O jornalismo depende de uma relação entre o escritor e o leitor. Manter a confiança é fundamental. E à medida que a IA se torna cada vez mais usada em diferentes níveis de produção de notícias, as empresas de mídia estão tentando ser o mais transparentes possível em suas divulgações.
Em uma orientação divulgada pelo The New York Times35 em maio de 2024, seus editores disseram que a IA generativa será usada como uma ferramenta a serviço de sua missão de descobrir a verdade e ajudar mais pessoas a entender o mundo. A tecnologia é usada com orientação humana e avaliações, e os editores explicam como o trabalho foi criado e as medidas que tomaram para mitigar riscos, viés e imprecisões.
"A relação entre um jornalista e a IA não é diferente do processo de desenvolver fontes ou cultivar facilitadores", conforme colocado pela Columbia Journalism Review36. "Assim como acontece com as fontes humanas, as inteligências artificiais podem ter conhecimento, mas não estão livres de subjetividade em seu projeto e também precisam ser contextualizadas e qualificadas."
Há uma tendência de maior transparência nos sistemas de IA em vários setores. No entanto, as empresas ainda estão negociando o equilíbrio entre mais códigos de código-fonte e segurança.
A chegada da IA está complicando os termos de uma relação em evolução entre grandes empresas de tecnologia e o setor de mídia de notícias. Nas últimas décadas, as organizações de notícias têm entrado em sintonia com as plataformas de tecnologia que distribuem seu conteúdo. Devido a modelos de negócios conflitantes, existem processos judiciais em curso nos quais os editores argumentam que os gigantes da tecnologia estão monopolizando a receita publicitária, o tráfego e usando seu conteúdo sem compensação justa37. A IA parece estar piorando esse problema.
Alguns executivos de mídia disseram à New York Magazine 19 que estão preocupados que os resumos de IA em mecanismos de busca como o Google tornem mais fácil para os agregadores "roubar seu conteúdo" e inundar a web com informações de baixa qualidade.
Um 2024 Tow Report38 da Columbia Journalism Review observou que, como a IA personalizada é difícil de desenvolver internamente, as organizações de notícias devem depender de empresas de tecnologia. Além disso, a pesquisa aprimorada por IA pode afetar o engajamento da audiência e consolidar o controle das plataformas de tecnologia sobre o ecossistema.
No entanto, as empresas de mídia têm uma vantagem nas negociações com as empresas de tecnologia desta vez. A IA só pode trabalhar com informações existentes. A IA não pode ir ao mundo e reunir novas informações, experiências ou interagir com outros humanos. O conteúdo de notícias é uma fonte valiosa de informações em tempo real em um contexto que pode melhorar a qualidade dos modelos de base, "que sofrem de viés, desinformação e spam", de acordo com um comentário do Brookings Institute39. Na verdade, artigos de notícias constituem uma quantidade substancial do conjunto de dados usado para treinar LLMs populares, de acordo com uma investigação do Washington Post40.
É importante ressaltar que os sistemas de IA estão sempre ávidos por mais dados. E as empresas de tecnologia estão esgotando rapidamente41 dos dados de treinamento disponíveis publicamente para esses modelos. Sem novos dados de alta qualidade, esses modelos podem se degradar e até entrar em colapso.
Isso significa que os veículos de notícias podem ter mais poder para definir o relacionamento que terão com as empresas que desenvolvem sistemas de IA. E há um incentivo maior para que as empresas de tecnologia trabalhem em conjunto com as empresas de mídia ou enfrentem problemas de propriedade intelectual.
Conforme a situação, algumas editoras estão processando empresas de IA por violação de direitos autorais, enquanto outras estão assinando contratos de licenciamento42.
Isso destaca a necessidade de um framework legal atualizado em torno da propriedade intelectual e da compensação. O The Washington Post43 descobriu que, às vezes, os resumos de IA permitiam que as plataformas de tecnologia contornassem regulamentações anteriores que exigiam que pagassem aos editores pelo conteúdo, especialmente o conteúdo protegido por paywalls.
Embora ainda haja marcos legais para navegar, há um futuro em que as empresas de IA e as organizações de notícias podem colaborar de forma mutuamente benéfica. A chave é comunicação e discussão abertas. Em vez de supor44 o que as pessoas precisam, os desenvolvedores de IA devem perguntar aos stakeholders do setor sobre as ferramentas e serviços que seriam benéficos para os usuários.
