coleta automatizada de reportagens

Iniciativa facilita coleta automatizada de reportagens para análises e pesquisas

* Artigo publicado pela Abraji, em 7 de janeiro de 2019, sobre trabalho de desenvolvimento de software realizado para o Impacto.Jor. Este projeto é uma contribuição para a comunidade, um conjunto de scripts escritos em Python para coleta automatizada de reportagens sobre palavras-chave definidas pelo usuário.

Analisar desequilíbrios na cobertura jornalística de um determinado tema requer o exame de grande quantidade de material e pode ser uma tarefa trabalhosa. Pensando em facilitar essa missão, um grupo de pesquisadores desenvolveu uma ferramenta que automatiza a coleta de reportagens. 

Feita na linguagem de programação python, a iniciativa provisoriamente chamada de impacto-midia é aberta e as instruções para utilizá-la estão em um repositório no GitHub. Sua interface permite que o usuário visualize todos os títulos, links e estatísticas de engajamento em redes sociais das reportagens que tenham os termos de busca no título ou no corpo, rankeando e categorizando-as. Depois disso, basta exportar e ver o resultado.

“Costumava ser bastante laborioso selecionar, baixar e categorizar uma grande quantidade de reportagens. Usando nosso código, o tempo gasto com isso pode ser bastante reduzido”, explica Pedro Burgos, que desenvolveu a ferramenta junto com Álvaro Turicas e Bernardo Vianna.

coleta automatizada de reportagens
Projeto foi repercutido pela Abraji em janeiro de 2019.

Parte do código da impacto-midia tem origem no projeto iniciado por Burgos em 2017, o Impacto.Jor, cujo propósito é responder a duas perguntas: para que serve o jornalismo e como saber se ele está funcionando? Para isso, o projeto entrega aos veículos parceiros métricas que permitem avaliar o desempenho de uma reportagem e medir o seu impacto além dos números de audiência.

Burgos conta que o Impacto.Jor permitiu que algumas hipóteses sobre o impacto do jornalismo fossem revistas. No pleito eleitoral, por exemplo, percebeu-se que quando um político importante cita uma reportagem, isso não necessariamente influencia o debate político. “Durante a eleição o que mais vimos foi oponentes políticos usando reportagens apenas para atacar o adversário. O que é legítimo e pode ser impacto, mas pode-se dizer que é impacto ‘positivo’ para os leitores que são seguidores de um político X e ‘negativo’ para os outros eleitores”, diz.

Segundo o jornalista, a experiência se mostrou especialmente útil para veículos de cobertura essencialmente local, como a Gazeta do Povo. “Em nível local, o impacto costuma ser bem mais nítido: o repórter escreve sobre as lâmpadas queimadas de uma praça, e a prefeitura tem que agir”, exemplifica. “Não há partidarismo, e a função do jornal como instituição que cobra os poderosos, e faz a ponte entre sociedade civil e governo é bem nítida”, diz Burgos. 

No caso de veículos de alcance nacional, apesar do impacto ser grande, muito do “automaticamente capturável” pela ferramenta se mostrava apenas parte do jogo político. “Nossos robozinhos, que alimentam a ‘dashboard de potenciais impactos’ de cada um dos parceiros, produziram vários ‘falsos positivos’ especialmente durante as eleições”, conta o desenvolvedor. 

“O impacto-midia foi uma maneira que encontramos de usar parte do código que escrevemos [no Impacto.jor] para ajudar pesquisadores em uma área que acreditamos precisa de apoio: a automação de pesquisas em mídia”, diz Burgos.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *