Escrito en
OPINIÃO
el
Somos um grupo de cientistas de dados. Temos formações diversas, que vão da Ciência da Computação e Engenharia às Ciências Sociais, Economia e Administração. O que nos une, entre outras coisas, é o método científico, o interesse em dados abertos, inteligência artificial, programação em R e outras linguagens livres. Somos os pescadores que se encantam mais com a rede que com o mar, como diria Oswaldo Montenegro.
Mas, obviamente, além do interesse pelos mesmos métodos de trabalho, temos outras coisas em comum, entre elas o interesse por política e pelas redes sociais.
Inscreva-se no nosso Canal do YouTube, ative o sininho e passe a assistir ao nosso conteúdo exclusivo.
Acreditamos que as redes sociais, e em especial o Twitter, podem fornecer informações valiosas sobre a percepção da sociedade a respeito de temas diversos, principalmente as mudanças políticas. Esses dados, de acesso público através do uso de APIs (Interfaces de Programação) disponibilizadas livremente em diferentes linguagens de programação, apresentam desafios importantes para a sua interpretação.
Por um lado, a magnitude e o tipo de interação entre os usuários do Twitter oferece uma fonte de comportamentos impossível de ser ignorada. Por outro, a necessidade de apresentar uma interpretação sobre esse grande volume de atos comunicacionais produzidos, enquanto o “assunto ainda está quente”, pode resultar em vieses e/ou erros de interpretação.
A coleta, análise e produção de visualizações de dados de redes sociais digitais exigem uma clara expertise técnica. Nos unimos com o intuito de fazer este trabalho com recursos metodológicos multi-método avançados. Nossos achados são fiados em aprofundadas técnicas de análise estatísticas e visualização de dados, assim como em algoritmos de inteligência artificial de grande poder preditivo. Tentamos disponibilizar essa metodologia através de repositórios de acesso público e livre, contendo códigos fontes e dados utilizados que facilitam a reprodução das análises.
Por fim, e não menos importante, tentamos seguir orientações de referências do jornalismo de dados, que indicam um fluxo de trabalho ideal para essa atividade: 1) Definimos uma pergunta; 2) Buscamos os dados que possam respondê-la; 3) Usamos de rigor Matemático e Estatístico para nossas análises; 4) Desconfiamos de qualquer padrão observado nos dados e tentamos verificar a lógica por trás desses padrões antes de divulgá-los; 5) Utilizamos da visualização de dados como forma de simplificar a interpretação dos mesmos; 6) Misturamos diferentes fontes de dados e técnicas de análise a fim de criar algo que tenha significado e valor social; 7) Trabalhamos em equipe, dividimos tarefas e somamos esforços pelo mesmo resultado.
Os resultados deste trabalho em equipe são recentes, e começaram a ser divulgados a partir da primeira de uma série de reportagens lideradas pelo Intercept Brasil sobre o escândalo da #VazaJato: o vazamento de conversas entre juiz e procuradores da República envolvidos na Força Tarefa da Lava Jato.
No nosso primeiro post falamos das primeiras reações no Twitter sobre os vazamentos. Mostramos a frequência de tuítes no tempo, o número de retuítes e ainda uma primeira impressão do que seja o conteúdo dos tuítes.
Em seguida fizemos um texto que mostra diversas aplicações de teorias de redes nas análises sobre os conteúdos do Twitter. Dessa forma mostramos uma topologia das redes que se forma em torno de hashtags chaves para a compreensão da #VazaJato, informamos como algoritmos de I.A. ajudam a identificar em que grupo um texto se enquadra a partir das palavras do discurso e explicitamos como redes de palavras são formadas nos diversos termos aprofundados na análise.
Na sequência dos acontecimentos publicamos artigo que mostra as corridas de hashtags ao longo do dia do pronunciamento do ex-juiz Sérgio Moro no Senado. Uma animação em forma de gif dá uma ideia desse comportamento e traz pistas para eventuais uso de robôs para massificar hashtags.
Finalmente, escrevemos dois posts em que apresentamos aplicações construídas para a produção dos 3 posts anteriores: Lavínia e a rede de palavras. A Lavínia é a ferramenta de inteligência artificial que permite o enquadramento do discurso nas hashtags em disputa. Já o aplicativo de redes de palavras interativas é nossa aposta para entrevistar os dados em uma abordagem etnográfica.
E depois do que já foi escrito e analisado, o que fazer? Queremos continuar a explorar os dados da #VazaJato, bem como outros temas que possam ser relevantes para os debates públicos. A diferença é que agora estamos com a parceria com a revista Fórum e publicamos na forma de blog. A ideia é que tenhamos mais alcance para mais debates, mais democratização do jornalismo de dados e mais espaço para aprendizagem. Vamos ampliar o escopo. Vamos de mais Dadoscope.