Infográficos, visualização e jornalismo de dados.
Tutoriais e ferramentas grátis/opensource pra raspar, extrair, limpar e visualizar dados.
Como transformar informação suja e escondida em dados abertos e elegantes pra visualizar, compreender e fazer sentido.
Já ouviu falar da tabela dinâmica? É um recurso poderoso do Excel e do Planilhas Google para resumir sua tabela de dados com agregações como soma, média e contagem, e poder gerar tabelas menores.
Para que serve
Se você tem uma tabela super detalhada de produtos vendidos, com a tabela dinâmica você pode criar um resumo com a soma dos valores vendidos por mês, tipo de produto ou por estado, dependendo das colunas que houver na sua fonte de dados. Seria possível também, nesse exemplo, ver a média mensal ou a contagem de produtos únicos vendidos em um determinado local.
Como fazer tabela dinâmica no Planilhas Google:
Veja no vídeo como funciona e como criar uma tabela dinâmica:
Como fazer gráficos que atualizam dinamicamente quando seus dados mudam? Ou seja, criar um gráfico que se modifique sozinho quando os dados atualizarem. Quem trabalha com dados no jornalismo precisa em algum momento criar um monitor para acompanhar determinado assunto, mantendo as informações atualizadas com certa frequência, puxando direto da fonte oficial ou de uma planilha intermediária. Aí surge a necessidade de criar uma visualização que se alimente desses dados e se atualize sozinha sem que você tenha que toda vez abrir para atualizar os gráficos.
Com os dados sobre o Coronavírus, muita gente precisou criar mais gráficos para acompanhar a evolução da epidemia, e manter os gráficos atualizados se tornou uma dificuldade à parte. Testei muitas fontes e programas para criar um monte de gráficos automatizados neste período até chegar em soluções sustentáveis, e posso indicar 3 ferramentas online gratuitas para criar gráficos que se alimentam de dados dinâmicos: Google Sheets, Datawrapper e Tableau Public. Em todas elas você pode usar o Google Docs como fonte dos dados ou um CSV externo.
Atualização rápida (em torno de 5 min, se não for imediata)
Gráficos no mesmo lugar onde estão os dados (pode ser uma vantagem para manuntenção)
Leves (carregamento rápido quando embedado)
Contras:
Gráficos são mais simples
Gráficos não são responsivos (se você quiser atender diferentes tamanhos de tela, tem que duplicar e ajustar o tamanho do gráfico)
Mapas muito básicos (não dá pra usar só o Brasil, por exemplo, só a América do Sul inteira) e um pouco lentos para carregar
A fonte tem que ser o próprio google Sheets (você pode até usar uma fonte externa, mas importando para o Google Docs, com funções como IMPORTXML, IMPORTCSV ou mesmo IMPORTHTML, para elementos table)
Frequência de Atualização:
Imediata (ou geralmente em até 5 minutos)
Como fazer um gráfico dinâmico no Google Sheets
Insira seus dados em uma tabela do Sheets
Selecione os dados
Vá no menu "Inserir gráfico"
O gráfico já aparece na tela, com sugestão de formato de acordo com seus dados. Faça todos os ajustes no editor de gráfico, na barra lateral.
Publique. No botão de opções (três pontinhos) no canto do gráfico, há uma opção Publicar. No popup, escolha Incorporar, e copie o código de embed
Aceita tabelas do Google Docs (existe o modo importação, que deixa os dados estáticos, e o modo "Link external dataset", o mesmo caminho para CSVs externos, que é a opção que mantém seus dados atualizados)
Aceita CSVs externos, salvos em algum servidor web
Gráficos muito versáteis, de diversos tipos
Bonito, visual interessante
Responsivo (adapta muito bem em tamanhos diferentes, tem até ajustes específicos mobile/desktop)
Contras:
Não é totalmente personalizável.
A interatividade é simples (tooltips). Mas não dá para fazer filtros ou seleções
O crédito precisa aparecer na versão grátis
Frequência de Atualização:
A cada minuto no primeiro dia após a publicação. Depois de 24h, é atualizado de hora em hora (para resetar a contagem, basta abrir o gráfico para republicar).
Para forçar a atualização, precisa abrir o gráfico, e ir na aba "Check & Describe" para puxar os dados novos (não precisa republicar o gráfico)
Como fazer um gráfico dinâmico no Datawrapper
Crie um novo gráfico (New Chart, New Map ou New table)
Na tela de Upload Data, escolha "Link external dataset" (a opção "Import Google Spreadsheet" não vai manter seu gráfico atualizado, ela só importa os dados uma vez)
Cole o link de um CSV externo. No caso de uma tabela do Google, ative o compartilhamento da planilha antes (Compartilhar > Copiar link > Mudar para qualquer pessoa com link. Depois disso, pode copiar até o link pela barra de endereços)
Siga as etapas para criar o gráfico
Finalize em "Publish & Embed" para copiar o código
Possível criar filtros e permitir maior interatividade com os gráficos
Possível criar cálculos, agrupamentos e transformações com os dados
Contras:
Pesado (carregamento mais lento)
Curva de aprendizado maior
Não é online (tem para windows e mac)
Frequência de Atualização:
1 vez por dia. Para forçar a atualização, precisa estar logado na conta do Tableau Public e clicar em "Solicitar atualização", no rodapé do gráfico, que fica no seu perfil.
Como fazer um gráfico dinâmico no Tableau Public
Connect to Data > Google Sheets
Dê as permissões no navegador
Escolha a planilha da sua conta
Crie a visualização
Save to Tableau Public...
Deixe marcada a opção "Manter meus dados sincronizados..." ("Keep my data in sync with Google Sheets and embed my Google credentials")
O Flourish é uma ferramenta sensacional. Possui interatividades e animações (o modelo da famosa bar chart race), vários tipos de gráficos interessantes, e é versátil nas aplicações, como a possibilidade de criar "histórias", com uma sequência de gráficos, ou até mesmo embedar um gráfico dentro do outro.
Mas o Flourish não tem, até o momento, um método simples de conexão com uma fonte de dados dinâmica. Há apenas a opção de inserir dados via Copiar e Colar, ou upload de arquivos Excel, CSV, TSV, Json e Geojson. Quando lançaram o modelo de Growth Comparison, para comparação do crescimento da Covid-19 entre países, vi que eles possuem API. Para quem vai construir o gráfico via API, é possível usar dados dinâmicos via Json, por exemplo, mas aí depende de saber programar, diferente das outras soluções.
Uma dúvida comum para quem usa bastante o Filtro do Excel é: depois de filtrar, como copiar apenas as células que estou vendo? Ou: se eu copiar essa seleção, as células ocultas vão ser copiadas junto?
Além de a resposta não ser óbvia do ponto de vista lógico ou de usabilidade, o próprio Excel não é muito previsível ou consistente, principalmente no Windows. O ideal, para usuários frequentes do filtro, é testar bastante até se acostumar com a ferramenta e ter certeza do que você vai estar fazendo. Estar seguro sobre isso pode garantir a qualidade dos dados com que você está trabalhando.
Vamos lá. Veja como selecionar apenas as células visíveis no Microsoft Excel:
Excel para windows
Na barra de ferramentas do Excel, vá até a "Página inicial" (Home), e encontre o "Localizar e selecionar" (Find & Select)
Ir para > Especial... (Go To > Special)
Apenas células visíveis (Visible cells only) e selecione OK
Agora é só copiar e colar onde você deseja
Excel para Mac
A princípio, o Excel no Mac já copia só as células visíveis e as ocultas não vão ser coladas junto com o restante, quando você usa o filtro.
Mas, se quiser garantir, no Mac OS o caminho é parecido. Quando você usa outras funções, como os Subtotais, também é necessário fazer isso para copiar:
No Excel mais novo, deve ser possível seguir o mesmo caminho do Windows. Na versão Excel for Mac 2011, faça o seguinte:
Vá até o Menu superior "Edit > Go To..."
Botão "Special..."
Selecione "Visible Cells Only" e dê OK
Google Sheets
No programa de planilhas do Google Docs, as células visíveis são copiadas por padrão, tanto na função Filtro como nos Subtotais. Por isso não há um caminho para isso.
Subtotal
Além do filtro, uma outra função que também oculta linhas e é comum para quem trabalha com dados é o uso dos Subtotais. Quando você "recolhe" as linhas para mostrar apenas só os subtotais e não os itens, a seleção também pode copiar as linhas e células ocultas.
Veja no vídeo abaixo como fazer a seleção. O exemplo é no Excel for Mac, usando a função subtotal.
Criar uma tabela é o caminho mais fácil para reordenar (classificar) linhas, em ordem alfabética, ou por ordem de valores. Veja como mudar a sequência de linhas usando a ferramenta de planilhas do Google, o Google Sheets, ou Planilhas Google, em português.
O primeiro passo é travar o cabeçalho (se não tem cabeçalho, crie um) arrastando aquela linha mais grossa entre as linhas 1 e 2.
Depois, clique na setinha que abre as opções da coluna desejada e "Classificar de A - Z" ou "Classificar de Z - A". Serve tanto para colunas de texto (ordem alfabética) quanto de números (ordem por valor numérico).
Use esse recurso para criar rankings, organizar listas, ou no caso do exemplo, poderia ser usado para agrupar os nomes dos senadores por partido ou por estado (Classificando a coluna "Partido", nomes do PT ficariam todos juntos, do PSDB também, assim por diante).
O Planilhas Google é uma espécie de excel online, software totalmente gratuito da suite Google Docs. Todos os arquivos editados lá são salvos automaticamente e ficam armazenados na nuvem, na sua conta do Google Drive.
Classificar linhas no Excel
Se você precisa ordenar linhas em ordem alfabética (ou em ordem de valores) no Excel o caminho é parecido. Dê uma olhada nessa explicação: Ordenar listas ou tabelas no Excel
Ordenar valores em ordem crescente/decrescente com o Filtro.
Certifique-se de ter um cabeçalho
Selecione todas as células (se selecionar só algumas, a ordem vai bagunçar depois)
Vá até a aba Dados (Data) > Filtro (Filter). Atalho no Mac: Cmd + Shift + F
Use os botões com seta que surgiram no cabeçalho das colunas para ordenar (sort) as linhas em ordem crescente/decrescente (ordem alfabética em caso de texto)
Filtro automático
Usando o filtro sem selecionar todas as células da tabela
O filtro é criado mesmo que você só tenha uma célula selecionada.
Para funcionar corretamente dessa forma: a tabela não deve ter linhas ou colunas vazias.
Se tiver, o filtro vai pegar só uma parte dos seus dados, e vai parar assim que encontrar uma linha ou coluna vazia.
(Por tabela quero dizer apenas as células que contém os dados em questão dentro de uma planilha, não todas as células até o fim da planilha)