A ideia desse guia é mostrar de forma simples e prática como usar o nosso pacote no R. Mais informações sobre as bases de dados disponíveis e como acessá-las podem ser encontradas no nosso Github.

Para começar, vamos instalar e carregar o pacote datazoom.amazonia no R.

install.packages("datazoom.amazonia")
library(datazoom.amazonia)

As funções do pacote são mostradas com o comando help(package = "datazoom.amazonia"). De forma geral, elas seguem o padrão load_* seguida pelo nome da base de dados.

Um exemplo: IPS

Vamos começar carregando a base de dados do IPS, usando a função load_ips.

ips <- load_ips(dataset = "all", raw_data = FALSE, time_period = 2021, language = "pt")

No primeiro argumento dataset, escolhemos quais as variáveis do IPS queremos — no caso todas ("all"). O segundo argumento define se receberemos os dados brutos (raw_data = TRUE) ou os dados já tratados (raw_data = FALSE). O argumento time_period serve para escolhermos o ano de referência dos dados, o IPS mais recente é o de 2021. Por fim, language permite que o nome das colunas seja traduzido para inglês (language = "en") ou mantido em português (language = "pt"), mas isso só funciona no caso dos dados tratados.

No geral, todas as funções do pacote seguem esse padrão.

Abaixo, podemos ver as 5 primeiras colunas da tabela resultante ips:

year codigo_ibge municipio estado ips_amazonia
2021 1100015 Alta Floresta D’Oeste RO 54.75536
2021 1100023 Ariquemes RO 56.57770
2021 1100031 Cabixi RO 57.53493
2021 1100049 Cacoal RO 63.15397
2021 1100056 Cerejeiras RO 61.21948
2021 1100064 Colorado do Oeste RO 62.53915

Como explorar os dados?

Uma vez que os dados estejam carregados, temos 2 opções: continuar nossa análise dentro do próprio R ou exportar os dados e utilizar algum outro software de análise de dados.

1) Exportando os dados: O comando write.csv permite exportar a tabela ips para o formato .csv, que pode ser aberto em vários outros programas. Basta utilizar o comando abaixo alterando o caminho path para a pasta onde você deseja salvar o arquivo.

write.csv(ips, file = "path/ips.csv")

2) No R: Para analisar os dados no R, podemos utilizar o pacote tidyverse.

library(tidyverse)

Se quisermos, por exemplo, achar o Índice de Progresso Social médio de cada estado, podemos usar o comando:

ips %>%
  group_by(estado) %>%
  summarise(ips_medio = mean(ips_amazonia))
## # A tibble: 9 × 2
##   estado ips_medio
##   <chr>      <dbl>
## 1 AC          53.5
## 2 AM          54.2
## 3 AP          55.0
## 4 MA          53.3
## 5 MT          57.9
## 6 PA          52.9
## 7 RO          57.2
## 8 RR          52.4
## 9 TO          54.1

Podemos também usar o pacote ggplot2, contido no tidyverse, para visualizar os dados. Se quisermos um histograma dos IPSs municipais:

ggplot(ips, aes(x = ips_amazonia)) +
  geom_histogram(color = "#0072BD", fill = "#0072BD") +
  xlab("Índice de Progresso Social") +
  ylab("")

Se quisermos construir um ranking dos 15 maiores IPSs municipais em 2021:

### selecionando e ordenando os maiores IPSs
ips_rank <- ips %>%
  filter(ranking_ips <= 15) %>%
  mutate(municipio = fct_reorder(municipio, ranking_ips, max, .desc = TRUE))


### definindo a paleta de cores
pallete_discrete <- c("#fcff84", "#ffcf48", "#99b0c8", "#007e47", "#00596d", "#4fdf94", "#261c4e", "#000098", "#c368b1", "#60458c", "#757575")


### montando o gráfico 
ggplot(ips_rank, aes(x = municipio, y = ips_amazonia, fill = estado, color = estado)) +
  geom_bar(stat = "identity", width = 0.8, position = position_dodge(width = 0.9)) + 
  coord_flip() +
  xlab("Índice de Progresso Social") +
  ylab("") +
  scale_colour_manual(values = pallete_discrete) +
  scale_fill_manual(values = pallete_discrete)

No site do Data Zoom Amazônia, você pode ver outras visualizações usando os dados do IPS.

Se você precisar de ajuda ou encontrar erros no pacote, por favor fale conosco pelo Github.