Como usar o datazoom.amazonia?

A ideia desse guia é mostrar de forma simples e prática como usar o nosso pacote no R. Mais informações sobre as bases de dados disponíveis e como acessá-las podem ser encontradas no nosso Github.

Para começar, vamos instalar e carregar o pacote datazoom.amazonia no R.

install.packages("datazoom.amazonia")
library(datazoom.amazonia)

As funções do pacote são mostradas com o comando help(package = "datazoom.amazonia"). De forma geral, elas seguem o padrão load_* seguida pelo nome da base de dados.

Um exemplo: IPS

Vamos começar carregando a base de dados do IPS, usando a função load_ips.

ips <- load_ips(dataset = "all", raw_data = FALSE, time_period = 2021, language = "pt")

No primeiro argumento dataset, escolhemos quais as variáveis do IPS queremos — no caso todas ("all"). O segundo argumento define se receberemos os dados brutos (raw_data = TRUE) ou os dados já tratados (raw_data = FALSE). O argumento time_period serve para escolhermos o ano de referência dos dados, o IPS mais recente é o de 2021. Por fim, language permite que o nome das colunas seja traduzido para inglês (language = "en") ou mantido em português (language = "pt"), mas isso só funciona no caso dos dados tratados.

No geral, todas as funções do pacote seguem esse padrão.

Abaixo, podemos ver as 5 primeiras colunas da tabela resultante ips:

year	codigo_ibge	municipio	estado	ips_amazonia
2021	1100015	Alta Floresta D’Oeste	RO	54.75536
2021	1100023	Ariquemes	RO	56.57770
2021	1100031	Cabixi	RO	57.53493
2021	1100049	Cacoal	RO	63.15397
2021	1100056	Cerejeiras	RO	61.21948
2021	1100064	Colorado do Oeste	RO	62.53915

Como explorar os dados?

Uma vez que os dados estejam carregados, temos 2 opções: continuar nossa análise dentro do próprio R ou exportar os dados e utilizar algum outro software de análise de dados.

1) Exportando os dados: O comando write.csv permite exportar a tabela ips para o formato .csv, que pode ser aberto em vários outros programas. Basta utilizar o comando abaixo alterando o caminho path para a pasta onde você deseja salvar o arquivo.

write.csv(ips, file = "path/ips.csv")

2) No R: Para analisar os dados no R, podemos utilizar o pacote tidyverse.

library(tidyverse)

Se quisermos, por exemplo, achar o Índice de Progresso Social médio de cada estado, podemos usar o comando:

ips %>%
  group_by(estado) %>%
  summarise(ips_medio = mean(ips_amazonia))

## # A tibble: 9 × 2
##   estado ips_medio
##   <chr>      <dbl>
## 1 AC          53.5
## 2 AM          54.2
## 3 AP          55.0
## 4 MA          53.3
## 5 MT          57.9
## 6 PA          52.9
## 7 RO          57.2
## 8 RR          52.4
## 9 TO          54.1

Podemos também usar o pacote ggplot2, contido no tidyverse, para visualizar os dados. Se quisermos um histograma dos IPSs municipais:

ggplot(ips, aes(x = ips_amazonia)) +
  geom_histogram(color = "#0072BD", fill = "#0072BD") +
  xlab("Índice de Progresso Social") +
  ylab("")

Se quisermos construir um ranking dos 15 maiores IPSs municipais em 2021:

### selecionando e ordenando os maiores IPSs
ips_rank <- ips %>%
  filter(ranking_ips <= 15) %>%
  mutate(municipio = fct_reorder(municipio, ranking_ips, max, .desc = TRUE))


### definindo a paleta de cores
pallete_discrete <- c("#fcff84", "#ffcf48", "#99b0c8", "#007e47", "#00596d", "#4fdf94", "#261c4e", "#000098", "#c368b1", "#60458c", "#757575")


### montando o gráfico 
ggplot(ips_rank, aes(x = municipio, y = ips_amazonia, fill = estado, color = estado)) +
  geom_bar(stat = "identity", width = 0.8, position = position_dodge(width = 0.9)) + 
  coord_flip() +
  xlab("Índice de Progresso Social") +
  ylab("") +
  scale_colour_manual(values = pallete_discrete) +
  scale_fill_manual(values = pallete_discrete)

No site do Data Zoom Amazônia, você pode ver outras visualizações usando os dados do IPS.

Se você precisar de ajuda ou encontrar erros no pacote, por favor fale conosco pelo Github.