Como usar o
datazoom.amazonia
?
A ideia desse guia é mostrar de forma simples e prática como usar o nosso pacote no R. Mais informações sobre as bases de dados disponíveis e como acessá-las podem ser encontradas no nosso Github.
Para começar, vamos instalar e carregar o pacote
datazoom.amazonia
no R.
install.packages("datazoom.amazonia")
library(datazoom.amazonia)
As funções do pacote são mostradas com o comando
help(package = "datazoom.amazonia")
. De forma geral, elas
seguem o padrão load_*
seguida pelo nome da base de
dados.
Um exemplo: IPS
Vamos começar carregando a base de dados do IPS, usando a função
load_ips
.
ips <- load_ips(dataset = "all", raw_data = FALSE, time_period = 2021, language = "pt")
No primeiro argumento dataset
, escolhemos quais as
variáveis do IPS queremos — no caso todas ("all"
). O
segundo argumento define se receberemos os dados brutos
(raw_data = TRUE
) ou os dados já tratados
(raw_data = FALSE
). O argumento time_period
serve para escolhermos o ano de referência dos dados, o IPS mais recente
é o de 2021. Por fim, language
permite que o nome das
colunas seja traduzido para inglês (language = "en"
) ou
mantido em português (language = "pt"
), mas isso só
funciona no caso dos dados tratados.
No geral, todas as funções do pacote seguem esse padrão.
Abaixo, podemos ver as 5 primeiras colunas da tabela resultante
ips
:
year | codigo_ibge | municipio | estado | ips_amazonia |
---|---|---|---|---|
2021 | 1100015 | Alta Floresta D’Oeste | RO | 54.75536 |
2021 | 1100023 | Ariquemes | RO | 56.57770 |
2021 | 1100031 | Cabixi | RO | 57.53493 |
2021 | 1100049 | Cacoal | RO | 63.15397 |
2021 | 1100056 | Cerejeiras | RO | 61.21948 |
2021 | 1100064 | Colorado do Oeste | RO | 62.53915 |
Como explorar os dados?
Uma vez que os dados estejam carregados, temos 2 opções: continuar nossa análise dentro do próprio R ou exportar os dados e utilizar algum outro software de análise de dados.
1) Exportando os dados: O comando
write.csv
permite exportar a tabela ips
para o
formato .csv, que pode ser aberto em vários outros programas. Basta
utilizar o comando abaixo alterando o caminho path
para a
pasta onde você deseja salvar o arquivo.
write.csv(ips, file = "path/ips.csv")
2) No R: Para analisar os dados no R, podemos
utilizar o pacote tidyverse
.
library(tidyverse)
Se quisermos, por exemplo, achar o Índice de Progresso Social médio de cada estado, podemos usar o comando:
ips %>%
group_by(estado) %>%
summarise(ips_medio = mean(ips_amazonia))
## # A tibble: 9 × 2
## estado ips_medio
## <chr> <dbl>
## 1 AC 53.5
## 2 AM 54.2
## 3 AP 55.0
## 4 MA 53.3
## 5 MT 57.9
## 6 PA 52.9
## 7 RO 57.2
## 8 RR 52.4
## 9 TO 54.1
Podemos também usar o pacote ggplot2
, contido no
tidyverse
, para visualizar os dados. Se quisermos um
histograma dos IPSs municipais:
ggplot(ips, aes(x = ips_amazonia)) +
geom_histogram(color = "#0072BD", fill = "#0072BD") +
xlab("Índice de Progresso Social") +
ylab("")
Se quisermos construir um ranking dos 15 maiores IPSs municipais em 2021:
### selecionando e ordenando os maiores IPSs
ips_rank <- ips %>%
filter(ranking_ips <= 15) %>%
mutate(municipio = fct_reorder(municipio, ranking_ips, max, .desc = TRUE))
### definindo a paleta de cores
pallete_discrete <- c("#fcff84", "#ffcf48", "#99b0c8", "#007e47", "#00596d", "#4fdf94", "#261c4e", "#000098", "#c368b1", "#60458c", "#757575")
### montando o gráfico
ggplot(ips_rank, aes(x = municipio, y = ips_amazonia, fill = estado, color = estado)) +
geom_bar(stat = "identity", width = 0.8, position = position_dodge(width = 0.9)) +
coord_flip() +
xlab("Índice de Progresso Social") +
ylab("") +
scale_colour_manual(values = pallete_discrete) +
scale_fill_manual(values = pallete_discrete)
No site do Data Zoom Amazônia, você pode ver outras visualizações usando os dados do IPS.
Se você precisar de ajuda ou encontrar erros no pacote, por favor fale conosco pelo Github.