2020 - 10 - 05
scriptstidyverse
readr::tibble::tidyr::dplyr::ggplot2::tidyverse







readr::Agora que sabemos o que funções são e mais ou menos como elas funcionam, podemos usá-las em nosso benefício.
Podemos importar dados do Excel1, de arquivos de texto armazenados no computador, Google Drive2, e direto da internet ou fazendo conexões com bancos de dados usando pacotes como DBI::
Para importar dados do computador recomenda-se que estejam no formato .csv ou .txt ou algum outro tipo de formato de texto.
Para importar os dados usamos as funções da família read_*() ou seja:
read_*()Existem outras funções da família read_*(), para ler arquivos de texto cuja separação entre colunas não é , e sim ; (muito comum em países onde o ponto decimal é a vírgula) e arquivos onde a separação são espaços em branco ou outro tipo de caractere. Estas são:
read_csv(): serve para ler arquivos com , como separador de colunas e . como decimalread_csv2(): arquivos com ; como separador e , como decimalread_delim(): TAB, ou outros como separador de colunas?read_*() no console e leia a documentação desta família de funções.tidyr::O tidyr é um pacote que serve para organizar as tabelas em um formato específico: o formato tidy.
O formato tidy é um formato de dados usado em bancos de dados e é a melhor forma de organizar os dados para se fazer operações estatísticas no R e construir gráficos.
tbl_long <- pivot_longer(
data = tbl, # quais os dados vou usar
cols = -Pais, # quais colunas quero transformar
names_to = "Ano", # nomes das colunas vão para...
values_to = "Valor") # valores vão para coluna ...
gt(tbl_long)| Pais | Ano | Valor |
|---|---|---|
| Brasil | X1999 | 0.50 |
| Brasil | X2000 | 0.60 |
| Brasil | X2001 | 0.71 |
| Argentina | X1999 | 0.69 |
| Argentina | X2000 | 0.98 |
| Argentina | X2001 | 0.96 |
O que é ggplot(tbl_long ...) ??
ggplotOs elementos dos gráficos são:
| Elementos | Função | o que faz: |
|---|---|---|
| Dados | ggplot() |
Inicializa o gráfico |
| Estéticas | aes(x = , y = ) |
Mapeia variáveis aos elementros gráficos |
| Geoms, stats | geom_point() |
Desenha os elementos (pontos, linhas) |
| Rótulos | labs() |
Muda os rótulos dos eixos e título |
| Coordenadas | coord_trans() |
Muda coordenadas do gráfico |
| Escalas | scale_color_*() |
Modifica os elementos gráficos |
| Facetas | facet_wrap() |
Separa os dados em subgráficos |
| Temas | theme_bw() |
Modifica os elementos dos eixos e outros |
Vamos usar o dataset mpg para fazer este gráfico:
| manufacturer | model | displ | year | cyl | trans | drv | cty | hwy | fl | class |
|---|---|---|---|---|---|---|---|---|---|---|
| audi | a4 | 1.8 | 1999 | 4 | auto(l5) | f | 18 | 29 | p | compact |
| audi | a4 | 1.8 | 1999 | 4 | manual(m5) | f | 21 | 29 | p | compact |
| audi | a4 | 2.0 | 2008 | 4 | manual(m6) | f | 20 | 31 | p | compact |
| audi | a4 | 2.0 | 2008 | 4 | auto(av) | f | 21 | 30 | p | compact |
| audi | a4 | 2.8 | 1999 | 6 | auto(l5) | f | 16 | 26 | p | compact |
| audi | a4 | 2.8 | 1999 | 6 | manual(m5) | f | 18 | 26 | p | compact |