Informações gerais sobre o curso
Nesta curso, o PET Estatística apresenta o conteúdo de Raspagem de Dados (Web scraping) e Construção de Mapas com R. O curso será dividido em duas aulas.
Aula 1: Raspagem de Dados
Na primeira aula, introduziremos o conceito de raspagem de dados e apresentaremos a biblioteca rvest
do R. A raspagem de dados é uma técnica utilizada para extrair informações de sites da internet. A biblioteca rvest
é uma ferramenta poderosa para realizar essa tarefa. Também, como ferramenta eseencial para a raspagem de dados, apresentaremos os conceitos introdutórios de HTML e de expressões regulares.
Para esta aula, rasparemos os dados de dois sites: um site sobre filmes e um site que apresenta dados sobre a alfabetização no Brasil. Os links para cada um desses sites estão disponíveis abaixo:
O código em R da primeira aula está aqui: Código da Aula 1
Aula 2: Construção de Mapas
Na segunda aula, apresentaremos os elementos necessários para construir mapas com o R. Utilizaremos os conceitos da primeira aula para obter dados e representar estes dados em mapas. Para esta aula, utilizaremos, por exemplo, os dados de queimadas registradas em 2024 por estado no Brasil. O mapa gerado com esses dados está disponível no início desta página.
No início da aula, ensinaremos os fundamentos do pacote ggplot2
. Esta biblioteca poderosa nos permite criar gráficos muito bonitos. Os dados que utilizaremos estão disponíveis nos seguintes links:
Bibliografia
Recomendamos a leitura dos seguintes materiais para aprofundar o conhecimento sobre os temas abordados no curso: