Skip to content

sophie-pyxis/data-scientist-test-01-geo

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Repositório contendo a resolução do teste proposto para o processo seletivo para Cientista de Dados na TerraQ em Jan/24 por Sophia Helena de Paula.

Instruções de instalação/configuração

Para começar, clone o repositório localmente:

git clone https://github.com/sophia-helena-paula/data-scientist-test-01-geo

Instale as dependências do projeto:

pip install -r requirements.txt

Lista de tarefas cumpridas

  • Faça um script que baixa o dataset de municípios do estado de Minas Gerais (usando este LINK, transforme-o em um GeoJSON na projeção EPSG:31983 e salve-o no diretório dados/ com o nome municipios-mg.geojson. Em seguida, neste mesmo script, adicione uma coluna a este vetor contendo a área de cada município em km² e salve o resultado no mesmo arquivo.
  • Procure uma fonte confiável na internet de dados de população e PIB dos municípios brasileiros e salve os dados de população e PIB dos municípios de Minas Gerais em um arquivo CSV com o nome dados/populacao-pib-municipios-mg.csv.
  • Utilize os dois arquivos de focos de desmatamento como base (dados/desmatamento_ago22.gpkg e dados/desmatamento_set_22.gpkg), junte-os em um único dataset, transforme-o em um GeoJSON na projeção EPSG:31983 e salve-o em dados/focos-desmatamento-mg.geojson.
  • No notebook 02_analise.ipynb, faça uma análise exploratória dos dados, respondendo às seguintes perguntas:
    • Qual a área total desmatada em hectares no estado de Minas Gerais em cada um dos meses de agosto e setembro de 2022?
    • Qual a área total desmatada em km² no estado de Minas Gerais em todo o período fornecido (ago/set de 2022) por bioma?
    • Qual a área total desmatada em km² no estado de Minas Gerais em cada um dos meses de agosto e setembro de 2022, por município?
  • No notebook 02_analise.ipynb faça uma análise de correlação entre as variáveis de população e PIB dos municípios de Minas Gerais e a área desmatada em hectares. Apresente os resultados da forma que achar mais adequada.
  • No notebook 03_visualizacao.ipynb faça 5 visualizações que possam ser úteis para o gestor público tomar decisões sobre onde alocar recursos para fiscalização, elencando os municípios/biomas que mais necessitam de atenção. As visualizações podem ser feitas com qualquer biblioteca de visualização de dados que você preferir (matplotlib, seaborn, plotly, bokeh, folium, etc) e podem ser estáticas ou interativas. Seja criativo e tente fazer visualizações que sejam claras, esteticamente agradáveis (PS: Pense que o gestor público não é um cientista de dados e que não tem conhecimento de programação ou de ciência de dados e vai apresentar os resultados que você plotar neste notebook para o governador do estado alocar mais recursos no combate ao desmatamento ilegal).

About

Git do teste para o cargo de Cientista de Dados da Terra Q

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors