Bem-vindo ao repositório do Case de Análise de Dados de marketing, desenvolvido para a Atlas Technologies. Este projeto simula um contexto real de análise de dados em uma plataforma B2C, com foco em entender o comportamento dos anunciantes, métricas de engajamento e avaliar uma promoção histórica usando SQL para extração/transformação e Python (Seaborn) para visualização.
data-analyst-test-01-martech/
├── README.md # Documentação completa do projeto
├── requirements.txt # Bibliotecas necessárias
├── data/ # Dados brutos (CSV originais Zipados)
│ └──datasets.7z
│ ├── users.csv # Informações de usuários/anunciantes
│ └── user_transactions.csv # Histórico de transações
├── sql/ # Scripts SQL organizados por etapa analítica
│ ├── 01_user_status.sql # Cálculo de status de usuário (ativos, banidos)
│ ├── 02_daily_sales.sql # Vendas diárias e sazonalidade
│ ├── 03_sales_by_weekday.sql # Vendas por dia da semana
│ ├── 04_spend_per_user.sql # Usuários pagantes e ARPU
│ ├── 05_monthly_revenue.sql # Receita por mês
│ ├── 06_promotion_period.sql # Identificação do período promocional
│ ├── 07_promotion_impact.sql # Impacto da promoção em receita e transações
│ ├── 08_discount_simulation.sql # Simulação de receita líquida para níveis de desconto
│ ├── clean_user_transactions.sql # Limpeza do dataset de transações
│ └── clean_users.sql # Limpeza do dataset de usuários
├── scripts/ # Scripts auxiliares em Python
│ └── promo_simulation.py # Simulação Monte Carlo de desconto ideal
└── analysis.ipynb # Jupyter Notebook principal com Carga de dados, consultas SQL e plots Seaborn
Uma das plataformas B2C da Atlas Technonologies conecta anunciantes a clientes, oferecendo planos pagos que aumentam a visibilidade dos anúncios. Cada plano (3, 7 ou 30 dias) adiciona pontos de listagem: mais pontos, maior ranqueamento. Usuários também podem usar a plataforma gratuitamente.
Storytelling começa apresentando o cenário de negócio:
- Por que a análise importa? Entender a base ativa vs. banida revela saúde da plataforma. Mensurar compradores e ticket médio direta influencia receita e decisões de marketing.
- Picos e sazonalidade: reconhecer padrões de compra (datas específicas) permite planejar promoções e alocação de recursos.
- Promoção histórica de 85%: avaliar custo-benefício de descontos profundos para primeiras compras e projetar estratégias de descontos futuros.
Ao longo do notebook (analysis.ipynb), cada seção começa com uma pergunta de negócio, segue com a query SQL correspondente, exibe tabela/resultados e ilustra insights com gráficos Seaborn, culminando em recomendações claras.
- Taxas de Status: Proporção de usuários ativos, onboarding, desabilitados e deletados.
- Padrão de Compras: Volume e receita diária, sazonalidade.
- Usuários Pagantes & ARPU: Contagem de pagantes e valor médio por usuário.
- Faturamento Mensal: Tendência de receita ao longo de meses.
- Identificação do Período: Baseado em
discount_percent ≥ 85%. - Impacto: Mudanças em receita e número de transações pré, durante e pós-promocional.
- ROI: Cálculo de receita efetiva vs. projeção sem desconto.
- Desconto Ideal: Simulações de receita líquida para diferentes níveis de desconto.
-
Carga e inspeção inicial
- Unzip do Dataset
- Importar CSVs em pandas.
- Explorar colunas e tipos de dados.
-
Transformação com SQL
- Utilizar
pandasqlou conexão a BD para executar scripts emsql/. - Limpar dados de duplicatas e fazer análise de NULLs
- Criar views para cada CTE e importar resultados ao notebook.
- Utilizar
-
Visualização com Seaborn
- Plotar gráficos de barras e linhas.
- Anotar insights diretamente nos plots.
-
Simulações e recomendações
- Rodar simulações de desconto no script Python.
- Discutir trade-offs preço × volume.
-
Storytelling no Notebook
- Cada seção inicia com pergunta, segue com SQL, mostra pandas dataframe e Seaborn plot, e finaliza com interpretação e recomendação.
users.csv e user_transactions.csv conforme descrito no README.md anterior. Mantém mesmo dicionário de colunas.
- analysis.ipynb: Notebook completo com narrativa, queries e viz.
- scripts/promo_simulation.py: Simulação Monte Carlo para avaliação de níveis de desconto.
-
Clone o repositório:
git clone https://github.com/sophia-katze/data-analyst-test-01-martech cd data-analyst-test-01-martech -
Instale dependências:
pip install -r requirements.txt
-
Abra o Jupyter Notebook via prompt:
jupyter notebook analysis.ipynb
-
Execute células sequencialmente: as queries SQL rodarão contra um banco SQLite em memória, e os plots Seaborn serão gerados inline.
Para dúvidas, abra uma issue ou contate Sophia Katze: sophia.helena.paula@gmail.com