Sobre mim

Formação Acadêmica

  • MBA: Data Science e Analytics - ESALQ/USP
  • Especialização: Inteligência Artificial - Escola Politécnica da USP (Em andamento)
  • Graduação: Geografia - Universidade de São Paulo (USP)

Atuo na convergência entre Ciência de Dados, Inteligência Artificial e Análise Espacial. Minha abordagem técnica não foca apenas em ferramentas, mas na arquitetura de soluções robustas para problemas complexos.

"Porque no xadrez do mundo moderno, entender o 'onde' é tão crucial quanto o 'o quê' e o 'por quê'."

Habilidades & Tech Stack

Convergência entre Rigor Estatístico, IA e Visão de Negócio.

Data Analysis Process
  • Generative AI & Deep Learning

    Transformers (BERT, GPT), RAG, Fine-tuning de LLMs, NLP & Visão Computacional.
    Stack: PyTorch, TensorFlow, Keras.

  • Data Science & Estatística

    Regressão, Séries Temporais, Clustering (K-Means, DBSCAN), Inferência Bayesiana.
    Stack: Scikit-learn, Statsmodels.

  • Inteligência Geoespacial (Spatial DS)

    Análise: Geoestatística (Moran’s I, GWR), Sensoriamento Remoto & Análise de Padrões Espaciais.
    Ferramentas: ArcGIS, QGIS, Geopandas, Shapely.

  • Engenharia de Dados

    ETL, Data Wrangling, Web Scraping, Deploy de Modelos.
    Stack: Python (Expert), SQL, Streamlit, Git.

Projetos em Destaque

Séries Temporais: Análise COVID-19 (SP)

Estudo estatístico utilizando dados da SEADE. Correlação entre óbitos, casos confirmados e índices de isolamento social no estado de São Paulo para avaliar a efetividade de políticas públicas.

Tech Stack:

Séries Temporais Estatística Matplotlib

Analytics de Delivery (Curry Company)

Solução completa de BI hospedada em Cloud. Monitoramento em tempo real de crescimento da empresa, eficiência logística de entregadores e qualidade dos restaurantes parceiros.

Tech Stack:

Streamlit Cloud Python Data Viz

Painel Gerencial: Fome Zero Marketplace

Dashboard interativo desenvolvido para acompanhar métricas de negócio de um marketplace de restaurantes. Visualização de KPIs estratégicos como distribuição geográfica, tipos de culinária e performance de entregas.

Tech Stack:

Python Streamlit Plotly ETL

Aprendizado de Máquina Não Supervisionado: Clustering

Este projeto foca em técnicas de Clustering aplicadas a negócios. Utilizamos tanto o K-means quanto o Método Hierárquico Aglomerativo (HAC) para resolver problemas reais de segmentação.

Teste 1: Análise de Cartão de Crédito (K-means)

Segmentação de clientes bancários baseada em limite, visitas ao banco e chamadas.

Teste 2: Análise de Varejo (K-means e HAC)

Comparação técnica entre algoritmos para entender comportamento de compra em loja varejista.

Teste 3: Índices de Países (HAC e K-means)

Agrupamento de países baseado em indicadores macroeconômicos (PIB, inflação, expectativa de vida).

Modelagem Avançada: Regressão Múltipla e Diagnóstico

Expansão da análise para cenários multivariados. Detecção e tratamento de Multicolinearidade (VIF), outliers e Leverage. Métricas de avaliação (R² Ajustado, RMSE, MAE) para garantir robustez e mitigar overfitting.

Tech Stack:

Python & Scikit-learn Statsmodels Pandas

Fundamentos de Modelagem: Regressão Linear Simples

Validação rigorosa dos pressupostos clássicos: linearidade, normalidade dos resíduos e homocedasticidade. O básico bem feito garante a inferência correta.

Tech Stack:

Python (NumPy, Pandas) Statsmodels Scipy

Ensaio de Machine Learning

Estudo sobre limiares de Overfitting e Underfitting. Ajuste fino de hiperparâmetros em algoritmos de Classificação (KNN, Random Forest), Regressão (Lasso, Ridge) e Clusterização.

Tech Stack:

Scikit-learn Random Forest Optimização

Detox dos Dados: Data Wrangling Avançado

Processo meticuloso para garantir a integridade analítica. Eliminação de ruídos, tratamento de dados faltantes e padronização.

Tech Stack:

Python Pandas Seaborn

Entre em Contato

Sinta-se à vontade para entrar em contato.