Sobre Mim

Meu nome é Caio Mendes, tenho 30 anos, sou formado em física e tenho doutorado na área de computação quântica, pela Universidade Federal de Alagoas.

Atualmente, trabalho na empresa Mesha Tecnologia, onde sou Analista de Dados. A mesha é uma empresa que terceiriza funcionários, atualmente estou alocado no SESI no estado de Alagoas. Tenho como função conectar diversas fontes de dados, principalmente em ambientes cloud e utilizando queries em SQL para obter dados e transforma-los em insights de negócio a partir do desenvolvimento de dashboards em Power BI. Gerar relatórios semanais com os principais resultados da empresa, se baseando nos dados e, utilizando de storytelling, passar os resultados para as equipes de outras áreas.

Anteriormente, trabalhei como programador em uma empresa de marketing digital. Trabalhei na criação e organização de banco de dados, sendo utilizado um banco não relacional (MongoDB). Além disso, fui responsável por geração de insights a partir de dados e criação de dashboards usando Power BI.

Estou buscando uma oportunidade de migração de carreira para trabalhar profissionalmente como Cientista de Dados, com o objetivo de melhorar a tomada de decisão da empresa através da construção de soluções usando dados.

Habilidades

Linguagens de Programação e Banco de Dados

  • Python com foco em análise de dados.
  • SQL para extração de dados
  • Banco de Dados SQLite, Postres, MySQL e MongoDB.

Estatística e Machine Learning

  • Estatística descritiva.
  • Algoritmos de Regressão, Classificação, Clusterização, Learn to Rank.
  • Técnicas de balanceamento dos dados, seleção de atributos e redução de dimensionalidade.
  • Métricas de performance dos algoritmos (RMSE, MAE, MAPE, Confusion Matrix, Precision, Recall, F1-Score)
  • Pacotes de Machine Learning: Sklearn e Scipy.

Visualização de Dados

  • Matplotlib, Seaborn e Plotly.
  • Power BI, Tableau e Data Studio.

Engenharia de Software

  • Git, Github, Gitlab e Virtual Environment.
  • Streamlit, Flask, Python API's.
  • Cloud Heroku.

Experiências Profissionais

3 Projetos completos de Ciência de Dados

Construção de soluções de dados para problemas de negócio, próximos aos desafios reais das empresas, utilizando dados públicos de competições de Ciência de Dados; abordei o problema desde a concepção do desafio de negócio até a publicação do algoritmo treinado em produção. Para isso, utilizei ferramentas de Cloud Computing.

2 meses como Analista de Dados

Conectar diversas fontes de dados, principalmente em ambientes cloud e utilizando queries em SQL para obter dados e transforma-los em insights de negócio a partir do desenvolvimento de dashboards em Power BI. Gerar relatórios semanais com os principais resultados da empresa, se baseando nos dados e, utilizando de storytelling, passar os resultados para as equipes de outras áreas.

1 ano e 4 meses como programador

Organizar o banco de dados utilizando um banco não relacional (MongoDB). Geração de Insights e criação de Dashboards no PowerBI a partir desses insights.

20+ Cursos Extra Curriculares

Diversos cursos voltados para área de ciência de dados:

  • Alura – Data Science: primeiros passos.
  • Alura – Python para Data Science: funções, Pacotes e Pandas Básico.
  • Alura – Python para Data Science: introdução a linguagem e Numpy.
  • Alura – Python Pandas: tratando e analisando dados.
  • Alura – Pandas: formatos diferentes de entrada e saída (IO)
  • Alura – Estatística com Python (parte 1): frequências e Medidas.
  • Alura – Estatística com Python (parte 2): probabilidade e Amostragem.
  • Alura – Machine Learning: introdução a classificação com SKLearn.
  • Alura – Machine Learning: lidando com dados de muitas dimensões.
  • Alura – Regressão Linear: testando Relações e Prevendo Resultados.
  • Alura – Machine Learning: validação de Modelos.
  • Alura – Machine Learning (parte 1): otimização de modelos através de hiperparâmetros.
  • Alura – Machine Learning (parte 2): otimização com exploração aleatória.
  • Alura – Machine Learning: introdução a sistemas de recomendação em Python.
  • Alura – Machine Learning: introdução a algoritmos não supervisionados.
  • Alura – Deep Learning (parte 1): introdução com Keras.
  • Alura – Deep Learning (parte 2): como a rede aprende.
  • Alura – PostgreSQL: primeiros passos com SQL.
  • Alura – MongoDB: uma alternativa aos bancos relacionais tradicionais.
  • Alura – Data Analytics: machine Learning no Marketing Digital.
  • DataCamp – Introduction to Airflow in Python.
  • ComunidadeDS – Curso prático de desenvolvimento de projetos em ciência de dados.

4 anos como aluno de doutorado em física

Publicação de artigos científicos na área de computação quântica e informação quântica.

Projetos em Ciência de Dados

Previção de vendas para as próximas seis semanas, usando o algoritmo de regressão XGboost

Eu usei Python, análise de dados e técnicas de Machine Learning para encontrar uma solução que prevesse os preços de cada loja nas próximas seis semanas. E o resultado dessa solução, caso fosse implementada, seria de mais de $ 200MM de dólares de receita.

As ferramentas utilizadas foram:

  • Git e Github.
  • Python, Pandas, Numpy, Matplotlib, Seaborn, Scipy, Boruta, Sklearn, XGBoost e Flask.
  • Jupyter Notebook.
  • Heroku Cloud.

Criação de um ranking com clientes com maior propensão de adquirir um seguro saúde.

Utilizando Python, análise de dados e técnicas de classificação, fui capaz de gerar um ranking, classificando clientes com maior propensão de aceitar um seguro saúde. O projeto tinha como intuito a redução de custos nas ligações para possíveis novos clientes.

As ferramentas utilizadas foram:

  • Git e Github.
  • Python, Pandas, Numpy, Matplotlib, Seaborn, Scipy, Sklearn, XGBoost, AdaBoost, Randon Forest.
  • Jupyter Notebook.

Criação de um dashboard para análise de dados dos alunos que realizaram a prova do ENEM 2020.

Utilizando o Power BI, foi possível construir um Dashboard para acompanhamento das notas e análises de dados referente aos alunos do ENEM 2020.

As ferramentas utilizadas foram:

  • Power BI

Clusterização de clientes de um e-commerce com o intuito de criar um programa de fidelidade com os melhores clientes.

Utilizando técnicas de Machine Learning e análise de dados, foi possível dividir os clientes de um e-commerce em grupos, de forma que se crie um grupo para o programa de fidelidade e a equipe de Marketing consiga acompanhar e gerar receitas de formas direcionadas para cada grupo.

As ferramentas utilizadas foram:

  • Python, Pandas, Numpy, Matplotlib, Sklearn, KMeans, Hierarchical Clustering, Gaussian Mixture Model, DBSCAN
  • Jupyter Notebook

Get in touch

Fique a vontade para entrar em contato.