Challenge Dados - Alura 3ª edição

ML APP - Classificação de churn

🪧 Vitrine.Dev
✨ Nome	ML APP - Classificação de churn
🏷️ Tecnologias	python
🚀 URL	https://novexus-simulador-churn.streamlit.app/
🔥 Desafio

Contexto

Este projeto representa o resultado final do "Challenge Dados - Alura 3ª edição", realizado em setembro de 2023, um desafio simulado projetado para aprimorar as habilidades em Ciência de Dados. O desafio abrangeu a exploração, tratamento e modelagem de dados com o propósito de descobrir insights valiosos. Além disso, o foco estava na otimização do modelo e na sua disponibilização para alcançar os melhores resultados na tomada de decisões estratégicas da Novexus. Como parte do projeto, também foi desenvolvido um aplicativo web que simplifica a classificação de potenciais clientes, tornando todo o processo mais eficaz.

O cenário desse desafio envolveu a contratação de um cientista de dados pela Novexus com o objetivo primordial de reduzir a Taxa de Evasão de Clientes, também conhecida como Churn Rate.

Semana 1 - Limpeza e análise exploratória dos dados ✅

Foram realizadas as transformações iniciais e análise exploratória dos dados.

Conclusão EDA: Em síntese, a análise dos diversos atributos revela nuances importantes relacionadas ao churn. Enquanto alguns fatores, como gênero, têm pouca influência na probabilidade de churn, outros, como idade, tipo de contrato e presença de serviços específicos, demonstram impactos significativos. A duração do contrato surge como um elemento crucial, com contratos de curto prazo exibindo maior probabilidade de churn, porém mesmo contratos mais longos não estão imunes a esse fenômeno. Compreender essas relações permite a empresa aprimorar suas estratégias de retenção, personalizando abordagens para minimizar o churn e otimizar a satisfação do cliente.

Amostra de gráficos realizados:

Semana 2 - Construindo e otimizando modelos de machine learning ✅

Na segunda semana, o projeto focou na modelagem e otimização para prever o churn com precisão. Inicialmente, os dados desbalanceados foram tratados com a técnica SMOTE do Imbalanced Learning. Diversos modelos baseados em bagging e boosting foram testados:

Modelos sem normalização dos dados:

RandomForestClassifier
ExtraTreesClassifier

Modelos com normalização dos dados:

KNeighborsClassifier e BaggingClassifier (embora o Bagging seja usado como técnica de ensemble e não exija normalização, o KNeighborsClassifier requer normalização)
AdaBoostClassifier
HistGradientBoostingClassifier, incluindo RandomForest, ExtraTrees, KNeighbors, Bagging, AdaBoost e Hist Gradient Boosting.

Os três melhores modelos escolhidos para otimização foram:

RandomForest
AdaBoost
Hist Gradient Boosting

Dos modelos testados, o Hist Gradient Boosting Classifier se destacou como o mais promissor, demonstrando melhor desempenho em métricas críticas, como AUC e recall. O recall é fundamental em modelos de previsão de churn, pois ajuda a identificar eficazmente os clientes em risco de deixar o serviço, minimizando perdas de receita.

Além disso, um benefício adicional foi observado: este modelo demonstrou um tempo de treinamento mais rápido em comparação com outras opções, tornando-o uma escolha eficiente em termos de tempo de treinamento.

Semana 3 e 4 - Deploy do modelo de machine learning e portfólio ✅

Durante a terceira semana, foi concluído o processo de implantação do modelo desenvolvido. Utilizando a plataforma Streamlit, foi criada uma interface intuitiva. Essa interface foi projetada para permitir que um colaborador da Novexus preencha um formulário, tornando mais fácil verificar a probabilidade de um cliente estar propenso ao churn.

Name		Name	Last commit message	Last commit date
Latest commit History 37 Commits
.streamlit		.streamlit
data		data
docs		docs
models		models
notebooks		notebooks
reports		reports
src		src
venv		venv
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt
setup.py		setup.py
test_environment.py		test_environment.py
tox.ini		tox.ini

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Challenge Dados - Alura 3ª edição

ML APP - Classificação de churn

Contexto

Semana 1 - Limpeza e análise exploratória dos dados ✅

Semana 2 - Construindo e otimizando modelos de machine learning ✅

Semana 3 e 4 - Deploy do modelo de machine learning e portfólio ✅

About

Releases

Packages

Languages

License

FranciscoFoz/challenge-dados-alura-3-edicao

Folders and files

Latest commit

History

Repository files navigation

Challenge Dados - Alura 3ª edição

ML APP - Classificação de churn

Contexto

Semana 1 - Limpeza e análise exploratória dos dados ✅

Semana 2 - Construindo e otimizando modelos de machine learning ✅

Semana 3 e 4 - Deploy do modelo de machine learning e portfólio ✅

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages