Plan du cours

  1. Prétraitement des données

    1. Data Cleaning
    2. Intégration et transformation des données
    3. Réduction des données
    4. Discrétisation et génération de hiérarchie de concepts
  2. Inférence statistique

    1. Distributions de probabilités, variables aléatoires, théorème de la limite centrale
    2. Échantillonnage
    3. Intervalles de confiance
    4. Inférence statistique
    5. Tests d'hypothèse
  3. Régression linéaire multivariée

    1. Spécification
    2. Sélection de sous-ensembles
    3. Estimation
    4. Validation
    5. Prédiction
  4. Méthodes de classification

    1. Régression logistique
    2. Analyse discriminante linéaire
    3. K-voisins les plus proches
    4. Bayes naïves
    5. Comparaison des méthodes de classification
  5. Neural Networks

    1. Ajustement des réseaux neuronaux
    2. Questions relatives à la formation des réseaux neuronaux
  6. Arbres de décision

    1. Arbres de régression
    2. Arbres de classification
    3. Arbres par rapport aux modèles linéaires
  7. Bagging, Random Forests, Boosting

    1. Bagging (ensachage)
    2. Random Forests
    3. Boosting
  8. Machines à vecteurs de support et disct flexible

    1. Classificateur à marge maximale
    2. Classificateurs à vecteur de support
    3. Machines à vecteurs de support
    4. SVM à 2 classes et plus
    5. Relation avec la régression logistique
  9. Analyse en composantes principales

  10. Regroupement

    1. Regroupement par K-moyens
    2. Regroupement par K-médoïdes
    3. Regroupement hiérarchique
    4. Regroupement basé sur la densité
  11. Évaluation et sélection des modèles

    1. Biais, variance et complexité du modèle
    2. Erreur de prédiction en cours d'échantillon
    3. L'approche bayésienne
    4. Validation croisée
    5. Méthodes Bootstrap
 28 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (5)

Cours à venir

Catégories Similaires