Installer MLflow
Spark est une plateforme open-source de traitement de données volumineuses. Au fil des années, Spark s'est imposé comme l'outil de référence pour l'ingénierie de données. Dans ce guide ultime, je vous présente PySpark, l'API Python de Spark.
Installer Anaconda
Je vous recommande d'utiliser Scikit-learn avec Anaconda. Si vous n'avez pas encore Anaconda installé, suiviez ce tutoirel pour l'installer Installer Anaconda.
Créer un environnement virtuel
Scikit-learn est installé par défaut dans l'environnement de base. Toutefois je vous recommande fortement de créer un environnement virtuel afin de préserver cet environnement de base. Lancez Anaconda Prompt et faites la commande suivante:
Cette commande va créer une environnement virtuel avec le nom ml, tapez y pour confirmer la création.Activer l'environnement virtuel
Une fois l'environnement virtuel créé, il faut l'activer avec la commande suivante.
Installer MLflow
MLflow peut-être installé depuis le gestionnaire de packages Pypi avec la commande suivante.
Démarrer MLflow Server
Importer MLflow
Scikit-learn est importé sous le nom mlflow
Vérifier la version
Une console s'ouvre comme ci-dessous
Le code source de Scikit-learn est disponible sur MLflow @mlflow/mlflow.
Déployer avec Docker
.