Aller au contenu

Les packages Python pour la Data Science

Python est un outil puissant pour faire de la data science. Python est de loin le langauge de programmation le plus populaire dans le domaine. Avec ses nombreux packages tels que Pandas, Dask et PySpark

La communauté Python a développé plusieurs packages pour les sciences des données en général et l'analyse de données en particulier.

# Package Description Tutoriel Documentation
1 Numpy Description Guide Docs
2 Pandas Description Guide Docs
3 Matplotlib Description Guide Docs
4 Seaborn Description Guide Docs
5 Bokeh Description Guide Docs
6 Plotly Description Guide Docs
7 Scipy Description Guide Docs
8 Statsmodels Description Guide Docs

Python est de loin le langage qui propose le plus de packages pour la data science. Grâce à sa grande communauté très active. Voici quelques uns des plus populaires que je présenterai dans cette section:


Il existe encore bien d'autres packages tels que PyTorch, PyCaret, Mlxtend.