Les packages Python pour la Data Science
Python est un outil puissant pour faire de la data science. Python est de loin le langauge de programmation le plus populaire dans le domaine. Avec ses nombreux packages tels que Pandas, Dask et PySpark
La communauté Python a développé plusieurs packages pour les sciences des données en général et l'analyse de données en particulier.
# | Package | Description | Tutoriel | Documentation |
---|---|---|---|---|
1 | Numpy | Description | Guide | Docs |
2 | Pandas | Description | Guide | Docs |
3 | Matplotlib | Description | Guide | Docs |
4 | Seaborn | Description | Guide | Docs |
5 | Bokeh | Description | Guide | Docs |
6 | Plotly | Description | Guide | Docs |
7 | Scipy | Description | Guide | Docs |
8 | Statsmodels | Description | Guide | Docs |
Python est de loin le langage qui propose le plus de packages pour la data science. Grâce à sa grande communauté très active. Voici quelques uns des plus populaires que je présenterai dans cette section:
Il existe encore bien d'autres packages tels que PyTorch, PyCaret, Mlxtend.