Prise en main de Pandas - Le guide ultime
Pandas est une libraire Open Source sous licence BSD. Il s'agit d'une librairie de manipulaion et d'analyse de données en python. Elle est la plus populaire et intuitive et facile à prendre.
Installer Pandas
Si vous travaillez avec Anaconda, Pandas est déjà installé sinon Pandas est disponible sur le répertoire PyPi
Importer Pandas
Pandas n'est pas une librairie native en Python, il faut l'installer au préalable.
Si vous ne l'avez pas encore installée avez pas
Pour importer Pandas if suffit de faire ceci import pandas
mais il est plus courant de faire ceci import pandas as pd
Vous pouvez vérifier la version de Pandas
pandas.Series
Les limites trouvent leurs limites lorsqu'il s'agit de faire des analyses statistiques, il est certes possible d'avoir les minimum et maximun mais il n'est pas possible de connaitre la moyenne par exemple L'objet pandas.Series nous permet de nous affranchir de ces limites, il est donc possible de calculer les indicateurs statistiques sur les données à svaoir la moyenne, la variance entre autres.
names = ["Esso", "Lendjina", "Yemi", "Adboul", "Tracy", "Adjo", "Yacuba", "Degnon"]
countries = ["Togo", "Haïti", "Nigeria", "Burkina", "Ivory Cost", "Togo", "Niger", "Benin"]
sexes = ['M', 'F', 'M', 'M', 'F', 'F', 'F', 'F']
ages = [22, 18, 20,19, 31, 23, 26, 17]
heights = [1.73, 1.43, 1.52, 1.82, 1.45, 1.61, 1.90, 1.52]
Statistique descriptive
La statistique descriptive est une branche de la Statistique, elle
Nous pouvons calculer des indicateurs sur ces données, ce qui n'est pas possible avec les listes natives en python
pandas.DataFrame
Les limites trouvent leurs limites lorsqu'il s'agit de faire des analyses statistiques, il est certes possible d'avoir les minimum et maximun mais il n'est pas possible de connaitre la moyenne par exemple L'objet pandas.Series nous permet de nous affranchir de ces limites, il est donc possible de calculer les indicateurs statistiques sur les données à svaoir la moyenne, la variance entre autres.
Afficher les 4 premières lignes du tableau
Afficher les 4 dernières lignes du tableau
Afficher 4 lignes du tableau choisies au hazard
Importer des données
En général, les données sur lesquelles l'on souhaite travailler sont stockées dans un fichier externe, la libraire Pandas permet d'importer des données depuis un fichier externe. Plusieurs extensions de fichiers sont prises en charge par Pandas, à savoir .csv
le plus utilisé, .excel
, .pickle
Exporter des données
Visualisation
Références
Pour avoir plus de détails, merci de consulter la documentation officielle Numpy Docs