Comment calculer la moyenne d'une liste - Les statistiques et la fonction moyenne de Python expliquées en détail

Les mathématiques et la programmation vont de pair. Si vous êtes programmeur, vous devrez à un moment donné utiliser les mathématiques.

La science des données, l'apprentissage automatique, l'intelligence artificielle et les crypto-monnaies sont tous basés sur des principes mathématiques sous-jacents complexes.

Cependant, l'utilisation de fonctions mathématiques n'a pas à être complexe! Python résume tout, donc une fois que vous aurez compris les concepts, vous n'aurez pas besoin de comprendre tous les détails de l'implémentation.

Les mathématiques ne doivent pas être effrayantes

Vous rencontrerez de nombreuses fonctions mathématiques. Si vous travaillez avec des données ou des analyses, il est important que vous compreniez certains principes et fonctions mathématiques.

Une de ces fonctions que vous devez comprendre est la meanfonction.

Ne soyez pas rebuté par le nom - il n'y a rien de méchant (jeu de mots) à propos de la meanfonction en Python.

Cet article est autonome, mais je suppose que vous avez une certaine expérience de travail avec Python et que vous savez ce qu'est une liste Python. Sinon, consultez cet article avant de passer à autre chose.

Une fois que vous avez terminé, revenez et rejoignez-moi pour une plongée approfondie dans la meanfonction.

Statistiques

Vous voulez donc en savoir plus sur la meanfonction. C'est génial! Mais avant d'examiner cette fonction, il est important de se pencher sur la discipline dont elle provient: les statistiques.

Dans l'image ci-dessus, nous voyons un graphique. Un graphique est une représentation picturale qui montre la relation d'une variable par rapport à une autre.

Les graphiques sont utiles car ils nous permettent d'organiser les données afin que nous puissions voir rapidement les tendances et les relations entre les données. Un graphique n'est qu'un outil que nous pouvons utiliser pour visualiser et analyser des données.

La statistique est une branche des mathématiques qui nous permet d'avoir une manière systématique de classer, analyser et interpréter les données. C'est important parce qu'avec les statistiques, nous avons une collection d'outils prêts à l'emploi pour faire chacune de ces choses.

Imaginez si vous deviez réinventer une scie à chaque fois que vous deviez couper un morceau de bois. Beaucoup de gens appelleraient les scies par des noms différents, même s'ils font la même chose. Pour éviter ce problème, nous avons donné à la scie un nom par lequel tout le monde peut s'y référer.

La même chose se produit dans les statistiques - nous avons des outils bien connus que tout le monde connaît. Un de ces outils est la moyenne.

Mode, médiane et moyenne

Bien que la moyenne soit parfaitement capable de fonctionner seule, elle est généralement enseignée dans le cadre d'un trio, qui comprend le mode, la médiane et la moyenne.

Regardons un groupe de chiffres pour que vous compreniez ce qui se passe ici. Imaginez que vous ayez les chiffres ci-dessous:

1, 2, 3, 3, 4, 6, 9

Disons que nous voulions exprimer quel nombre se produit le plus souvent. Ce serait 3, et le nom que nous donnons à cette propriété est mode. Le mode est le nombre qui est le plus fréquent dans un ensemble que nous examinons.

Le nombre au milieu d'un ensemble ordonné est appelé la médiane. Pour trouver la médiane d'un ensemble numérique, arrangez les nombres du plus petit au plus grand, puis regardez le nombre au milieu. L'ensemble des nombres ci-dessus est déjà organisé du plus petit au plus grand, donc le nombre médian est également 3.

Enfin, la moyenne est une autre façon de se référer à la moyenne de l'ensemble. Pour trouver la moyenne, additionnez simplement tous les nombres ensemble et divisez-le par le nombre total d'éléments dans l'ensemble. Dans le cas des nombres ci-dessus, si nous les additionnons tous ensemble, nous obtenons 28. Le nombre total d'éléments dans l'ensemble est de 7, donc notre moyenne est de 4.

Pourquoi avons-nous besoin du moyen?

Donc, à ce stade, vous vous demandez peut-être pourquoi nous devrions de toute façon trouver la moyenne d'un nombre.

Le fait est que même les statistiques elles-mêmes sont subdivisées en plusieurs groupes. Tout comme vous avez des outils qui sont utilisés pour travailler le bois et d'autres pour travailler avec le métal, certains outils des statistiques sont regroupés en classes car ils sont utilisés dans un but similaire.

Un de ces groupes dans les statistiques est appelé statistiques récapitulatives. Les statistiques servent notamment à décrire des données, et les statistiques récapitulatives sont un ensemble d'outils utilisés à cette fin. L'un des éléments de cette classe d'outils est la moyenne.

La moyenne est importante car elle nous aide à analyser ce que l'on appelle une distribution. En statistique, une distribution est une méthode que nous utilisons pour examiner une variable sur laquelle nous voulons des informations. En utilisant une distribution, nous examinerons les valeurs de cette variable et la fréquence à laquelle elle se produit.

Si nous collectons des données, un type commun de distribution que nous voyons est la distribution normale qui prend la forme de la courbe en cloche:

C'est-à-dire que la variable aura une valeur commune vers laquelle elle tend, ainsi qu'un point de départ et un point final.

Ce que cela signifie, c'est que cela nous permet de prendre une distribution comme celle-ci et de regarder la tendance centrale de la variable, qui est le point auquel les valeurs de la variable ont tendance à se regrouper.

On peut donc dire que la moyenne décrit la tendance centrale de la distribution.

Calcul de la moyenne en Python

Nous pouvons calculer manuellement la moyenne si nous avons un petit ensemble de données numériques, nous avons quelques valeurs avec lesquelles travailler. Cependant, lorsque nous avons des centaines ou des milliers de valeurs dans un ensemble de données, il devient impossible de le calculer à la main.

Puisque Python est un langage "batteries incluses", la façon dont nous pouvons le faire est d'utiliser la meanfonction du module de statistiques dans Python.

Utilisons la meanfonction pour calculer la moyenne de l'ensemble de données numériques que nous avions précédemment dans l'article:

 # 1. import the statistics module import statistics # 2. list containing our numerical data set numerical_data_set = [1, 2, 3, 3, 4, 6, 9] # 3. calculate the mean calc_mean = statistics.mean(numerical_data_set) # 4. print our calculated mean print("Mean is: ", calc_mean) 

Our code consists of a 4 step sequence that we can use to calculate the mean:

  1. We import the statistics module that contains our mean function
  2. We create a Python list containing the numerical data set of which we would like to calculate the mean
  3. We calculate the mean and store the result in a variable, calc_mean
  4. We output our calculated mean so that we can get visual feedback

When we run the code, we will get the following output:

The program outputs the same value as our manual calculations. When we are working with large data sets, this function will be able to scale to handle whatever we can throw at it.

Wrapping Up

In this post we looked at the mean function in Python. We began by discussing statistics as a whole, then took a deep dive into mean.

Now that you have a solid understanding of statistics and the mean function in Python, you can use it in your own programs.

If you liked this article, then you may also be curious about learning about data structures and algorithms. If you want a simple, clear, step by step guide to learning about data structures and algorithms without having to write a single line of code, then you can check out the book Codeless Data Structures and Algorithms.

Read the book here:

Structures de données et algorithmes sans code - Apprenez DSA sans écrire une seule ligne de code | Armstrong Subero | Apress Ce livre vous apporte une nouvelle perspective sur les algorithmes et les structures de données, entièrement sans code. Découvrez les algorithmes de structure de données (DSA) sans jamais avoir à ouvrir votre éditeur de code, utiliser un compilateur ou consulter un environnement de développement intégré (IDE) .... Armstrong Subero Menu de recherche Panier V Votre panier est actuellement vide. Connexion Compte Connexion à la bibliothèque Accès Apress