Types de données dans les statistiques - Types de données nominales, ordinales, d'intervalle et de rapport expliqués avec des exemples

Si vous étudiez pour un examen de statistiques et que vous avez besoin de revoir vos types de données, cet article vous donnera un bref aperçu avec quelques exemples simples.

Car avouons-le: peu de gens étudient les types de données pour le plaisir ou dans leur vraie vie quotidienne.

Alors plongeons-nous.

Données quantitatives vs qualitatives - quelle est la différence?

En bref: quantitatif signifie que vous pouvez le compter et c'est numérique (pensez à la quantité - quelque chose que vous pouvez compter). Qualitatif signifie que vous ne pouvez pas, et ce n'est pas numérique (pensez à la qualité - données catégoriques à la place).

Boom! Simple, non?

Il y a une autre distinction que nous devrions clarifier avant de passer aux types de données réels, et elle a à voir avec les données quantitatives (nombres): données discrètes ou continues.

Les données discrètes impliquent des nombres entiers (entiers - comme 1, 356 ou 9) qui ne peuvent pas être divisés en fonction de la nature de ce qu'ils sont.

Comme le nombre de personnes dans une classe, le nombre de doigts sur vos mains ou le nombre d'enfants que quelqu'un a. Vous ne pouvez pas avoir 1,9 enfant dans une famille (malgré ce que le recensement pourrait dire).

Les données continues , en revanche, sont le contraire. Il peut être divisé autant que vous le souhaitez et mesuré en plusieurs décimales.

Comme le poids d'une voiture (peut être calculé avec plusieurs décimales), la température (32,543 degrés, etc.) ou la vitesse d'un avion.

Maintenant pour les trucs amusants.

Types de données qualitatives

Données nominales

Les données nominales sont utilisées pour étiqueter les variables sans aucune valeur quantitative. Les exemples courants incluent les hommes / femmes (quoique quelque peu dépassés), la couleur des cheveux, les nationalités, les noms de personnes, etc.

En clair: ce sont essentiellement des étiquettes (et nominal vient de «nom» pour vous aider à vous en souvenir). Vous avez les cheveux bruns (ou les yeux bruns) . Vous êtes américain . Votre nom est Jane .

Exemples:

De quelle couleur sont tes cheveux?

  • marron
  • Blond
  • Noir
  • Licorne arc-en-ciel

Quelle est ta nationalité?

  • américain
  • allemand
  • Kenyan
  • Japonais

Notez que ces variables ne se chevauchent pas. Pour les besoins des statistiques, de toute façon, vous ne pouvez pas avoir à la fois les cheveux bruns et arc-en-ciel de couleur licorne. Et ils ne sont vraiment liés que par la catégorie principale dont ils font partie.

Données ordinales

La clé avec les données ordinales est de se rappeler que l'ordinal sonne comme l'ordre - et c'est l'ordre des variables qui compte. Pas tellement les différences entre ces valeurs.

Les échelles ordinales sont souvent utilisées pour mesurer la satisfaction, le bonheur, etc. Avez-vous déjà participé à l'un de ces sondages, comme celui-ci?

"Quelle est la probabilité que vous recommandiez nos services à vos amis?"

  • Très probable
  • Probable
  • Neutre
  • Peu probable
  • Très improbable

Vous voyez, nous ne savons pas vraiment quelle est la différence entre très improbable et improbable - ou si c'est le même degré de probabilité (ou non) qu'entre probable et très probable. Mais ça va. Nous savons simplement que probable est plus que neutre et peu probable est plus que très peu probable. Tout est dans l'ordre.

Types de données quantitatives

Données d'intervalle

Les données d'intervalle sont amusantes (et utiles) car elles concernent à la fois l'ordre et la différence entre vos variables. Cela vous permet de mesurer l'écart type et la tendance centrale.

L'exemple préféré de tous les données d'intervalle est la température en degrés Celsius. 20 degrés C est plus chaud que 10 et la différence entre 20 degrés et 10 degrés est de 10 degrés. La différence entre 10 et 0 est également de 10 degrés.

Si vous avez besoin d'aide pour vous rappeler ce que sont les échelles d'intervalle, pensez simplement à la signification de l'intervalle: l'espace entre les deux . Ainsi, non seulement vous vous souciez de l'ordre des variables, mais également des valeurs entre elles.

Il y a cependant un petit problème avec les intervalles: il n'y a pas de «vrai zéro». Un vrai zéro n'a aucune valeur - il n'y a rien de tout cela - mais 0 degré C a définitivement une valeur: il fait assez froid. Vous pouvez également avoir des nombres négatifs.

Si vous n'avez pas de vrai zéro, vous ne pouvez pas calculer les ratios. Cela signifie un travail d'addition et de soustraction, mais pas la division et la multiplication.

Données de rapport

Dieu merci, il y a des données de ratio. Cela résout tous nos problèmes.

Les données de rapport nous renseignent sur l'ordre des variables, les différences entre elles, et elles ont ce zéro absolu. Ce qui permet d'effectuer et de dessiner toutes sortes de calculs et d'inférences.

Les données de rapport sont des données d'intervalle très similaires, sauf que zéro signifie aucune. Pour les données de ratio, il n'est pas possible d'avoir des valeurs négatives.

Par exemple, la hauteur correspond aux données de rapport. Il n'est pas possible d'avoir une hauteur négative. Si la hauteur d'un objet est égale à zéro, alors il n'y a pas d'objet. C'est différent de quelque chose comme la température. Les deux degrés 0 et -5 degrés sont des températures complètement valides et significatives.

Maintenant que vous avez une poignée de base sur ces types de données, vous devriez être un peu plus prêt à vous attaquer à cet examen de statistiques.