T-Test

« Back to Glossary Index

Un t-test és un test estadístic utilitzat per determinar si hi ha una diferència significativa entre les mitjanes de dos conjunts de dades o entre una mitjana de dades i un valor de referència conegut. Es basa en la distribució t de Student, que s’utilitza per a mostres petites i quan la desviació estàndard de la població no és coneguda.

Quan s’utilitza un t-test?

Un t-test s’utilitza en situacions com:

  1. Comparar la mitjana d’una mostra amb una mitjana esperada o teòrica (t-test d’una mostra).
  2. Comparar la mitjana de dues mostres independents per veure si són estadísticament diferents (t-test de dues mostres independents).
  3. Comparar mitjanes de mesures aparellades, com abans i després d’un tractament en els mateixos subjectes (t-test aparellat).

Tipus de t-tests

Hi ha diversos tipus de t-tests, segons la hipòtesi i el disseny de les dades:

1. T-test d’una mostra (One-Sample T-Test):

  • Comprova si la mitjana d’una mostra és significativament diferent d’un valor conegut o teòric.
  • Exemple: Determinar si la mitjana de puntuació d’una classe és diferent de 50.

2. T-test de dues mostres independents (Independent Samples T-Test):

  • Comprova si les mitjanes de dues mostres independents són significativament diferents.
  • Exemple: Comparar les puntuacions mitjanes d’estudiants de dues escoles diferents.

3. T-test aparellat (Paired Samples T-Test):

  • Comprova si hi ha una diferència significativa entre dues mesures preses en els mateixos subjectes o entitats.
  • Exemple: Mesurar el rendiment d’un grup abans i després d’un entrenament.

Hipòtesis en un t-test

El t-test compara dues hipòtesis:

  1. Hipòtesi nul·la (H₀):
    • Assumeix que no hi ha diferència significativa entre les mitjanes.
    • Exemple: Les mitjanes de les dues mostres són iguals.
  2. Hipòtesi alternativa (H₁):
  1. Assumeix que hi ha una diferència significativa entre les mitjanes.
  2. Exemple: Les mitjanes de les dues mostres són diferents.

Formula del t-test

El valor de t es calcula com:   , on: 

  •   són les mitjanes de les dues mostres
  • SE és l’error estàndar combinat:    , on:
  •   són les variances de les mostres. 
  •   són les grandàries de les mostres. 

Interpretació del resultat

1. Valor de t:

  • Un valor t gran (positiu o negatiu) indica que és menys probable que la diferència entre les mostres sigui deguda a l’atzar.

2. p-value (valor p):

  • Si p-value < nivell de significança (normalment 0.05), rebutgem la hipòtesi nul·la.
  • Això indica que hi ha una diferència estadísticament significativa entre les mitjanes.

Exemple amb Python

Aquí tens un exemple utilitzant scipy.stats.ttest_ind per un t-test de dues mostres independents:

python

Quan no utilitzar un t-test?

  • Si les dades no segueixen una distribució normal (es recomana una prova no paramètrica com Mann-Whitney U).
  • Si les variàncies no són iguals entre les mostres (utilitza un t-test ajustat per a variàncies desiguals).

Conclusió

Un t-test és una eina estadística fonamental per comparar mitjanes i determinar si les diferències entre grups són estadísticament significatives. És una eina clau en estadística inferencial i s’utilitza àmpliament en camps com la investigació científica, la psicologia i el machine learning.

« Back to Glossary Index