Un t-test és un test estadístic utilitzat per determinar si hi ha una diferència significativa entre les mitjanes de dos conjunts de dades o entre una mitjana de dades i un valor de referència conegut. Es basa en la distribució t de Student, que s’utilitza per a mostres petites i quan la desviació estàndard de la població no és coneguda.
Quan s’utilitza un t-test?
Un t-test s’utilitza en situacions com:
- Comparar la mitjana d’una mostra amb una mitjana esperada o teòrica (t-test d’una mostra).
- Comparar la mitjana de dues mostres independents per veure si són estadísticament diferents (t-test de dues mostres independents).
- Comparar mitjanes de mesures aparellades, com abans i després d’un tractament en els mateixos subjectes (t-test aparellat).
Tipus de t-tests
Hi ha diversos tipus de t-tests, segons la hipòtesi i el disseny de les dades:
1. T-test d’una mostra (One-Sample T-Test):
- Comprova si la mitjana d’una mostra és significativament diferent d’un valor conegut o teòric.
- Exemple: Determinar si la mitjana de puntuació d’una classe és diferent de 50.
2. T-test de dues mostres independents (Independent Samples T-Test):
- Comprova si les mitjanes de dues mostres independents són significativament diferents.
- Exemple: Comparar les puntuacions mitjanes d’estudiants de dues escoles diferents.
3. T-test aparellat (Paired Samples T-Test):
- Comprova si hi ha una diferència significativa entre dues mesures preses en els mateixos subjectes o entitats.
- Exemple: Mesurar el rendiment d’un grup abans i després d’un entrenament.
Hipòtesis en un t-test
El t-test compara dues hipòtesis:
- Hipòtesi nul·la (H₀):
- Assumeix que no hi ha diferència significativa entre les mitjanes.
- Exemple: Les mitjanes de les dues mostres són iguals.
- Hipòtesi alternativa (H₁):
- Assumeix que hi ha una diferència significativa entre les mitjanes.
- Exemple: Les mitjanes de les dues mostres són diferents.
Formula del t-test
El valor de t es calcula com: , on:
- són les mitjanes de les dues mostres
- SE és l’error estàndar combinat: , on:
- són les variances de les mostres.
- són les grandàries de les mostres.
Interpretació del resultat
1. Valor de t:
- Un valor t gran (positiu o negatiu) indica que és menys probable que la diferència entre les mostres sigui deguda a l’atzar.
2. p-value (valor p):
- Si p-value < nivell de significança (normalment 0.05), rebutgem la hipòtesi nul·la.
- Això indica que hi ha una diferència estadísticament significativa entre les mitjanes.
Exemple amb Python
Aquí tens un exemple utilitzant scipy.stats.ttest_ind per un t-test de dues mostres independents:
python
from scipy.stats import ttest_ind
# Dades de dues mostres
group1 = [5.1, 5.5, 6.2, 5.9, 5.8]
group2 = [6.8, 7.0, 7.1, 6.9, 7.2]
# T-test
t_stat, p_value = ttest_ind(group1, group2)
print(f”T-statistic: {t_stat}”)
print(f”P-value: {p_value}”)
# Interpretació
if p_value < 0.05:
print(“Hi ha una diferència significativa entre les mostres.”)
else: print(“No hi ha una diferència significativa entre les mostres.”)
Quan no utilitzar un t-test?
- Si les dades no segueixen una distribució normal (es recomana una prova no paramètrica com Mann-Whitney U).
- Si les variàncies no són iguals entre les mostres (utilitza un t-test ajustat per a variàncies desiguals).
Conclusió
Un t-test és una eina estadística fonamental per comparar mitjanes i determinar si les diferències entre grups són estadísticament significatives. És una eina clau en estadística inferencial i s’utilitza àmpliament en camps com la investigació científica, la psicologia i el machine learning.
« Back to Glossary Index