CopertinaAnnamaria

Yüklə 21,24 Mb.

səhifə	51/89
tarix	11.09.2023
ölçüsü	21,24 Mb.
	#121652

1 ... 47 48 49 50 51 52 53 54 ... 89

ITALYAN DESSERTATSIYA. WORDdocx

5.1 - Regressione logistica

CAPITOLO 5

REGRESSIONE LOGISTICA

Al termine del capitolo, il lettore sarà in grado di:
· descrivere le procedure alla base della regressione logistica;
· spiegare gli indicatori descrittivi dei modelli di regressione logistica;
· elencare esempi della ricerca educativa nei quali è stata utilizzata la regressione logistica.

5.1 - Regressione logistica

Anche in questo capitolo come nel precedente, parliamo di una forma di regressione destinata alla de#nizione di un modello nella quale studiamo una funzione, de#nita “logistica” appunto, che mette in relazione le variabili dipendenti y e indipendenti x_i e calcoliamo i coef#cienti b_i corrispondenti ad ogni variabile indipendente x_i. Differentemente dalla regressione lineare, nella regressione logistica la variabile dipendente y è una variabile dicotomica che, come ben sappiamo, può assumere solamente due valori: sì/no; uomo/donna; a rischio/non a rischio; ef#cace/non ef#cace, esame superato/non superato. Per via di questa caratteristica, le procedure di analisi della tecnica portano anche a classi#care e raggruppare le osservazioni del campione o della popolazione osservata in due gruppi corrispondenti alle due modalità assunte dalla y .
Qualora volessimo veri#care la relazione che esiste fra i risultati conseguiti nello svolgimento di alcune prove intermedie in un corso e l’esito #nale dello stesso, ad esempio, i due gruppi che potremo distinguere e classi#care sono quello degli studenti che superano l’esame e quello degli studenti che non lo passano.
Da un punto di vista gra#co, in un’analisi bivariata dove consideriamo una sola variabile indipendente (il voto di una delle prove intermedie), ci aspettiamo che le osservazioni si distribuiscano su due rette parallele corrispondenti ai due gruppi come nella Figura 5.1. Alle modalità assunte dalla variabile y sono attribuiti i valori 1 e 0. Solitamente il valore 1 è attribuito alla modalità che indica il successo o il manifestarsi di un evento (nel nostro esempio, superamento dell’esame) e il valore 0 l’insuccesso o l’assenza dell’evento (ancora nell’esempio, bocciatura).
Dallo scatterplot possiamo dedurre che chi ha conseguito un punteggio più basso in un’ipotetica prova intermedia si colloca nel gruppo che identi#chiamo con la modalità 0 e ha meno probabilità di superare l’esame #nale (punti in basso). Al contrario, gli studenti che hanno conseguito punteggi più alti saranno collocati nel gruppo contraddistinto dal numero 1 e in generale avranno più probabilità di successo (punti in alto).
Il superamento degli esami per le osservazioni comprese nella #gura fra i voti tra 23 e 25 assume talvolta il valore 1, altre lo 0. Si parla per queste unità di errori di classi#cazione (misclassications), in quanto non è immediato de#nire il gruppo al quale esse appartengono.

Figura 5.1 – Scatterplot delle variabili VOTI con range da 18 a 30 ed ESAME, variabile dicotomica dove 1 = promozione, 0 = bocciatura.
Quale curva interpola osservazioni così disposte? Osservando la Figura 5.2 possiamo escludere che la retta faccia al caso nostro, la funzione che cerchiamo non può essere lineare.
La curva che meglio interpola questi dati è la curva logistica che ha una caratteristica forma ad S e contiene i valori della y fra 0 e 1 senza mai superarli (Figura 5.3).

Yüklə 21,24 Mb.

Dostları ilə paylaş:

1 ... 47 48 49 50 51 52 53 54 ... 89