CopertinaAnnamaria

Yüklə 21,24 Mb.

səhifə	69/89
tarix	11.09.2023
ölçüsü	21,24 Mb.
	#121652

1 ... 65 66 67 68 69 70 71 72 ... 89

ITALYAN DESSERTATSIYA. WORDdocx

Dim.1 Dim.2

Figura 7.3 - Plot degli autovalori per il dataset relativo ai voti ottenuti a 6 esami da 110 studenti del CdL in Digital Education.
Per semplicità di analisi, come caso esempli.cativo, usiamo una rappresentazione a due dimensioni (Figura 7.4). La funzione cmdscale a partire dalle distanze calcolate (in questo esempio usiamo distanze euclidee) restituisce le coordinate dei punti o meglio i valori delle due dimensioni in cui si riassumono le 6 variabili di partenza (Tabella 7.3).

Figura 7.4 - MDS metrico per il dataset degli studenti del CdL in Digital Education: risultati della funzione cmdscale (library stats) rielaborati in forma gra.ca attraverso la funzione ggscatter (pacchetto ggpubr).

	Dim.1	Dim.2
1	-3,48	11,29
2	-14,87	15,76
3	-24,53	-5,91
4	-31,14	-3,32
5	24,50	-1,93
...	...	...
100	15,21	15,50
101	14,41	16,83

Tabella 7.3 – Valori delle 2 dimensioni dopo l’applicazione del MDS sul campione degli studenti del CdL in Digital Education con 6 variabili (voti degli esami sostenuti). Nella rappresentazione gra.ca le colonne Dim.1 e Dim.2 sono le coordinate dei punti nel piano.
L’analisi potrebbe continuare lavorando sul gra.co e sulle dimensioni oppure facendo a meno del gra.co e lavorando soltanto sui valori delle dimensioni considerate come nuove variabili da utilizzare con una tecnica di analisi diversa.
Un possibile modo per proseguire è quello di applicare una cluster analysis utilizzando come variabili le due dimensioni individuate. In Figura 7.5 è ad esempio gra.cata la visualizzazione di una cluster analysis non gerarchica, metodo kmeans con k = 6. Vediamo già dal gra.co che nei gruppi 1 e 3 i punti sono più vicini fra di loro (meno distanti e più simili), che il gruppo 5 è il più ridotto e il primo in rosso quello più numeroso. Altre osservazioni possono essere aggiunte a partire da un’analisi descrittiva dei cluster: scopriremo che al primo gruppo appartengono gli studenti che hanno sostenuto più esami con voti più alti, ai cluster 2 e 4 studenti con un andamento medio e ai restanti tre gruppi studenti che presentano delle dif.coltà. Queste informazioni potrebbero essere utili per mettere in atto strategie di tutorato personalizzate per gruppo oppure per collegare i successi accademici a fattori altri come dati anagra.ci, numeracy e literacy, livelli di motivazione e così via.

Figura 7.5 - Cluster analysis (metodo kmeans, k = 6) successiva al MDS metrico per il dataset degli studenti del CdL in Digital Education.
Per veri.care la bontà dei risultati utilizziamo il diagramma di Shepard, nel quale ordiniamo e gra.chiamo le distanze teoriche rispetto a quelle reali (Figura 7.6). In questo caso notiamo che i punti si addensano sulla retta bisettrice che passa per lo 0, anche se vi è una certa dispersione al di sotto della retta.
Ossia le distanze calcolate tendono a essere minori di quelle reali. Questo è soltanto un effetto dell’algoritmo utilizzato per minimizzare la differenza presente nell’equazione (7.1). Del resto trattandosi di un quadrato di differenze tra due distanze si otterrebbe lo stesso risultato per valori simmetrici rispetto alla bisettrice.

Yüklə 21,24 Mb.

Dostları ilə paylaş:

1 ... 65 66 67 68 69 70 71 72 ... 89