CopertinaAnnamaria



Yüklə 21,24 Mb.
səhifə11/89
tarix11.09.2023
ölçüsü21,24 Mb.
#121652
1   ...   7   8   9   10   11   12   13   14   ...   89
ITALYAN DESSERTATSIYA. WORDdocx

Figura 1.1 - Le 5 V dei big data (Demchenko, 2013a, p. 2/8).
Le parole che iniziano con la V sembrano rispecchiare molte delle caratteristiche dei big data: è bene sapere che in uno scritto del 2001 di Doug Laney, le V erano solo tre e si limitavano a Volume, Veracity e Variety. Il numero di V nel tempo è continuato a crescere e modicarsi: solo per fare qualche esempio a dimostrazione del fatto che siamo in un settore ampio di cui ancora vanno tracciati chiari conni (Kitchin & McArdle, 2016), sono sette per Uddin e Gupta (2014), dieci per Khan e colleghi (2018), 42 nel settore sanitario per Bahri e colleghi (2018), 56 per Hussein (2020). Dato che il tipo di procedure che ruotano attorno ai big data coinvolgono meccanismi di produzione, archiviazione, elaborazione dei dati che si discostano da quelle conosciute no ad oggi e richiedono la ridenizione di una intera architettura di gestione delle informazioni, Yuri Demchenko (2013b) ne parla come di un ecosistema.
Ambienti digitali di programmazione e analisi


Fino a tre decenni fa le analisi che prevedevano l’uso di metodi statistici articolati richiedevano tempi molto lunghi. Schede perforate sulla programmazione e sui database venivano inviate a computer spesso collocati anche a km di distanza. Il ricercatore doveva aspettare alcune ore per ricevere i risultati, interpretarli perché non sempre le informazioni erano restituite in modalità lineare e sperare di non aver commesso nessun errore per concludere l’operazione (de Lillo et al., 2007). Oggigiorno ci torna difcile anche solo immaginare quali dovessero i tempi (e l’impegno) necessari a calcolare semplicemente la deviazione standard su un campione di 100 osservazioni prima ancora delle schede perforate. Questo perché per condurre questo tipo di analisi oggi abbiamo a disposizione non solo software ma app gestibili da un dispositivo mobile che teniamo in tasca o nella borsa. In questi sistemi la scrittura di una stringa ci restituisce in tempo reale risultati di calcoli che in passato richiedevano innumerevoli ore di lavoro.
Solo a scopo esemplicativo, nella Figura 1.2 riportiamo quello che utilizzando R, uno dei più noti ambienti per l’analisi statistica dei dati, riusciamo a “far dire” a una stringa. Digitando pairs.panels(meta_exams) dove meta_exams è il dataset che raccoglie 111 osservazioni e 7 variabili, questa funzione ci restituisce un’immagine nella quale sulla diagonale troviamo gli istogrammi che descrivono l’andamento delle singole variabili, sopra la diagonale i valori di correlazione di Pearson, sotto la diagonale diagrammi di dispersione bivariata con media e deviazione standard. Si tratta di un esempio elementare con calcoli e graci di base che, se da un lato, ci dimostra quanto questi strumenti di analisi e programmazione siano potenti, dall’altro ci permette di sottolineare il processo articolato di azioni e competenze che porta alla scrittura di una sola stringa. Per le azioni: la denizione di un obiettivo di ricerca; la raccolta dei dati partendo dallo strumento di raccolta (magari un questionario o archivi con dati anagraci e personali); la predisposizione del dataset secondo gli standard che il software possa riconoscere; la selezione della singola funzione da usare fra molte. Per le conoscenze/competenze: di ricerca, per pianicarne le fasi e gli strumenti; disciplinari, dell’ambito della formazione e della didattica; statistiche, per l’analisi dei dati; operazionali, nell’uso dei software.
R (con la sua interfaccia graca R Studio) è un software open source che può essere installato sul proprio pc o usato via browser per creare e archiviare i propri documenti di lavoro. Sono integrati in R, R Markdown e Knitr che permettono di produrre direttamente dal sistema documenti e presentazioni delle ricerche. Essendo un programma modulare può essere integrato con pacchetti che contengono funzioni speciche per determinati ambiti di ricerca. Alcuni esempi sono psych per la ricerca psicometrica o ltm per le analisi nell’ambito dell’item analysis. R è un prodotto open e gratuito, ma potremmo aggiungerne molti altri proprietari come SAS, SPSS o MatLab. Per tutti esistono guide free, tutorial, esperti che rispondono nelle community/forum online che si raccolgono attorno a questi strumenti.


Yüklə 21,24 Mb.

Dostları ilə paylaş:
1   ...   7   8   9   10   11   12   13   14   ...   89




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə