Page 9 - Demo
P. 9
Big Data: un nuovo approccio alla conoscenza
o a piccoli campioni potevano apparire legittime;
con uno studio su tutto il dataset sono stati possi-
bili le rilevazioni di irregolarità e l’intervento per
bloccarle2.
Variety - le informazioni provengono da fonti
con caratteristiche molto diverse tra loro ed han-
no formati differenti. In alcuni casi non è presen-
te neanche una struttura, per cui tali informazioni
possano essere rappresentate attraverso tabelle di Storage Area Network
(SAN) in una rete
database relazionali (es. dati estrapolati da You- aziendale di medie
dimensioni.
tube); nuove soluzioni per risolvere queste tipo-
logie di problemi stanno diventando sempre più
convenienti anche in termini economici perché i
costi di gestione del sistema e delle infrastruttu-
re ad essi collegati continuano a diminuire con il
progredire dell’avanzamento tecnologico3.
Velocity - la velocità con cui i dati sono dispo-
nibili rende necessario l’utilizzo di strumenti di
immagazzinamento ed elaborazione delle infor-
mazioni che ne possano tenere il passo. Per le
aziende è importante sfruttare la caratteristica di
alta velocità di disponibilità dei dati utilizzandoli
con altrettanta rapidità, minimizzando i tempi di
analisi ottenendo informazioni utili per il busi-
2 “Big Data - Una rivoluzione
che trasformerà il nostro modo
Variety - le informazioni provengono da fonti
di vivere – e già minaccia
la nostra libertà” - Mayer- con caratteristiche molto diverse tra loro
Schönberger Viktor - Cukier
Kenneth.
ed hanno formati differenti
3 In particolare ci si riferisce
a tecnologie Open Source,
come Apache Hadoop che è un
sistema basato su un file system
distribuito su più server (HDFS)
e sul framework MapReduce
(che permette le interrogazioni
e i calcoli suddividendoli e
distribuendoli su più nodi).
L’implementazione di soluzione
che tali sistemi permettono
è atta al trattamento e
all’elaborazione di una grossa
mole di dati a costi contenuti.
Generatore
di particelle.
7