Page 10 - Demo
P. 10
riflessioni
Dentro
un computer.
Con il tempo
è sempre più evidente
l’importanza le raccogliere e che sono adesso disponibili sono
scientiica e sociale molto alte e non ancora completamente stimabili.
legata al fenomeno La quantità di dati disponibili nel mondo cre-
sce rapidamente, con costante accelerazione. At-
dei Big Data,
tualmente Google processa oltre 20 petabyte di
considerati
dati al giorno, su Facebook gli utenti cliccano “mi
piace” o lasciano commenti quasi tre miliardi di
sempre più fonte
volte al giorno, dal 2012 Twitter ha superato i 400
di valore economico
milioni di tweet al giorno2.
e di innovazione
I Big Data non rappresentano solo un enorme
aumento del volume delle informazioni disponi-
bili ma sottendono un diverso approccio alla co-
noscenza e alla comprensione dei fenomeni.
4 ness. A tal fine sono stati sviluppati sistemi per Modificare la quantità delle informazioni, in-
I dati semistrutturati sono
raccolti e immagazzinati in la gestione dati ad alta velocità che utilizzano me- fatti, ne modifica l’essenza. Così come un orga-
strutture dati in cui è assente
la rigidità di uno schema
todologie di Complex Event Processing e Database nismo multicellulare non è la mera somma delle
non relazionali4 quali quelli colonnari (column-o- proprie cellule ma il risultato dell’interazione tra
come quello descritto dal
Data Definition Language riented) o chiave/valore (key/value store); ciò ha esse, così i Big Data non sono solo un enorme am-
(DDL); tipicamente ci si
permesso di rendere disponibili le informazioni montare di singole informazioni ma nascondono
riferisce quindi a database
NoSQL, conosciuti anche come prima di diventare obsolete. Un esempio di come anche molteplici correlazioni (legami) tra le loro.
schemaless database. Riuscire a sia determinante ottenere informazioni in tempo Una caratteristica fondamentale dei Big Data
immagazzinare e trattare dati di
reale al fine di prevenire criticità è rappresentato è la loro rappresentazione spesso caotica perché
vari tipi e differenti dimensioni
e a recuperarli agevolmente dagli studi legati a rilevazioni di frodi compiute su varia la qualità dei dati, le sorgenti da cui proven-
richiede maggiori risorse di carte di credito.
gono sono disomogenee e inoltre sono distribuiti
processazione e di archiviazione Con il tempo è sempre più evidente l’impor- su molteplici server sparsi per il mondo. Nono-
rispetto ai database strutturati
(SQL) ma i benefici in termini tanza scientifica e sociale legata al fenomeno dei stante la minore accuratezza delle informazioni,
di quantità e fruibilità del Big Data, considerati sempre più fonte di valore
l’enorme quantità di dati permette una maggiore
patrimonio informativo valgono economico e di innovazione; le potenzialità delle comprensione del fenomeno globale nella pro-
tale onere.
informazioni che fino ad oggi non è stato possibi-
pria interezza.
Un esempio può essere rappresentato dal tra-
duttore automatico di Google (Google Translate)
per il quale è stato utilizzato un dataset di tradu-
zioni in oltre 60 lingue, immagazzinando ed ela-
borando tutti i contenuti reperibili in rete, come
siti multilingue e le traduzioni dei documenti
ufficiali. Il linguaggio viene conseguentemente
trattato come una massa disordinata di dati a cui
applicare algoritmi statistici. Per migliorare tale
Particolare
di scheda madre.
8