Page 10 - Demo
P. 10


riflessioni






Dentro
un computer.


Con il tempo

è sempre più evidente 

l’importanza le raccogliere e che sono adesso disponibili sono 

scientiica e sociale molto alte e non ancora completamente stimabili. 

legata al fenomeno La quantità di dati disponibili nel mondo cre- 
sce rapidamente, con costante accelerazione. At- 
dei Big Data, 
tualmente Google processa oltre 20 petabyte di 
considerati
dati al giorno, su Facebook gli utenti cliccano “mi 
piace” o lasciano commenti quasi tre miliardi di 
sempre più fonte
volte al giorno, dal 2012 Twitter ha superato i 400
di valore economico 
milioni di tweet al giorno2.
e di innovazione
I Big Data non rappresentano solo un enorme
aumento del volume delle informazioni disponi- 

bili ma sottendono un diverso approccio alla co- 

noscenza e alla comprensione dei fenomeni.
4 ness. A tal fine sono stati sviluppati sistemi per Modificare la quantità delle informazioni, in- 
I dati semistrutturati sono 
raccolti e immagazzinati in la gestione dati ad alta velocità che utilizzano me- fatti, ne modifica l’essenza. Così come un orga- 
strutture dati in cui è assente
la rigidità di uno schema
todologie di Complex Event Processing e Database nismo multicellulare non è la mera somma delle 
non relazionali4 quali quelli colonnari (column-o- proprie cellule ma il risultato dell’interazione tra 
come quello descritto dal
Data Definition Language riented) o chiave/valore (key/value store); ciò ha esse, così i Big Data non sono solo un enorme am- 
(DDL); tipicamente ci si 
permesso di rendere disponibili le informazioni montare di singole informazioni ma nascondono 
riferisce quindi a database 
NoSQL, conosciuti anche come prima di diventare obsolete. Un esempio di come anche molteplici correlazioni (legami) tra le loro.
schemaless database. Riuscire a sia determinante ottenere informazioni in tempo Una caratteristica fondamentale dei Big Data 
immagazzinare e trattare dati di 
reale al fine di prevenire criticità è rappresentato è la loro rappresentazione spesso caotica perché 
vari tipi e differenti dimensioni 
e a recuperarli agevolmente dagli studi legati a rilevazioni di frodi compiute su varia la qualità dei dati, le sorgenti da cui proven- 
richiede maggiori risorse di carte di credito.
gono sono disomogenee e inoltre sono distribuiti 

processazione e di archiviazione Con il tempo è sempre più evidente l’impor- su molteplici server sparsi per il mondo. Nono- 
rispetto ai database strutturati 
(SQL) ma i benefici in termini tanza scientifica e sociale legata al fenomeno dei stante la minore accuratezza delle informazioni, 
di quantità e fruibilità del Big Data, considerati sempre più fonte di valore 
l’enorme quantità di dati permette una maggiore 
patrimonio informativo valgono economico e di innovazione; le potenzialità delle comprensione del fenomeno globale nella pro- 
tale onere.
informazioni che fino ad oggi non è stato possibi-
pria interezza.

Un esempio può essere rappresentato dal tra- 
duttore automatico di Google (Google Translate) 

per il quale è stato utilizzato un dataset di tradu- 

zioni in oltre 60 lingue, immagazzinando ed ela- 
borando tutti i contenuti reperibili in rete, come 

siti multilingue e le traduzioni dei documenti 

ufficiali. Il linguaggio viene conseguentemente 

trattato come una massa disordinata di dati a cui 
applicare algoritmi statistici. Per migliorare tale






Particolare
di scheda madre.






8



   8   9   10   11   12