Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Tesi di Laurea

No description
by

Dario Parrino

on 27 April 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Tesi di Laurea

Architettura del sistema
Analisi dei Risultati
Conclusioni
Il software è in grado di gestire il grande carico di dati da Twitter
Obiettivo della tesi
Sviluppare un software per l’analisi dei dati di Twitter utile a fornire all’utente finale un sistema in grado di estrapolare informazioni statistiche sulle tematiche di interesse.
DIPARTIMENTO DI INGEGNERIA CHIMICA, GESTIONALE, INFORMATICA, MECCANICA
SCUOLA POLITECNICA
CORSO DI LAUREA IN INGEGNERIA INFORMATICA
ANNO ACCADEMICO 2014 – 2015

PROGETTO E SVILUPPO DI UNO STRUMENTO
PER LA FRUIZIONE DI DATI PROVENIENTI DA TWITTER
TESI DI:
DARIO CARMELO PARRINO
RELATORE:
PROF. SALVATORE GAGLIO

CORRELATORE:
ING. MARCO MORANA
Data Streaming
È in continua crescita
Big Question
Quali utenti ottengono più retweet?
Chi sono gli uteti più influenti nel nostro settore?
Necessità di elaborare i dati
Back end
Front end
Flume
Hadoop
Hive

Collezione
Aggregazione
Analisi
Flume
Hadoop
Framework open source pensato per effettuare operazioni di storage e processing distribuito
Storage
frammenta i dati in blocchi e li distribuisce in tutto il cluster
presenta due tipi di nodi che operano secondo un pattern master-worker
È il file system di Hadoop
Processing
Programmazione funzionale
Segue il paradigma Divide et Impera
Sviluppato da Facebook
Hive = RDBMS?
Framework per datawarehousing
Opera on top ad Hadoop
Schema on read
VS
Schema on write
Big Data
Variability
Business Value
Dalle 00:00 del 17 Febbraio
alle 13:00 del 21 Febbraio
Raccolta Dati:
Volume dei dati raccolti:
2,73 GB
314.035 tweet
e riesce ad estrapolare dai tweet tutte le informazioni richieste
Sviluppi Futuri
Full transcript