Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Big Data - Student Conference Days

Ondersteunende presentatie Student Conference Days
by

Timothy Persoon

on 26 September 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Big Data - Student Conference Days

BIG
Data
1. Wie zijn wij?
8. Demo
2. Wat is Big Data?
3. Verschil tussen data
Gestructureerde data
VERSUS
Ongestructureerde data
4. Hadoop
6. Best Practices
9. Besluit
5. Waarom Big Data?
?
Gebaseerd op Google FS en dient voor analyse van grote hoeveelheden data
1. Filtert dataset
2. Haalt gewenste waarden op
1. Neemt de output van map als input
2. Filtert tot het gewenste resultaat
Een voorbeeld: bepalen hoogste temperatuur per stad
Dataset bevat bestanden met data over steden en het weer
Brussel: 20 Brussel: 25
Antwerpen: 25 Antwerpen: 29
Gent: 22 Gent: 18
Brussel: 32 Brussel: 22
Antwerpen: 4 Antwerpen: 31
Gent: 33 Gent: 15
Antwerpen: 18
Wanneer de mappers hun taak hebben volbracht
{Brussel: 32}{Antwerpen: 25}{Gent: 33}
{Brussel: 25}{Antwerpen: 31}{Gent: 18}
Na de reduce taak
{Brussel: 32}{Antwerpen: 31}{Gent: 33}
A(tomicity): ofwel alles ofwel niets
C(onsistency): doorheen heel de database zowel voor als na
I(solation): onafhankelijk van elkaar
D(urability): het resultaat is permanent
Volgt het ACID principe niet
Geschikt voor afbeeldingen, grote tabellen en grafieken
ACID principe
SQL als query taal
Hogere performantie
1. Data wordt opgedeeld in kleinere blokken 4. Beheer gebeurt via NameNode
2. Wordt verdeeld doorheen de cluster 5. Nadeel: andere syntax
3. Redundante opslag
7. GPFS
Focus op wat je wil bereiken
Gebruik de juiste tool
Oprichters: Remi Tys en Timothy Persoon
Wanneer: 1990
Waarom: online tickets bestellen
Company X
Beschikbaarheid
Big Data > buzzword
Dank u voor uw aandacht!
Toepassing 1: geparameteriseerd zoeken
Toepassing 2: zoeken binnen multimedia
Toepassing 3: analyse van trends en gevoelens
Toepassing 4: verrijking van bestaande databanken
Toepassing 5: onderzoekende analyse
Toepassing 6: operationele analyse
Bijvoorbeeld: nosocomiale infectie
Timothy Persoon
Figuren:
Logo:
http://www.qlikview.com/us/explore/products/big-data
3 V's
: http://www.yellowfinbi.com/YFCommunityNews-Addressing-Big-Data-analytics-with-SQL-Server-2012-Q-A-with-chief-Yellowfin-arch-120139
Facebook:
http://hms-somerset-co.blogspot.be/2013/01/facebook-logo.html
Twitter:
http://akacp01.blogspot.be/2013_01_01_archive.html
Youtube:
http://www.inoutfield.com/2011/10/07/our-youtube-channel-gets-250-thousand-hits/
Chelsea:
https://www.facebook.com/ihatechelsea?fref=ts
Metallica Tweet:
zelf gegenereerd via http://lemmetweetthatforyou.com/
Typisch KdG:
https://www.facebook.com/pages/Typisch-KDG/315971415180714?fref=ts
Linux Mint Blog:
http://blog.linuxmint.com/
Google Flu Trends:

http://www.google.org/flutrends/us/#US
SQL:
http://www.cerebralmastication.com/2010/09/connecting-to-sql-server-from-r-using-rjdbc/
Oracle 11g:
http://www.bugtreat.com/blog/how-to-install-oracle-11g-express-edition/
NoSQL:
http://www.appdynamics.com/blog/2011/05/18/will-nosql-kill-the-dba/
NewSQL:
http://cantina.co/author/dadams/
Hadoop:
http://hortonworks.com/blog/we-believe-in-community-driven-enterprise-apache-hadoop/
Hadoop HDFS:
http://davidepalmisano.com/2012/10/your-first-hadoop-hdfs-cluster/
Hadoop MapReduce:
http://hadoopuniversity.blogspot.be/p/course-content.html
Operationele analyse cartoon:
http://www.cartoonbank.com
Teleticketservice:
http://www.sterrennieuws.be/nieuws/sn2716-tele-ticket-service-lanceert-nieuwe-website/
Spellingscorrectie
Type-ahead query
Fuzzy matching
Alexander Coopmans
van de organisaties verzamelen meer gegevens dan ze effectief kunnen gebruiken
60 %
van de organisaties zien BIG Data als een grote kans op zakelijk vlak
van de organisaties die investeerden in BIG Data verwachten ROI binnen 1 jaar
General Parallel File System
- Enorme set file management tools
- High performance
- Scalable
- High Availability
Remi Tys
Kristof Verreet
70 %
70 %
Full transcript