Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Copy of Copy of Copy of BI Journey

No description
by

Pascal Slaats

on 19 February 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Copy of Copy of Copy of BI Journey

Thema 1: Nut en noodzaak van BI (Business case) Thema 2: BI architectuur scan Thema 3: Datawarehouse modelling 1 (cubes en reporting) Thema 4: Datawarehouse modelling 2 (Star schemas) Thema 5: Datawarehouse modelling (integratie opdracht) Thema 6: BI Governance Thema 7: BI instrumenten
Welkom in dit logboek van Ferdi Brand. De presentatie geeft een korte weergave van de behandelde stof in de 'course' Business Intelligence gegeven op de HZ University of Applied Sciences. Business Intelligence Wat is BI
Informatiekloof
BI business case
Markt en omgevingstrends
Uitdagingen moderne organisatie
ICT (on)mogelijkheden De spanning tussen enerzijds de beschikbare tijd om op basis van relevante informatie beslissingen te nemen en actie te ondernemen en anderzijds de benodigde tijd om relevante informatie te verkrijgen door gegevens te verzamelen en analyseren
Bron: Pieter den Hamer, Business Intelligence, 2010 Informatiekloof Wat is Business Intelligence is een verzameling van strategische bedrijfsinformatie die vergaard is met behulp van rapportagetools en datamining. http://www.crmbegrippen.nl/begripomgeving.php?id=213 Business Intelligence is het geheel van oplossingen en technieken voor het verzamelen, opslaan en analyseren van bedrijfskritische data uit uiteenlopende bedrijfsplatformen. Door het combineren en structuren van die data kan een geheel van dashboards worden opgesteld dat vaak op grafische wijze aan diverse types managers een individualiseerbaar instrument biedt om de performantie van het bedrijf te monitoren binnen de relevante onderdelen waarvoor die managers verantwoordelijk zijn. Die snelle toegang tot relevante parameters vormt het vertrekpunt voor een eventuele snelle bijsturing van bepaalde bedrijfsprocessen. http://www.encyclo.nl/lokaal/10401 Business case onderdelen Planning: o.a. tijdlijnen, mijlpalen, afhankelijkheden met andere projecten / afdelingen, mogelijke beperkingen / randvoorwaarden, risico's, benodigde resources
Financieel overzicht: kosten inclusief implementatie, benefits; economic profit van het programma en de fase daarop volgend waarin de resultaten gebruikt worden; investeringsvoorstel
Risico assessment: risico categorieën als markt, operationeel (op organisatie, IT, HR, primaire processen), legal, liquiditeit, strategie/business, reputatie en wat er gebeurt als de business case niet gerealiseerd wordt.
Alternatieven die bestudeerd zijn: waarom is het gekozen, consequenties als programma niet uitgevoerd wordt.
Benefits: benefits kengetallen, wie is verantwoordelijk voor benefits tracking proces en hoe wordt het uitgevoerd; tracking & reportage http://www.tql.nl/00/tql/detailsextern/2710020/321234292/1003388/3/0//Wat_zijn_relevante_factoren_voor_een_business_case.html BI opbrengsten (aantal informatietoepassers)²
X
Gerealiseerd ambitieniveau
X
Aantal toepassingsgebieden Markt en omgevingstrends • Globalisering; steeds meer organisaties zijn in steeds meer landen actief
• Individualisering; steeds meer burgers en consumenten zijn zelfstandiger en mondiger geworden
• Meer samenwerking in de keten; de meeste producten en diensten voor consumenten en andere eindgebruikers zijn het resultaat van een samenwerkingsverband of keten van verschillende leveranciers.
• Roep om transparantie; naast partners. Klanten en leveranciers verlangen ook kritische consumenten, burgers, overheden en aandeelhouders een toenemende mate van inzicht in de activiteiten en prestaties van bedrijven
• Interactie en complexiteit; de cruciale rol van BI in de transparante maatschappij beperkt zich als het goed is niet tot afzonderlijke organisaties, maar betreft ook de interacties tussen die organisaties of hun onderdelen
• Duurzaamheid ; klimaatverandering, dreigende energieschaarste en andere milieuproblemen zijn in veel opzichten een belangrijke voedingsbodem voor de honger naar informatie
Bron: Pieter den Hamer, Business Intelligence, 2010 Uidagingen moderne oganisatie • Snellere betere beslissingen nemen; beslissers van organisaties kampen aan de ene kant met toenemende druk om snel de juiste beslissingen te nemen en aan de andere kant met de moeite en tijd die het kost om relevante informatie te verkrijgen. (dit heeft te maken met wat er bij een informatiekloof gebeurt)
• Slagvaardige kenniswerkers; gedurende de afgelopen tientallen jaren is veel van het routinewerk geautomatiseerd of verplaatst naar de lage loon landen. Wat overblijft is het ingewikkelde of kennisintensieve werk.
o I2P; information to people om mensen toegang te bieden tot de voor hen relevante informatie
o P2P; people to people, om mensen te laten samenwerken en communiceren, in gestructureerde processen, projecten
o P2I; people to information, om te de informatie te registreren die mensen produceren als onderdeel van hun werk
o I2I; information to information, om informatie van het ene naar het andere formaat of systeem over te zetten om met elkaar te integreren
• Opkomst van informatiedemocratie; in de meeste moderne organisaties is de informatiedemocratie sterk in opkomst of al gevestigd. In een informatiemocratie hebben alle medewerkers (op gecontroleerde wijze) toegang tot de informatie die ze nodig hebben om hun werk op een goede manier te kunnen doen.
Bron: Pieter den Hamer, Business Intelligence, 2010 Bron: Pieter den Hamer, Business Intelligence, 2010 BI Architectuur
Metadata
Datawarehouse
Datamart
ETL
Bronsystemen
ODS
Topologieën BI architectuur onderdelen Datawarehouse metadata
richtlijnen
standaarden
infrastructuur
tools Een datawarehouse is een grote verzameling van gegevens. Meestal gaat het over een gigantische hoeveelheid aan elektronische data die bedoeld is voor decision support. Deze gegevens moeten grondig geanalyseerd worden aangezien ze gebruikt worden als basis voor belangrijke beslissingen. Metadata Metadata is te omschrijven als data die nodig zijn om met andere data (en informatie) te kunnen werken. Bronsystemen Datamart Een datamart is een verzameling van gegevens, vergelijkbaar met een datawarehouse, maar meestal met een kleinere hoeveelheid aan gegevens en vaak ingericht voor een specifiek doel.
Net als een datawarehouse wordt een datamart periodiek gevuld met gegevens uit operationele systemen en bevatten dus een snapshot van deze gegevens. Datamarts kunnen ook deel uitmaken van een datawarehouse.
Bron: http://nl.wikipedia.org/wiki/Datamart Er dient eerst gekeken te worden welke bronnen er dienen te worden aangesproken, zoals een database of ongestructureerd tekstdocumenten.
Na de identificatie van verschillende bronnen word per bron bekeken hoe men deze het beste kan inzetten, in welke vorm de gegevens beschikbaar zijn of deze aanpassing behoeft (conversie), hoe vaak brongegevens veranderen hoe betrouwbaar de bron vermoedelijk is en wat de beschikbare manier zijn mom de bron te ontsluiten.
Externe bronnen zijn systeem die meestal niet binnen de eigen organisatie draaien maar bijvoorbeeld bij een klant of leverancier.
Legacy bronsystemen zijn meestal verouderd en worden meestal niet meer onderhouden, in dit soort systemen zit vaak inconsistente data.
ERP (Enterprise resource Planning) kan ook gebruikt worden als bronsysteem, dit zijn meestal wat nieuwere systemen. En er zijn ook pakketten beschikbaar welke zowel ERP aanbieden als BI in 1 pakket, voor specifieke situatie zal .
OLTP (Online transaction processing) houd alle transacties bij die bijvoorbeeld door klanten gemaakt is, deze is natuurlijk ook goed te gebruiken als bronsysteem.
Bron: Pieter den Hamer, Business Intelligence, 2010 ETL ETL is de afkorting voor Extraction, Transformation and Load. De term ETL staat voor een groep technologieën die veelal gebruikt worden bij de koppeling tussen systemen, waarbij er gestreefd wordt naar een minimale technische en semantische koppeling tussen de systemen. Het is een batchproces dat regelmatig gebruikt wordt.
Extract = leest data van een bron en pakt het gewenste pakket uit
Transform = Zet opgenomen data om, gebruik makende van regels, opzoektabellen of maakt combinaties van data van verschillende bronnen
Load = schrijft de data naar een gewenst doel
Bron: http://nl.wikipedia.org/wiki/ETL ODS De Operational Datastore (ODS) word ingezet om data uit bronsystemen op een geintrgreerde wijze met zo min mogelijk vertraging (secondes, of paar keer per dag) ter beschikking te stellen in het BI-proces. Door het streven van zo’n kort mogelijk vertraging zijn slechts beperkte bewerkingen mogelijk op de brongegevens voordat ze in de ODS terecht komen.

In een ODS vind je vooral detailgegevens en slechts in beperkte mate of helemaal geen historie, vanwege de beperkte tijd voor het uitvoeren van transformaties tussen de bron en ODS lijkt de structuur of datamodel vaak meer op het leverende bronsysteem dan op het dimensionale sterschema van een datamart.
Bron: Pieter den Hamer, Business Intelligence, 2010 De 5 topologieën
Onafhankelijke datamarts
Enterprise datawarehouse
Hub en Spoke
Virtueel datawarehouse
Enterprise databus Bi topologieën Datawarehouse, datamarts, ODS, EAI/EII en ETL kunnen verschillende manieren toegepast en gecombineerd worden Een Microsoft SQL server zou als datawarehouse kunnen worden ingezet.
Een ETL-proces kan worden opgebouwd met een ETL-tool zoals CloverETL (schematisch)
Doormiddel van SharePoint kunnen reports gegenereerd welke gebruikt kunnen worden bij analyse en beslissingen. BI softwareproducten OLAP cube
Fact en dimension OLAP cube Fact & dimension Een fact is iets wat je kan meten of een status aan kan toekennen bijv. Omzet, Winst, Prijs,
Veilig Ja/Nee, Aantal etc. Belangrijke indicatoren (facts) worden ook wel aangeduid met KGI (key goal indicator) of KPI (Key performance indicator).

Een dimensie is een gezichtspunt/perspectief op een indicatorwaarde, waardoor deze betekenisvol word. Het word daardoor vooral duidelijk op welke ‘dimensie’ de indicatorwaarde betrekking heeft. Dimensies kunnen hiërarchisch structuur hebben (Continent - Land - Regio) Dimensies komen terug in bijv. star schemes en OLAP cubes.
Dimensies zijn bijvoorbeeld: Product, Periode (tijd), Plaats, Wie (het verkocht heeft)
Bron: Pieter den Hamer, Business Intelligence, 2010 Notenbalk
Sterschema
Verschillen tussen Kimball en Inmonn over de opzet van een datawarehouse Notenbalk Sterschema De wensen worden in mate van belangrijkheid volgens deze
classificering gerangschikt. Het realiseerbaar model vormt
de basis voor de realisatie van het informatiesysteem.
Het realiseerbaar model wordt samengevat in een notenbalk,
waarin de beschikbaarheid en hiërarchieën staan
weergegeven.
Bron: http://www.met-online.nl/pdf/MET9-1-4.pdf Voorbeel notenbalk De term sterschema heeft te maken met het ontwerpen van datawarehouses die ontwikkeld worden met relationele databases, zoals DB2, Oracle en SQL Server. De term verwijst naar de wijze waarop kolommen in tabellen gegroepeerd zijn. Bij een sterschema worden gegevens gedupliceerd samengevoegd in tabellen.
Bron: http://www.r20.nl/artikel_sterschema.htm Voorbeeld Sterschema Verschil Inmon en Kimball Inmon spreekt van een centraal datawarehouse als ‘fundering’ voor alle afgeleide datamarts welke in 3NF (3e normaalvorm) is gemodelleerd. Mede om daarmee consistentie tussen de verschillende datamarts af te dwingen.
Kimball benadrukt eveneens het belang van consistentie maar stel daarbij het gebruik van ‘conforming dimensions’ op de eerste plaats, daarmee bedoeld hij dat de verschillende dimensie tabellen die in verschillende steren en in verschillende datamarts gebruikt worden, identiek zijn of op zijn minst combineerbaar en onderling niet inconsistent. Kimball spreek ook wel van een semipermanente opslag van gegeven in een staging area, die daarmee trekjes vertoont van het datawarehouse van Inmon.
Bron: Pieter den Hamer, Business Intelligence, 2010 Belang datakwaliteit Dashboard builder for MS Acces Datakwaliteit is de mate waarin data geschikt is voor het doel waarvoor ze gebruikt wordt. In het geval van business intelligence, betekent dit dus dat de data geschikt moet zijn als informatiebron voor het operationele, tactische en strategische beslissingsproces. Dit betekent meer dan: er mogen geen fouten in zitten. Theoretisch zou het zelfs kunnen betekenen dat de data wel fouten mag bevatten. Indien men weet dat een databron 95% correcte data bevat, kan men besluiten dat dit voldoende is om op basis van deze gegevens bepaalde conclusies te trekken.
Bron: http://www.bithatworks.nl/article.asp?artid=DATAKWALITEIT Slowly changing dimensions Dimensies die in de tijd nauwelijks aan verandering onderhevig zijn. Bijvoorbeeld het adres van een persoon. Het vastleggen van wijzigingen gebeurt veelal op een afwijkende manier. Een veelgebruikte methode is die waarbij bij een wijziging een nieuw record wordt ingevoegd die de nieuwe toestand beschrijft, terwijl het oude record wordt afgesloten door het een einddatum te geven of te voorzien van een 'niet geldig' indicator.
Bron: http://www.bithatworks.nl/article.asp?artid=DATAKWALITEIT BI governance
BI rollen
Risico's en succefactoren BI Instrumenten
Integraal informatie management Toepassen Analyseren Verzamelen Datawarehouse
Document warehouse
Datamarts
ETL
ODS
EII/EAI Rapportage
OLAP
Visualisatie
Datamining
Textmining Cockpits/dashboards
Portal
Groupware/collaboration
Closed loop Datawarehouse BI governance BI rollen Bij BI governance gaat het er om dat er duidelijke afspraken worden gemaakt over het vaststellen van prioriteitstellingen, projectplanning en reactietijden van BI-beheerders op wijzigingsverzoeken binnen een BI organisatie -Bi architect
-Business analist
-Bi analist/ontwerper
-Bi ontwikkelaar
-Tester BI risico's en succesfactoren Risico's Succesfactoren • ETL ijsberg; onderschatting van inspanning voor het verzamelen, transformeren en combineren van brongegevens kan tot tijd- en budgetproblemen leiden.
• Vervuilde bronnen; de achilleshiel van BI: door ontbrekende vervuilde brongegevens kan men niet vertrouwen op informatie die men met BI probeert te verkrijgen
• BI is een ICT project; BI is nogal eens onterecht synoniem aan ICT project waarin men flexibele rapportage ontwikkelt al dan niet op basis van een datawarehouse of andere gestructureerd gegevensbronnen
• BI spaghetti; BI kan verstikt raken in de complexiteit van de gecombineerde toepassing van meerdere tools en systemen
• Vraag en aanbod uit balans;
• Onbegrijpelijke informatie
• Onbruikbare informatie
• Ongebruikte informatie
• Big brother effect
• Wat je meet is wat je eet
• Strategische blindheid •Voorkom scheefgroei; een belangrijke succesfactor voor BI in vrijwel alle organisaties is het zo gelijk mogelijk laten opgaan van ontwikkelingen aan enerzijds de kant van architectuur en techniek en anderzijds de kant van organisatie processen en competenties
•Werken onder architectuur; succesvolle organisaties op het vlak van BI ontwikkelen en gebruiken binnen BI projecten daadwerkelijk een gemeenschappelijke BI architectuur.
•Heldere visie; sponsors en hoger management communiceren een heldere visie over BI en ondersteunen actief de ontwikkeling van BI.
•Het cyclische proces; succesvolle BI wordt beschouwd als een cyclisch proces, niet als eenmalig, losstaand project.
•Law and ethics; belangrijk i dat organisaties rekening houden met juridische, ethische en maatschappelijke/culturele aspecten
•Het goede voorbeeld; bij effectieve BI hoort gerichte aandacht voor stijl van management en leiderschap Bron: Pieter den Hamer, Business Intelligence, 2010 Bron: Pieter den Hamer, Business Intelligence, 2010 Bron: Pieter den Hamer, Business Intelligence, 2010 Onafhankelijke datamarts Enterprise Datawarehouse Hub en Spoke Virtueel datawarehouse Enterprise Databus ETL
Belang datakwaliteit
Slowly changin dimensions
Dashboard building BI instrumenten Integraal informatiemanagement stelt de behoefte van de informatieconsument centraal zonder zich te beperken tot een bepaalde vorm van informatievoorziening om in de behoeften te voorzien. Een integraal informatiemanager zal zich dus niet beperken tot informatievoorziening via bedrijfsapplicaties, maar deze waar nodig combineren met BI of andere informatievoorziening die gebaseerd is op gestructureerde of ongestructureerde databronnen, binnen of buiten de eigen organisatie
Bron: Pieter den Hamer, Business Intelligence, 2010
http://www.cram.nl/ieni/940208.htm Integraal informatie management Bron: Pieter den Hamer, Business Intelligence, 2010
http://www.kennisportal.com/main.asp?ChapterID=2583 Bron: Pieter den Hamer, Business Intelligence, 2010 Bron: Pieter den Hamer, Business Intelligence, 2010
http://www.baseline-consulting.com/uploads/BCG_SalesSheet_BIGovernance_2009.pdf
http://informationdelivery.blogspot.com/2009/12/opstellen-van-een-bi-governance.html Bron: http://dtrapenberg.files.wordpress.com/2011/03/ster_ordervoorraad.jpg Notenbalk en sterschema ICT (on)mogelijkheden
• Hoeveelheid data groeit in rap tempo;
Er is steeds meer data, en dit blijft groeien. De vraag is hoe organisaties er voor kunnen zorgen dat de kostbare niet aangesproken word, of dat hun medewerkers bedolven worden door irrelevante informatie. Hoe kunnen ze gebruiken maken van dit enorme potentieel? Het antwoord ligt voor een groot deel bij BI, met de instrumenten die BI ondersteunen kan zijn er krachtige mogelijkheden beschikbaar zoals de mogelijkheid om data te ontsluiten, te classificeren, te combineren en gestructureerd, terug vindbaar op te slaan, om ze vervolgens op diverse manieren te analyseren zodat er bruikbare informatie ontstaat.
• Silo’s en spaghetti;
Binnen organisaties is er jarenlange wildgroei geweest van losstaande systemen, databases en andere bronnen (zowel binnen als buiten de organisatie). Dit komt doordat er geen coördinatie was met lokale initiatieven of door overnames. Dit leid tot de volgende problemen, complex onderhoud en kostbare beheer. Als er dan een bedrijfsapplicatie geschikt gemaakt moet worden voor een nieuw product kan dit vaak lang duren, de verleiding is dan groot om te kiezen voor de makkelijkste weg (= een nieuwe silo)
De diverse structuren, datamodellen, systemen etc. Maak het verkrijgen van informatie soms moeilijk of praktisch onmogelijk. Dit is een ernstige hinder voor het vergaren van informatie die nodig is voor beslissingen binnen een bedrijf.
• Datakwaliteit en beveiliging;
Het probleem van datakwaliteit komt naar voren doordat gegevens ontbreken of incorrect, incompleet of onderling inconsistent zijn. Zo kunnen belangrijke beslissigen op onjuiste informatie zijn gebaseerd en kunnen klanten en aandeelhouders onjuist worden geïnformeerd. Het moet duidelijk zijn dat BI niet de veroorzaker van matige datakwaliteit is maar de boodschapper, vaak mislukt een BI initiatief waarbij BI de schuld krijgt, maar waar de achterliggende reden de matige datakwaliteit was.BI kan overigens wel de problemen met datakwaliteit aanpakken, onder meer door te filteren en schoonmaken van data. Dit zijn de BI instrumenten (word later meer over uitgelegd)
Beveiliging van bedrijfsgevoelige informatie is natuurlijk belangrijk, je wilt niet dat deze bij je concurrenten terechtkomt. Daar zal dus bij een organisatie een risicoanalyse moeten worden uitgevoerd met daarbij een inventarisatie waarbij er maatregels worden getroffen om de risico’s te verkleinen. Er dient wel een goede balans gevonden te worden door organisatie, enerzijds de afscherming van je informatie in het kader van beveiliging en anderzijds te voorzien in de informatie behoefte van zo veel mogelijk mensen.
• Technology push;
Er kunnen belangrijke concurrerende voordelen met worden gerealiseerd zowel strategisch als operationeel. Op het vlak van BI kunnen verschillende ICT instrumenten een belangrijke basis zijn voor de volgende mogelijkheden. Bijvoorbeeld aanbieden van informatie op maat, ter voorkoming van information overload, krachtige mogelijkheden om over informatie te communiceren voor snellere en betere beslissingen via bijvoorbeeld een webportaal.

• ICT-markttrends.
BI doet het ook goed in tijden van recessie (in tegenstelling tot andere gebieden in de ICT)
Bedrijven zien dus brood in het verbeteren van hun informatievoorziening, bijvoorbeeld om inefficiënties en mogelijke kosten besparingen op te sporen. Maar ook wet- en regelgeving spelen een rol, waardoor ze een extra prikkel krijgen om in BI te investeren. BI word steeds meer mainstream en het krijgt ook te maken met ‘outsourcing’ net als veel ICT voorzieningen.
Bron: Pieter den Hamer, Business Intelligence, 2010 Hopelijk bent u veilig teruggekeerd van deze reis en heeft u, net als mij, veel over Business Intelligence geleerd Bron: http://www.met-online.nl/pdf/MET9-1-4.pdf Bron: Pieter den Hamer, Business Intelligence, 2010 Olap cube Een OLAP cube (voor online analytical processing), of gegevenskubus, is een datastructuur die snelle data-analyse mogelijk maakt. Hierbij kan men data analyseren en manipuleren vanuit verschillende perspectieven. De samenstelling van data in cubes lost een aantal beperkingen op van relationele databases. OLAP-kubussen kunnen gezien worden als uitbreidingen van de twee-dimensionale array van een spreadsheet. Zo zou een bedrijf sommige financiële gegevens willen analyseren per product, per tijdvak, per plaats, per soort van de inkomsten en kosten en door het vergelijken van actuele gegevens met een budget. Deze aanvullende methoden voor het analyseren van gegevens worden dan beschouwd als dimensies.[3] Omdat er meer dan drie dimensies in een OLAP-systeem kunnen zijn wordt soms de term hyperkubus gebruikt.
Bron: http://nl.wikipedia.org/wiki/Cube_(informatica)
Full transcript