Het ontsluiten van Petabytes oud papier in Drupal

Het Nationaal Archief gebruikt Drupal voor de ontwikkeling van zowel haar grote publiekswebsite als hun site voor archiefprofessionals. Deze presentatie gaat over de keuze voor het CMS, de inrichting ervan en de leermomenten. Door Baris Wanschers en Jaap »
Baris Wanschers

Het ontsluiten van 
Petabytes oud papier
en hoe gebruikers hier waarde aan toevoegen
Technisch Projectleider bij het Nationaal Archief




ECM Specialist bij Sogeti
Jaap van der Velde



Baris Wanschers
Wat is het
De eisen aan het CMS
Wat doen wij?
Hoe is het nu ingericht?
Het dienen van ieders recht op informatie en het geven van inzicht in het verleden van ons land.

Beheer van de archieven van de Rijksoverheid, de Provincie Zuid-Holland en van organisaties en personen van nationaal belang (o.a. KNVB)

Miljoenen foto's
Hondderdduizenden kaarten
110 kilometer documenten
In de toekomst steeds meer digitale informatie

Grotendeels volledig openbaar
Gebruiksgemak
Rechtenstructuur
Groot aantal modules
Actieve community
Architectuur (inzet als platform)
Actief veiligheidsbeleid
Open source
Maak het de redacteur zo gemakkelijk mogelijk
Inpasbaarheid huidige en toekomstige diensten
Uitbreidbaarheid en openheid
Requirements
Hoe hebben we het ingericht?
Redactionele content in Drupal, archiefmateriaal erbuiten
Doorzoeken van de content mbv Apache Solr 
Schatting: 12-15 miljoen records, waarvan zo'n 6-10 miljoen fulltext
User-generated content in Drupal
Hierdoor krijgen ruwe documenten betekenis!
Uiteindelijke keuze: Drupal
Tekortkomingen
van Drupal
en hoe we het hebben opgelost
Drupal gaat uit van nodes (comments, search, etc)
Favorieten / bookmarks (ook op URLS)
Search met SOLR, maar content samenvoegen
Sessie opbouwen voor registratie/inloggen plaats vindt
Pager werkt niet goed bij duizenden pagina's
Schaghenbrief
Best practices
Code in SVN, met Hudson deployen (deels automatisch)
Modules beheren, en hoe hacken we contribs?






Blocks/regions zijn niet handig bij vele verschillende homepages -> Panels!
OTAP-omgevingen mbv Mode module
sites/all/contrib/cck
sites/all/contrib/views
sites/archief.nl/contrib/auto_nodetitle
sites/nationaalarchief.nl/contrib/pathauto
sites/nationaalarchief.nl/nationaalarchief/transcribe
sites/nationaalarchief.nl/patched/menublock/menublock.module
sites/nationaalarchief.nl/patched/menublock/t_wrappers.patch
Samenvatting
Mail: baris.wanschers@sogeti.nl
Twitter: @BarisW


Mail: jaapvandervelde@gmail.com
Twitter: @Grismar
Baris Wanschers
Jaap van der Velde
Drupal voor content creation van zowel medewerkers als users
Gebruik maken van de social community kanten van Drupal om bestaande content meer waarde te geven
Bewust niet alles in Drupal, sommige applicaties extern
Solr als krachtige search oplossing
Als aanvulling op de contrib modules gebruik maken van het Drupal framework om sneller en beter te ontwikkelen
Meer weten?
Hier is ghister ’t Schip ’t wapen van Amsterdam
aengekomen ende is den 23en September uyt Nieu Neder-
lant gezeylt uyt de Rivier Mauritius. rapporteren
dat ons volck daer kloec is ende vreedigh leven
hare vrouwen hebben ooc kinderen aldaer gebaert
hebben ’t eylant Manhattes van de wilde gekocht, voor
de waerde van 60 gulden. Is groot 11000 morgen.
hebben der alle koren half mey gezeyt, ende half
augusto gemayd. daer van zeyndende munsterkens
van zomer-koren, als taruw, Rogge, garst, haver
boucweyt, knarizaet, boontjens ende vlas.
Amsterdam
Arnhem
110 km!
Stukken (110km)
Kaarten (300,000+ stuks)
Foto's (4,000,000+ stuks)
Computerbestanden (your guess is as good as mine)
Anno 1626
Verrijking van data
Transcripties
Comments
Bookmarks
Etc
Betere pager (slided_pager)
"architectuur"
to use the term loosely
Architectuur!
No, really!
asd

Loading comments...

Please log in to add your comment.

Report abuse

More presentations by Baris Wanschers