Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Information - Struktur - Code - Wissen? Hinweise zur automatischen Verarbeitbarkeit von Webinhalten am Beispiel der Wikipedia

No description
by

Ulrike Henny

on 18 July 2017

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Information - Struktur - Code - Wissen? Hinweise zur automatischen Verarbeitbarkeit von Webinhalten am Beispiel der Wikipedia

Information Struktur Code Wissen?
Hinweise zur automatischen Verarbeitbarkeit von Webinhalten am Beispiel der Wikipedia
Methodik
Beispiele
Technik
Informationsquellen verstehen
Daten sammeln
Daten verarbeiten
Services/Tools nutzen
Deutsche Schriftsteller
Datensammlung
Pseudocode!
Lege eine Zieldatei an
Verarbeite die A-Z-Liste
Für jeden Buchstaben gehe zur Buchstabenseite
Für jeden Eintrag gehe zur Dichterseite
Lege einen Datensatz an
Hole Daten und lege sie ab
Geburtsjahr
Zahl fremdsprachiger Wikipedien
Geburtsort
Der Wolf und die sieben jungen Geislein
Deutsche U-Boote 2. WK
Nobelpreisträger
Eine Welt aus Daten
Automatisches Sammeln
Wissen?
Jenseits der Zahlen?
Qualitäten
Brücken schlagen
Präsentationen
Internet
Verschiedendste Quellen
Zugänglichkeit für automatisierte und sytematisierte Nutzungen
Adressierbarkeit
Erreichbarkeit (frei)
Formate (Bild, Text, HTML, XHTML, XML)
Einhaltung der Standards
Seiten vs. Services/Schnittstellen
Datenanreicherung
Linkverfolgung
Normdaten
Services
Coding & Tools
Generativität
Dynamik
Visualisierung
technische Qualität
Zuverlässigkeit
Vollständigkeit
Kategorisierungen
Homogenität
Repräsentativität
"Vertrauen": Proof/Trust
Quellenkritik
Quantifizierung / Berechenbarkeit
Qualitative Fragestellungen
Werkzeuge?
Operationalisierung
Verknüpfung und Verarbeitung von Informationen
Aufdecken von Strukturen und Zusammenhängen
Interpretation
Formalisieren 1
xml
stylesheet
template
result-document name=
schriftstellerdaten.xml
<schriftstellerdaten>

for-each select=
Buchstabe aus der Liste

for-each select=
Schriftstellerseite, die auf der Buchstabenseite verlinkt ist
<schriftsteller>
<geboren>
value-of select=
Das, was in dem Kategorien-Link hinter "Kategorie:Geboren" steht
</geboren>
<wikipedien>
value-of select=
Zähle die Listeneinträge im Abschnitt "p-lang"
</wikipedien>
<geburtsort>
value-of select=
Der Inhalt des ersten Links hinter dem ersten Wort " in "
</geburtsort>
</schriftsteller>
</schriftstellerdaten>
Input HTML
Struktur XML
Navigation XPath
Transformation XSLT
Output HTML/JS
Technik, konkret
"hand made" (standards)
HTML, PDF
SVG
libraries
infovis (javascript)
google chart tool
google maps
simile timeline
services
europeana 4D
tools
tesla
voyeur
Formalisieren 2
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="2.0">
<xsl:template match="/">
<xsl:result-document href="
schriftstellerdaten.xml
">
<schriftstellerdaten>

<xsl:for-each select="
//a[starts-with(@title,'Liste')]
">


<xsl:for-each select="
document(@href)//div[@id='mw-content-text']//document(a/@href)
">

<schriftsteller>
<geboren>
<xsl:value-of select="
//a[starts-with(@title,'Kategorie:Geboren')]/substring-after(@title,'Kategorie:Geboren ')
"/>
</geboren>
<wikipedien>
<xsl:value-of select="
count(//div[@id='p-lang']//li)
"/>
</wikipedien>
<geburtsort>
<xsl:value-of select="
//div[@id='bodyContent']/p[1]/a[contains(preceding::text()[1],' in ')][1]
"/>
</geburtsort>
</schriftsteller>

</xsl:for-each>
</xsl:for-each>

</schriftstellerdaten>
</xsl:result-document>
</xsl:template>
</xsl:stylesheet>
Datensammlung
Schriftsteller in Wikipedia
ca. 5300 Artikel
Name, Geschlecht
Geburtsdatum, Geburtsort, Sterbedatum
Fremdsprachige Wikipedien
Berufsbezeichnung, Berufskategorie
Nationalität
Werke
Bild
Normdaten (GND, VIAF)
Schlachten der hispanoamerikanischen Unabhängigkeitskriege
Datenverarbeitung
Pseudocode!
Schreibe eine Zieldatei ...
... ein bisschen HTML, ein paar Javascript-Schnipsel
An der richtigen Stelle im Javascript müssen Werte berechnete Werte eingefügt werden
für das 16.-20. Jahrhundert ...
bilde eine Gruppe der dort geborenen Schriftsteller
zähle die männlichen und weiblichen Schriftsteller
Achsenbeschriftung nicht vergessen
Formalisieren 1
xml
stylesheet
template
<html><head>

google-javascript einbinden
Datentabelle schreiben
Die Spalten seien
'Jahrhundert', 'Männer', 'Frauen'

for-each-group select=
Schriftsteller mit Geburtsjahren, die mit 15, 16, 17, 18 oder 19 anfangen

group-by=
15,16,17,18, 19


Es sei eine Variable anzahlMänner - Zähle die Männer in dieser Gruppe


Es sei eine Variable anzahlFrauen - Zähle die Frauen in dieser Gruppe

Schreibe Datenfelder:
aktuelle Gruppe +1
'Jh.',
anzahlMänner
,
anzahlFrauen
Formalisieren 2
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="2.0">
<xsl:template match="/">
<html>
<head>
<script type="text/javascript" src="https://www.google.com/jsapi"></script>
<script type="text/javascript">
google.load("visualization", "1", {packages:["corechart"]});
google.setOnLoadCallback(drawChart);
function drawChart() {
var data = google.visualization.arrayToDataTable([
['
Jahrhundert
', '
Männer
', '
Frauen
'],
<xsl:for-each-group select="
//geboren[number(substring(., 1, 2)) = (15,16,17,18,19)]
" group-by="
number(substring(., 1, 2))[. = (15,16,17,18,19)]
">
<xsl:sort select="current-grouping-key()" />
<xsl:variable name="
anzahlMänner
" select="
count(//schriftsteller[geschlecht = 'Mann'][number(substring(geboren, 1, 2)) = current-grouping-key()])
" />
<xsl:variable name="
anzahlFrauen
" select="
count(//schriftsteller[geschlecht = 'Frau'][number(substring(geboren, 1, 2)) = current-grouping-key()])
" />

['
<xsl:value-of select="current-grouping-key() + 1" />
. Jh.',
<xsl:value-of select="
$anzahlMänner
" />
,
<xsl:value-of select="
$anzahlFrauen
" />]
<xsl:if test="position() != last()">
,
</xsl:if>
</xsl:for-each-group>

]);
var options = { vAxis: {title: '
Schriftsteller
'}
};
var chart = new google.visualization.ColumnChart(document.getElementById('
chart_div
'));
chart.draw(data, options);

}
</script>
</head>
<body>
<h1>
Männliche und weibliche deutsche Schriftsteller über die Jahrhunderte
</h1>
<div id="
chart_div
" style="width: 900px; height: 500px;"></div>
</body>
</html>
</xsl:template>
</xsl:stylesheet>
Produziertes
HTML/Javascript
UzK: Universität zu Köln
CCeH: Cologne Center for eHumanities
IDE: Institut für Dokumentologie und Editorik
HKI: Historisch-Kulturwissenschaftliche Informationsverarbeitung
z.B. AES / LWL: Unabhängige Berater
Full transcript