Suomalainen yleisontologia YSO ja keskitetty, kansallinen ja avoin ontologiapalvelu ONKI
Lyhyt johdatus RDF:ään
Matias Frosterus,
Mikko Lappalainen,
Susanna Nykyri,
Tuomas Palonen
Kansalliskirjasto, Onki-projekti
24.5.2013
Lyhyt johdatus RDF:ään
Literaali
- RDF on W3C:n standardi metadatan esitykseen ja vaihtoon webin yli
- RDF ei luo siiloja
- Kaksi RDF-dokumenttia on helppo yhdistää
- Samat URIt samoille asioille
- URIen peilaukset
Resurssi
Kolmas URI
URI = yksilöivä tunniste
Toinen URI
Lyhyt oppimäärä
- Merkitykset eksplisiittisesti ja koneluettavassa muodossa
- Semantiikka
RDF – Resource Description Framework
Ontologioiden peilaaminen
Ontologiat
- Hiljainen tieto
- Yleistieto
- Jos eri sovellusalat ja niillä toimivat organisaatiot käyttävät tiedon indeksoinnissa samoja käsitetunnisteita (URI) samoista asioista, niin järjestelmien integrointi helpottuu.
- Ontologia on jonkin aihealueen käsitteiden eksplisiittinen määrittely
- Käsitehierarkia, joka kuvaa käsitteiden väliset suhteet
- Kieliriippumaton
- Eri ontologioilla annotoidut aineistot saadaan integroitua toisiinsa, kun ontologiat peilataan toisiinsa
Tutkimushankkeesta
tuotantoprojektiksi
Onki-projekti
- Vanhojen ratkaisujen kriittinen tarkastelu
- Osa päätöksistä on tehty kauan sitten
- Fokus on muuttunut
- Tutkimisesta toimimiseen
- ONKI-projekti on Kansalliskirjaston, opetus- ja kulttuuriministeriön ja valtiovarainministeriön yhteisprojekti
- Ensimmäinen osuus päättyy 31.3.2014
- Suunniteltu jatkumaan vuoteen 2017
Tavoitteet
Tutkimushankkeesta tuotantoprojektiksi
- Tarjota pysyvä, keskitetty, Kansalliskirjaston ylläpitämä ontologiapalvelu
- Tarjota pysyvä, keskitetty, Kansalliskirjaston ylläpitämä ontologiapalvelu
- Ontologioiden julkaisu
- Ontologioiden käyttö
- Selailu
- Rajapinnat
- Ohjeita ja tietoa
- Perustuu avoimeen lähdekoodiin
- ONKI
- Vakaus, nopeus, käytettävyys
- Käyttötarpeet ja vastaako niihin
- YSO
- Käyttötarpeiden selvittäminen
- Kriittinen tarkastelu vastaako niihin
- Mahdolliset hierarkiamuutokset
- Mahdolliset skeemamuutokset
- Jatkokehitys
Ontologia tietojenkäsittelytieteessä
Tietojenkäsittelytieteessä ontologialla tarkoitetaan tietyn aihealueen käsitteistön eksplisiittistä mallia. Ontologia kuvaa aihealueeseensa kuuluvat käsitteet ja niiden väliset suhteet formaalisti koneluettavassa muodossa. Tesaurukseen verrattuna ontologian käsitteiden suhteet on määritelty yhtäältä tarkasti useita eri suhdetyyppejä käyttäen ja toisaalta hierarkialtaan kattavasti koko käsitteistön osalta. Ontologiaan on mahdollista lisätä myös logiikkaa (esim. sääntö, jonka mukaan painava objekti ei voi samanaikaisesti olla kevyt). Ontologiaa voidaan käyttää koneellisessa päättelyssä ja objektien luokittelussa, toisin kuin asiasanastoa. Asiasanasto voidaan muuntaa ontologiaksi rikastamalla sitä semanttisesti.
Ontologia filosofian osa-alueena
- ns. yleinen metafysiikka
- tutkii olemisen ja olemassaolon kategorioita ja olevaisen perimmäistä laatua
- mitä tyyppiä olevia asioita on olemassa ja minkälaisia suhteita niiden välillä on
- tutkimusta olevasta itsenään, ei olevasta sellaisena kuin se ilmenee
Ontologia?
Kiitos!
matias.frosterus@helsinki.fi
mikko.lappalainen@helsinki.fi
susanna.nykyri@helsinki.fi
tuomas.palonen@helsinki.fi
onki-posti@helsinki.fi
mieli
merkitys
mieli
Perusperiaatteita (Guarino, 1998)
Luokittelun teoriaa ja periaatteita
(Hjørland 2005)
- Käsitteiden luokittelu määrittyy tiettyjen, valittujen kriteerien kautta. Tämä pitää tiedostaa. Kriteerien on oltava linjassa luokittelun päämäärien kanssa.
- Luokittelukriteerit ovat alakohtaisia ja alan sisälläkin on vaihtelua (teoriat, näkökulmat).
1. Ole selvillä ontologiasi alasta. Mikä tahansa formaali teoria on teoria tietystä määritetystä alasta, joka täytyy määrittää ennen aloittamista
2. Eristä perustason taksonominen struktuuri
- Kategoriat
- ”ominaisuusjoukot”, maailman perusluokitus ominaisuuksien mukaan
- Ei selkeärajaisia identiteettikriteerejä
- Eivät voi saada suoraan instansseja
- Esim. ”ilmiö”: ajallisia ja paikallisia ominaisuuksia, ”objekti”: yhtenäisyys, jatkuvuus
- Luokat eli käsitteet
- Kuuluvat omaan kategoriaansa
- Täyttävät tietyt indentiteettikriteerit
- Esim. kissaeläimet
3. Identifioi roolit selkeästi
- Voidaan piilottaa tarvittaessa perusrakenteen hahmottamiseksi
- Voidaan tehdä päätelmiä jotka tuovat yhteen myös toisensa
- poissulkevia ominaisuuksia sisältäviä käsitteitä
- Esim. määritelty ”mies ei voi olla nainen”, kuitenkin rooli ”bussikuski” voi päteä mieheen tai naiseen
ø
Posivitismi =
luokittelun voi tehdä
neutraalisti
Pragmatismi =
luokitteluun liittyy aina
jokin päämäärä
Viittaussuhteista
Viittaussuhteista
Semanttinen kolmio
YSOn haasteita
- ihmiset eivät kohtaa ympäröivää maailmaa tai luontoa suoraan, vaan kohtaaminen on sosiokulttuurisesti välittynyt. Keskeisessä asemassa tässä ovat symbolit.
- Symbolit voivat olla sanoja, kuvia, esineitä tai toimintatapoja. Ne tarkoittavat tai edustavat jotain muuta, viittaavat siis itsensä ulkopuolelle.
- Tämä viittaussuhde on arbitraarinen, mikä ei tarkoita sattumanvaraisuutta vaan sitä, että kyseinen suhde ei ole ainoa mahdollinen (vrt. Borgesin fiktiivinen luettelo).
[Sosiaaliantropologian perusteet]
- Ihmiset eivät kohtaa ympäröivää maailmaa tai luontoa suoraan, vaan kohtaaminen on sosiokulttuurisesti välittynyt. Keskeisessä asemassa tässä ovat symbolit.
- Symbolit voivat olla sanoja, kuvia, esineitä tai toimintatapoja. Ne tarkoittavat tai edustavat jotain muuta, viittaavat siis itsensä ulkopuolelle.
- Tämä viittaussuhde on arbitraarinen, mikä ei tarkoita sattumanvaraisuutta vaan sitä, että kyseinen suhde ei ole ainoa mahdollinen (vrt. Borgesin fiktiivinen luettelo).
- [Sosiaaliantropologian perusteet]
ihmiset eivät kohtaa ympäröivää maailmaa tai luontoa suoraan, vaan kohtaaminen on sosiokulttuurisesti välittynyt. Keskeisessä asemassa tässä ovat symbolit.
Symbolit voivat olla sanoja, kuvia, esineitä tai toimintatapoja. Ne tarkoittavat tai edustavat jotain muuta, viittaavat siis itsensä ulkopuolelle.
Tämä viittaussuhde on arbitraarinen, mikä ei tarkoita sattumanvaraisuutta vaan sitä, että kyseinen suhde ei ole ainoa mahdollinen (vrt. Borgesin fiktiivinen luettelo).
[Sosiaaliantropologian perusteet]
- C.K. Ogdenin ja I.A. Richardsin (1923) esittämä klassinen kolmio, joka havainnollistaa symbolin, käsitteen (thought or reference) ja tarkoitteen (referent) suhdetta
- Karlsson (2004) pelkistää -> kieli, mieli ja maailma
- valinnoissa näkyy usein yksilöllinen tulkinta:
- keskinäinen toiminta
- ilmaisu
- nauru
- käsitteitä on usein tulkittu kirjaimellisesti:
- käyttö
- ajankäyttö, huumeidenkäyttö, kielenkäyttö
- yläkäsite tuo usein yhteen alakäsitteitä, jotka eivät ole keskenään yhteismitallisia:
- toiminnan johtaminen
- orkesterinjohtaminen, pedagoginen johtaminen, etäjohtaminen
lisäryhmittely auttaisi
YSOn kieliasuongelmia
kieli
maailma
symboli
tarkoite
- kieliasu on usein vaikuttanut luokitteluun
- siirto
- hiustensiirto, maansiirto, tiedonsiirto
- kieliasu on vaikuttanut myös siten, että on luotu keinotekoisia käsitteitä:
- tiedonsaanti vs. ravinnonsaanti
- saanti (kognitio) - saanti (muutos)
- tiedonsaanti - ravinnonsaanti
- käsitteisiin viittaavat kielikohtaiset termit tuovat esiin kielialueiden erot ja kirjaimellisen tulkinnan ongelmat
- tarvikkeet (eng. ?)
- lisätarvikkeet (eng. extra equipment)
- pakkaustarvikkeet (eng. packaging materials)
- taloustarvikkeet (eng. household supplies)
maailmam
Borges
Eläimet jakautuvat seuraaviin ryhmiin: a) keisarille kuuluvat; b) balsamoidut; c) kesytetyt, d) siat; e) merenneidot, f) tarunomaiset, g) juoksukoirat, h) tässä luokitellut, i) ne jotka riehuvat kuin hullut, j) lukemattomat, k) hienonhienolla kamelinkarvasiveltimellä piirretyt, l) muut, m) juuri kukkaruukun rikkoneet, n) juuri nahkansa luoneet, o) etäältä kärpästä muistuttavat… (Jorge Luis Borges 1964)
Lähteitä ja lisätietoa
Ontologia YSOssa
- Borges, Jorge Luis1964: The Analytical Language of John Wilkins (Teoksessa J.L. Borges, Other inquisitions, 1937-1952, 1964)
- Guarino, Nicola 1998: "Some Ontological Principles for Designing Upper Level Lexical Resources." http://arxiv.org/pdf/cmp-lg/9809002.pdf
- Hjørland, Birger 2008: Core Classification Theory. Journal of Documentation. Vol. 64 No. 3.
- Karlsson, Fred 2004. Yleinen kielitiede. Helsinki: Yliopistopaino.
- Ogden, C. K. and I. A. Richards, I. A. 1923: The Meaning of Meaning: A Study of the Influence of Language Upon Thought and of the Science of Symbolism. London: Routledge & Kegan Paul.
- Sosiaaliantropologian perusteet = Tapaninen, Anna-Maria 16.9.2003. Helsingin yliopisto, Sosiologian laitos. Sit. 6.5.2013. URL: http://www.avoin.helsinki.fi/oppimateriaalit/sosiologia/materiaali/luku7.html
- onki-posti@helsinki.fi
- Wiki-sivusto:
- https://wiki.helsinki.fi/display/ONKI/
Kuvat
k
Kuva 1: Semanttinen kolmio, ks. Odgen & Richards 1923 ja Karlsson 2004
Kuva 2 & 3: Giuseppe Arcimboldo, "Vegetables"
Kuva 4: Elokuvasta "The Black Cat" (1934, ohj. Edgar G. Ulmer)
Kuva 5: Fingerpori 17.5.2013, Helsingin Sanomat, URL: http://www.hs.fi/fingerpori/s1305678907624
ä
s
i
Ontologia
t
e
t
e
t
e
h
u
s
t
1. Käsitteet
2. Käsitteiden väliset suhteet
3. URIt