Introducing 

Prezi AI.

Your new presentation assistant.

Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.

Loading…
Transcript

Suomalainen yleisontologia YSO ja keskitetty, kansallinen ja avoin ontologiapalvelu ONKI

Lyhyt johdatus RDF:ään

Matias Frosterus,

Mikko Lappalainen,

Susanna Nykyri,

Tuomas Palonen

Kansalliskirjasto, Onki-projekti

24.5.2013

Lyhyt johdatus RDF:ään

  • RDF ei luo siiloja

Literaali

  • RDF on W3C:n standardi metadatan esitykseen ja vaihtoon webin yli
  • RDF ei luo siiloja
  • Kaksi RDF-dokumenttia on helppo yhdistää
  • Samat URIt samoille asioille
  • URIen peilaukset

Resurssi

Kolmas URI

URI = yksilöivä tunniste

Toinen URI

Lyhyt oppimäärä

  • Merkitykset eksplisiittisesti ja koneluettavassa muodossa
  • Semantiikka

RDF – Resource Description Framework

Ontologioiden peilaaminen

Ontologiat

  • Hiljainen tieto
  • Yleistieto

  • Koneymmärrettävä muoto
  • Jos eri sovellusalat ja niillä toimivat organisaatiot käyttävät tiedon indeksoinnissa samoja käsitetunnisteita (URI) samoista asioista, niin järjestelmien integrointi helpottuu.
  • Ontologia on jonkin aihealueen käsitteiden eksplisiittinen määrittely
  • Käsitehierarkia, joka kuvaa käsitteiden väliset suhteet
  • Kieliriippumaton
  • Eri ontologioilla annotoidut aineistot saadaan integroitua toisiinsa, kun ontologiat peilataan toisiinsa

Tutkimushankkeesta

tuotantoprojektiksi

Onki-projekti

  • Vanhojen ratkaisujen kriittinen tarkastelu
  • Osa päätöksistä on tehty kauan sitten
  • Fokus on muuttunut
  • Tutkimisesta toimimiseen
  • ONKI-projekti on Kansalliskirjaston, opetus- ja kulttuuriministeriön ja valtiovarainministeriön yhteisprojekti
  • Ensimmäinen osuus päättyy 31.3.2014
  • Suunniteltu jatkumaan vuoteen 2017

Tavoitteet

Tutkimushankkeesta tuotantoprojektiksi

  • Tarjota pysyvä, keskitetty, Kansalliskirjaston ylläpitämä ontologiapalvelu
  • Tarjota pysyvä, keskitetty, Kansalliskirjaston ylläpitämä ontologiapalvelu
  • Ontologioiden julkaisu
  • Ontologioiden käyttö
  • Selailu
  • Rajapinnat
  • Ohjeita ja tietoa
  • Perustuu avoimeen lähdekoodiin
  • ONKI
  • Vakaus, nopeus, käytettävyys
  • Käyttötarpeet ja vastaako niihin
  • YSO
  • Käyttötarpeiden selvittäminen
  • Kriittinen tarkastelu vastaako niihin
  • Mahdolliset hierarkiamuutokset
  • Mahdolliset skeemamuutokset
  • Jatkokehitys

Ontologia tietojenkäsittelytieteessä

Tietojenkäsittelytieteessä ontologialla tarkoitetaan tietyn aihealueen käsitteistön eksplisiittistä mallia. Ontologia kuvaa aihealueeseensa kuuluvat käsitteet ja niiden väliset suhteet formaalisti koneluettavassa muodossa. Tesaurukseen verrattuna ontologian käsitteiden suhteet on määritelty yhtäältä tarkasti useita eri suhdetyyppejä käyttäen ja toisaalta hierarkialtaan kattavasti koko käsitteistön osalta. Ontologiaan on mahdollista lisätä myös logiikkaa (esim. sääntö, jonka mukaan painava objekti ei voi samanaikaisesti olla kevyt). Ontologiaa voidaan käyttää koneellisessa päättelyssä ja objektien luokittelussa, toisin kuin asiasanastoa. Asiasanasto voidaan muuntaa ontologiaksi rikastamalla sitä semanttisesti.

Ontologia filosofian osa-alueena

  • ns. yleinen metafysiikka
  • tutkii olemisen ja olemassaolon kategorioita ja olevaisen perimmäistä laatua
  • mitä tyyppiä olevia asioita on olemassa ja minkälaisia suhteita niiden välillä on
  • tutkimusta olevasta itsenään, ei olevasta sellaisena kuin se ilmenee

Ontologia?

Kiitos!

matias.frosterus@helsinki.fi

mikko.lappalainen@helsinki.fi

susanna.nykyri@helsinki.fi

tuomas.palonen@helsinki.fi

onki-posti@helsinki.fi

mieli

merkitys

mieli

Perusperiaatteita (Guarino, 1998)

Luokittelun teoriaa ja periaatteita

(Hjørland 2005)

  • Käsitteiden luokittelu määrittyy tiettyjen, valittujen kriteerien kautta. Tämä pitää tiedostaa. Kriteerien on oltava linjassa luokittelun päämäärien kanssa.
  • Luokittelukriteerit ovat alakohtaisia ja alan sisälläkin on vaihtelua (teoriat, näkökulmat).

1. Ole selvillä ontologiasi alasta. Mikä tahansa formaali teoria on teoria tietystä määritetystä alasta, joka täytyy määrittää ennen aloittamista

2. Eristä perustason taksonominen struktuuri

  • Kategoriat
  • ”ominaisuusjoukot”, maailman perusluokitus ominaisuuksien mukaan
  • Ei selkeärajaisia identiteettikriteerejä
  • Eivät voi saada suoraan instansseja
  • Esim. ”ilmiö”: ajallisia ja paikallisia ominaisuuksia, ”objekti”: yhtenäisyys, jatkuvuus
  • Luokat eli käsitteet
  • Kuuluvat omaan kategoriaansa
  • Täyttävät tietyt indentiteettikriteerit
  • Esim. kissaeläimet

3. Identifioi roolit selkeästi

  • Voidaan piilottaa tarvittaessa perusrakenteen hahmottamiseksi
  • Voidaan tehdä päätelmiä jotka tuovat yhteen myös toisensa
  • poissulkevia ominaisuuksia sisältäviä käsitteitä
  • Esim. määritelty ”mies ei voi olla nainen”, kuitenkin rooli ”bussikuski” voi päteä mieheen tai naiseen

ø

Posivitismi =

luokittelun voi tehdä

neutraalisti

Pragmatismi =

luokitteluun liittyy aina

jokin päämäärä

VS.

Viittaussuhteista

Viittaussuhteista

Viittaussuhteista

Semanttinen kolmio

YSOn haasteita

  • ihmiset eivät kohtaa ympäröivää maailmaa tai luontoa suoraan, vaan kohtaaminen on sosiokulttuurisesti välittynyt. Keskeisessä asemassa tässä ovat symbolit.
  • Symbolit voivat olla sanoja, kuvia, esineitä tai toimintatapoja. Ne tarkoittavat tai edustavat jotain muuta, viittaavat siis itsensä ulkopuolelle.
  • Tämä viittaussuhde on arbitraarinen, mikä ei tarkoita sattumanvaraisuutta vaan sitä, että kyseinen suhde ei ole ainoa mahdollinen (vrt. Borgesin fiktiivinen luettelo).

[Sosiaaliantropologian perusteet]

  • Ihmiset eivät kohtaa ympäröivää maailmaa tai luontoa suoraan, vaan kohtaaminen on sosiokulttuurisesti välittynyt. Keskeisessä asemassa tässä ovat symbolit.
  • Symbolit voivat olla sanoja, kuvia, esineitä tai toimintatapoja. Ne tarkoittavat tai edustavat jotain muuta, viittaavat siis itsensä ulkopuolelle.
  • Tämä viittaussuhde on arbitraarinen, mikä ei tarkoita sattumanvaraisuutta vaan sitä, että kyseinen suhde ei ole ainoa mahdollinen (vrt. Borgesin fiktiivinen luettelo).

  • [Sosiaaliantropologian perusteet]

ihmiset eivät kohtaa ympäröivää maailmaa tai luontoa suoraan, vaan kohtaaminen on sosiokulttuurisesti välittynyt. Keskeisessä asemassa tässä ovat symbolit.

Symbolit voivat olla sanoja, kuvia, esineitä tai toimintatapoja. Ne tarkoittavat tai edustavat jotain muuta, viittaavat siis itsensä ulkopuolelle.

Tämä viittaussuhde on arbitraarinen, mikä ei tarkoita sattumanvaraisuutta vaan sitä, että kyseinen suhde ei ole ainoa mahdollinen (vrt. Borgesin fiktiivinen luettelo).

[Sosiaaliantropologian perusteet]

  • C.K. Ogdenin ja I.A. Richardsin (1923) esittämä klassinen kolmio, joka havainnollistaa symbolin, käsitteen (thought or reference) ja tarkoitteen (referent) suhdetta
  • Karlsson (2004) pelkistää -> kieli, mieli ja maailma
  • valinnoissa näkyy usein yksilöllinen tulkinta:
  • keskinäinen toiminta
  • ilmaisu
  • nauru
  • käsitteitä on usein tulkittu kirjaimellisesti:
  • käyttö
  • ajankäyttö, huumeidenkäyttö, kielenkäyttö
  • yläkäsite tuo usein yhteen alakäsitteitä, jotka eivät ole keskenään yhteismitallisia:
  • toiminnan johtaminen
  • orkesterinjohtaminen, pedagoginen johtaminen, etäjohtaminen

lisäryhmittely auttaisi

YSOn kieliasuongelmia

kieli

maailma

symboli

tarkoite

  • kieliasu on usein vaikuttanut luokitteluun
  • siirto
  • hiustensiirto, maansiirto, tiedonsiirto
  • kieliasu on vaikuttanut myös siten, että on luotu keinotekoisia käsitteitä:
  • tiedonsaanti vs. ravinnonsaanti
  • saanti (kognitio) - saanti (muutos)
  • tiedonsaanti - ravinnonsaanti
  • käsitteisiin viittaavat kielikohtaiset termit tuovat esiin kielialueiden erot ja kirjaimellisen tulkinnan ongelmat
  • tarvikkeet (eng. ?)
  • lisätarvikkeet (eng. extra equipment)
  • pakkaustarvikkeet (eng. packaging materials)
  • taloustarvikkeet (eng. household supplies)

maailmam

Borges

Eläimet jakautuvat seuraaviin ryhmiin: a) keisarille kuuluvat; b) balsamoidut; c) kesytetyt, d) siat; e) merenneidot, f) tarunomaiset, g) juoksukoirat, h) tässä luokitellut, i) ne jotka riehuvat kuin hullut, j) lukemattomat, k) hienonhienolla kamelinkarvasiveltimellä piirretyt, l) muut, m) juuri kukkaruukun rikkoneet, n) juuri nahkansa luoneet, o) etäältä kärpästä muistuttavat… (Jorge Luis Borges 1964)

Lähteitä ja lisätietoa

Ontologia YSOssa

  • Borges, Jorge Luis1964: The Analytical Language of John Wilkins (Teoksessa J.L. Borges, Other inquisitions, 1937-1952, 1964)
  • Guarino, Nicola 1998: "Some Ontological Principles for Designing Upper Level Lexical Resources." http://arxiv.org/pdf/cmp-lg/9809002.pdf
  • Hjørland, Birger 2008: Core Classification Theory. Journal of Documentation. Vol. 64 No. 3.
  • Karlsson, Fred 2004. Yleinen kielitiede. Helsinki: Yliopistopaino.
  • Ogden, C. K. and I. A. Richards, I. A. 1923: The Meaning of Meaning: A Study of the Influence of Language Upon Thought and of the Science of Symbolism. London: Routledge & Kegan Paul.
  • Sosiaaliantropologian perusteet = Tapaninen, Anna-Maria 16.9.2003. Helsingin yliopisto, Sosiologian laitos. Sit. 6.5.2013. URL: http://www.avoin.helsinki.fi/oppimateriaalit/sosiologia/materiaali/luku7.html

  • onki-posti@helsinki.fi
  • Wiki-sivusto:
  • https://wiki.helsinki.fi/display/ONKI/

Kuvat

k

Kuva 1: Semanttinen kolmio, ks. Odgen & Richards 1923 ja Karlsson 2004

Kuva 2 & 3: Giuseppe Arcimboldo, "Vegetables"

Kuva 4: Elokuvasta "The Black Cat" (1934, ohj. Edgar G. Ulmer)

Kuva 5: Fingerpori 17.5.2013, Helsingin Sanomat, URL: http://www.hs.fi/fingerpori/s1305678907624

ä

s

i

Ontologia

t

e

t

e

t

e

h

u

s

t

1. Käsitteet

2. Käsitteiden väliset suhteet

3. URIt

Learn more about creating dynamic, engaging presentations with Prezi