Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

SZGTF

No description
by

László Kármán

on 7 May 2017

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of SZGTF

XML-deklaráció Opcionális (XML 1.0-ban)
Ha van, akkor megelőz mindent (megjegyzést kivéve)
A feldolgozó alkalmazásoknak szól
Fontos információk a dokumentumról
Nyitó elem: <?
Kulcsszó: xml
Záró elem: ?>
Például:
<!-- XML -->
<?xml version=”1.0” ?> Dokumentumtípus deklaráció Kulcsszó: SYSTEM vagy PUBLIC
SYSTEM: a DTD egy meghatározott személyhez vagy szervezethez kötött
PUBLIC: a DTD-t egy szabványalkotó testület hozta létre, vagy egyszerűen csak a nagyközönség rendelkezésére áll:
<!-- SGML/XML -->
<!DOCTYPE dokumentum SYSTEM ... > vagy
<!DOCTYPE dokumentum PUBLIC ... > Feladat #8 DTD segítségével definiálj egy SGML alkalmazást az alábbi hallgatói index-részlet gépi ábrázolásához, adatcseréjéhez: Feltételesen kötelező elemek Forrás/Source
Hivatkozás a leírt dokumentum forrásául szolgáló dokumentumra.
A leírt dokumentum részben vagy egészben származhat egy másik dokumentumból. A hivatkozásban ajánlatos megadni a forrás hivatalos azonosítóját. Számítógépes tartalomfeltárás Kármán László Követelmények I. Környezetfüggetlen
Hordozható
Időtálló
Szabványos
Visszafelé kompatibilis
Gépi úton is feldolgozható
Megjelenítés és tartalom különüljön el
Adatok, metaadatok és alkalmazások elkülönítése Zárt és nyílt formátumok Zárt formátumok (de facto szabványok)
MS Office formátumok
Nyílt formátumok
Tex/LaTeX (kifinomult, de bonyolult)
RTF, Postscript, PDF
HTML (W3C) Alkalmazások, programcsomagok Alkalmazások, programcsomagok
„Office” csomagok (szövegszerkesztő, táblázatkezelő,bemutató-készítő, rajzoló stb.)
Kiadványszerkesztők
Levelezők
Böngészők
Egyéb Formátumok és alkalmazások viszonya Intelligens vagy buta formátumok
Intelligens vagy buta alkalmazások
Szűk keresztmetszet (bottleneck) mindkét szinten lehet
Piac befolyásoló eszköz: Adat és alkalmazás elkülönül-e (analógia: OS és Alkalmazás elkülönül-e)
Nyílt szoftverek
A zárt formátumok „modellezése” révén nyernek teret Kapcsolódó technológiák, fogalmak DTD, XML Schema
1987: TEI (nyelvészet, irodalom)
DocBook (műszaki)
RDF, Xforms, SOAP, OWL
XHTML, XSL, XSLT (Xerces, Xalan)
DOM, SAX
Unicode
DC, QDC, ESE, EDM, Lido
z39.50, ZING, z39.58 (CCL), OAI-PMH
OpenDocument, Open XML (MS) Felhasználási területei Adatszerkezetek leírása
Információkeresés megkönnyítése
Digitalizálási projektek
Gépi úton is értelmezhető szövegek előállítása
Dokumentumok újrahasznosítása
tartalom és forma szétválasztása
tartalom és struktúra felhasználható
már az Office csomagok is használják: pl.: OpenDocument, Open XML Az SGML hátrányai bonyolult
több fájlból áll (legalább SGML, DTD)
speciális szaktudást igényel
nem eléggé alkalmazás-orientált (drága szoftvercsomagok)

az XML „mindent visz” -> az SGML háttérbe szorul SGML/XML szintaktika #1 hangsúly az értelmi tagoláson
Példa: SGML/XML szintaktika Jelölőkódok
< STAGO (Start Tag Open) = a kezdő jelölőelem nyitó eleme
> STAGC (Start Tag Close) = a kezdő jelölőelem záró eleme
</ ETAGO (End Tag Open) = a befejező jelölőelem nyitó eleme
> ETAGC (End Tag Close) = a befejező jelölőelem záró eleme
SGML-ben átdefiniálhatóak SGML/XML szintaktika Hordozóelemek
kezdő jelölőelem (nyitó elem, záró elem)
tartalom
befejező jelölőelem (nyitó elem, záró elem) SGML/XML elemnevek Programozói hagyományok
elemnevek = változók, konstansok nevei
HTML örökség
Hossz
nem túl hosszú
mégis beszédes
Következetesség
konzekvens nevezéktan
elfogadott ajánlások: TEI, DocBook Normalizált forma <!-- SGML/XML -->
<antologia>
<vers>
<szerzo>Joszá Buszon</szerzo>
<versszak>
<sor>Bárányfelhő ezüst uszálya.</sor>
<sor>A béka elbűvölten nézi,</sor>
<sor>s lassan fordítja a fejét utána.</sor>
</versszak>
</vers>
<vers>
<szerzo>Joszá Buszon</szerzo>
<versszak>
<sor>Kilépek a büdös budiból. Szemben</sor>
<sor>gyönyörű lepke száll.</sor>
<sor>Elpirulok. Ezt most nem érdemeltem.</sor>
</versszak>
</vers>
</antologia> Befejező jelölőelem elhagyása <!-- SGML/XML -->
<antologia>
<vers>
<szerzo>Joszá Buszon</szerzo> 2. szabály
<versszak>
<sor>Bárányfelhő ezüst uszálya.</sor> 5. és 6. szabály
<sor>A béka elbűvölten nézi,</sor>
<sor>s lassan fordítja a fejét utána.</sor>
</versszak> 5. és 6. szabály
</vers> 1. és 3. szabály
<vers>
<szerzo>Joszá Buszon</szerzo>
<versszak>
<sor>Kilépek a büdös budiból. Szemben</sor>
<sor>gyönyörű lepke száll.</sor>
<sor>Elpirulok. Ezt most nem érdemeltem.</sor>
</versszak>
</vers>
</antologia> Minimalizált forma <!-- SGML -->
<antologia>
<vers>
<szerzo>Joszá Buszon
<versszak>
<sor>Bárányfelhő ezüst uszálya.
<sor>A béka elbűvölten nézi,
<sor>s lassan fordítja a fejét utána.
<vers>
<szerzo>Joszá Buszon
<versszak>
<sor>Kilépek a büdös budiból. Szemben
<sor>gyönyörű lepke száll.
<sor>Elpirulok. Ezt most nem érdemeltem.
</antologia> Minimalizálás összefoglaló Előnye
Jelölő elemek mennyisége kisebb
Tömörebb formátum
Esetenként olvashatóbb forma
Hátránya
Gépi kezelhetőség nehezebb
Esetenként nehezebben átlátható
Javaslat
Normalizált SGML
XML Attribútumok értéke XML-ben Megadása az elem kezdő jelölőelemében
attribútumnév=”érték” vagy
attribútumnév='érték'
Pl: <alma szin=”piros” mennyiseg=”2”>
Elemekkel is megoldható lenne: Attribútumok SGML-ben HTML példa: <hr noshade>
Nincs attribútum
Kapcsoló utasításként működik XML univerzális attribútumok Minden xml alkalmazásban ugyanaz a jelentésük
Előtag „xml:”
Foglalt attribútumok
nyelv azonosítására (xml:lang)
térközkarakterek értelmezésére (xml:space) Üres helyek megtartása <!-- SGML/XML -->
”...”
<resz tipus="fejezet"><fejresz><cim tipus="cim1">Névadónk, Neumann János</cim></fejresz>
”...”

<!-- SGML/XML -->
”...”
<resz tipus="fejezet">
<fejresz>
<cim tipus="cim1"> Névadónk, Neumann János</cim>
</fejresz>
"..." Üres helyek megtartása Megtartás xml:space=”preserve”
Normalizálás xml:space=”default”
Formázási lehetőség
xml:space=”preserve”
Halmozott szóközhasználat
megjelenítés: fix szélességű betűtípusok Példa \ /
-------
-| 0 0 |-
| o |
| --- |
-------

\ /
-------
-| 0 0 |-
| o |
| --- |
------- Feladat #2 Házirobotodat bevásárolni küldenéd. Alakítsd át az alábbi bevásárlólistát XML formátumra:

gyümölcs: alma (1kg), barack (2kg befőznivaló), szilva (1kg)
zöldség: répa (3 db), uborka (1 db), paradicsom (2 kg), paprika (5 db, lecsónak) Entitáshivatkozások Kezdő elem: „&”
Záró elem: „;”
Pl.:
&SZTE; -> Szegedi Tudományegyetem
&eacute; -> „é”
Helyettesítése a feldolgozóprogram feladata Példa <!-- SGML/XML -->
<!-- Ez egy egysoros megjegyzés. -->
<!-- Ez egy
többsoros
megjegyzés. --> Példa <!-- SGML/XML -->
<![CDATA[Az , , stb. vezérlőkódok a kimeneti állományban is ugyanezt a formát öltik.]]-->

Az , , stb. vezérlőkódok a kimeneti állományban is ugyanezt a formát öltik. Találj ki egy XML alkalmazást az alábbi versrészlet feldolgozására (szerző, cím, fordító, versszak, verssor megkülönböztetésével, az utóbbi kettő számozásával)
Ügyelj arra, hogy az XML részek eltávolításával visszakaphassuk az eredeti szöveget! Lucian Blaga:
HEGYI TAVAK KÖZÖTT

Megpihenünk itt fenn a pázsiton,
testünkben egy kis fáradság maradt.
Hegyi tavak között vagyunk, s gyönyörködünk.
A nap leáldozott ezüstös nyugaton.

A kristály levegőben odafenn
a sziklák, a fenyők s hegyi tavak,
még azok is, melyek távoliak,
kirajzolódnak élesen.

Mily nagy a csend! Tiszták a vonalak!
Mintha látnók, hogy a hegyi tavakkal
közelednek felénk a csillagok,
hogy minket félúton fogadjanak.

(Áprily Lajos fordítása) Találj ki egy XML alkalmazást az alábbi index részlet gépi ábrázolásához, adatcseréjéhez: Dokumentumtípus deklaráció Összetett adatszerkezet
Típusdefiníció: az adott DTD-hez tartozó dokumentumok milyen
elemeket, attribútumokat, értékeket és hivatkozásokat tartalmazhatnak
Karakterkészlet megadása
Szabályok az elemek elhelyezkedésére
Hierarchikus szerkezet megadása (fa-szerkezet) Külső DTD deklarációk A DTD-k szerkezeti felépítése Kulcsszavak illetve szintaktikai egységek
deklarációk
elem-típus deklarációk (ELEMENT)
attribútum-lista deklarációk (ATTLIST)
entitás deklarációk (ENTITY)
adatformátum deklarációk (NOTATION)
paraméter-egyed definíciók és hivatkozások
feldolgozási utasítások
megjegyzések Tartalmi modell Fa szerkezetben a „leveleken” többnyire PCDATA áll
Ha egy elem nem tartalmaz semmit, akkor ezt az EMPTY kulcsszóval jelöljük:
<!-- SGML/XML -->
<!ELEMENT sortores EMPTY>
Ha bármilyen gyerekelemet tartalmazhat (ritkán használt)
<!-- SGML/XML -->
<!ELEMENT sortores ANY> Találj ki egy XML alkalmazást az alábbi táblázat részlet gépi ábrázolásához, adatcseréjéhez, add meg a DTD-jét, és ennek megfelelően alakítsd át a táblázatot: Példa <!-- SGML/XML -->
<!ELEMENT lista (elemertek, elemertek+)>
<!ATTLIST lista
tipus (disk | decimal | upper-roman | none) "disk">
<!ELEMENT elemertek (#PCDATA)>

<lista>
<elemertek>deklarációk;</elemertek>
<elemertek>feldolgozási utasítások;</elemertek>
</lista>

•deklarációk;
•feldolgozási utasítások; Hat fő szövegtípus/kódkészlet Dokumentum-típus szerint
TEI.prose próza
TEI.verse vers
TEI.drama dráma
TEI.spoken lejegyzett beszéd
TEI.dictionaries nyomtatott szótárak
TEI.terminology terminológiai adatállományok 10 kiegészítő kódkészlet A szövegfeldolgozás céljától függően
A szöveg kiegészítő elemeire vonatkozóan
TEI.linkinghypertext kapcsolatok, mutatók jelölése
TEI.analysisanalitikus információk kódolása
TEI.fsstrukturális nyelvészeti és más elemzések eredményének kódjai
TEI.certaintya szöveg értelmezésekor, rögzítésekor felmerülő bizonytalanságok jelölése
TEI.transcrkéziratos források átírásánál használatos jelek
TEI.textcritkritikai szövegrögzítés
TEI.names.datesnevek és dátumok kódolása
TEI.netsgráfok, fák és hálózatok ábrázolása
TEI.corpusnyelvi korpuszok TEI P5 fejléc – metainformációk TEI fejléc – kötelező
A dokumentum leírását tartalmazza
4 alapvető eleme
<fileDesc> kötelező
<encodingDesc> opcionális
<profileDesc> opcionális
<revisionDesc> opcionális TEI fejléc szerkezet mélységei <!-- SGML/XML -->
”...”
<teiHeader>
<fileDesc>
<titleStmt/>
<editionStmt/>
<extent/>
<publicationStmt/>
<seriesStmt/>
<notesStmt/>
<sourceDesc/>
</fileDesc>
<!-- Ide kerül a TEI fejléc maradék része. -->
</teiHeader>
”...” Szövegtest példa <!-- SGML/XML -->
<body lang=”hu”>
<div0>
<div1 type="chapter" n="1">
<head>
<title type="title1">Hatvan perc!</title>
</head>
<p/>
</div1>
<div1 type="chapter" n="2">
<head>
<title type="title1">A temetési ima</title>
</head>
<p/>
</div1>
<div1 type="chapter" n="3">
<head>
<title type="title1">Tallérossy Zebulon</title>
</head>
<p>A tor mindenképpen ... nem tósztoznak benne.</p>
<p/>
</div1>
</div0>
</body> Lekérdezési problémák Sokféle adatbázis / szoftver / kereső protokoll / interfész
Nem csak a könyvtárakban
Hálózati, együttműködési lehetőségek
Nehézkes többet egyszerre lekérdezni Kis z39.50 történet Kezdetek: 1970-es évek
Verziók (1-2-3): 1988, 1992, 1995
Jól használható lett
A mai napig széles körben alkalmazott
Library of Congress gondozza
Jövő
ZING (z39.50 International: Next Generation)
SRU/SRW „iker” protokoll
SRU (REST) -> XML válasz
SRW (SOAP) -> XML válasz
OAI-PMH Architektúra Programok közötti protokoll
Kliens oldal: eredet
Szerver oldal: cél
Közöttük: üzenetek
Üzenetek
Kérdés
Válasz Főbb z39.50 szolgáltatások II. 3-as verzió újdonságai
Rendezés (Sort)
Böngészés (Scan)
Kibővített szolgáltatások (Extended services)
Tájékoztatás (Explain)
Befejezés (Close) Keresés - kötelező Keresőkérdés
Eredmény
Rendezett találati halmaz
Válasz akár egy vagy több rekorddal Törlés, Hozzáférés ellenőrzés Törlés
Találati halmazok törlése
Hozzáférés ellenőrzés
Cél ellenőrzi az eredetet
Jelszó
Titkosítás
Egyéb Kibővített szolgáltatások Feladatcsomagok
Létrehozása
Módosítása
Törlése
z39.50 szabványon kívüli feladatok elvégzésére
karbantartás
helyi funkciók
stb. Keresőkérdés összeállítása Keresőkérdés: RPNQuery
Proximity (logikai) operátorok
AND
OR
AND NOT
Tetszőleges, összetett keresőkérdés
Attribútum halmazok segítségével Bib-1 attribútum halmaz A táblázat oszlop-folytonosan olvasandó! Erősségek, gyengeségek A klasszikus DC elemkészlet 15 adatelemből áll
Erősségek
Elég egyszerű
Olcsó
Átjárható (együttműködéshez)
Gyengeségek
Túl egyszerű
Behatárolt lehetőségek Kötelező adatelemek Téma/Subject
A dokumentum tartalmát leíró tárgyszavak, illetve kifejezések vagy osztályozási jelzetek.
A dokumentum tartalmát leíró kulcsszavak, kifejezések vagy osztályozási jelzetek. Ajánlatos előírt tárgyszójegyzék (tézaurusz) vagy hivatalos (szabványos) osztályozási rendszer (pl. az ETO) használata Kötelező adatelemek Formátum/Format
A dokumentum megjelenésének formája és megjelenítésének módja, eszköze.
Ide tartozik: a médium, adathordozó fajtája és terjedelme (mérete), a hozzáférés módja, a működési követelmények (szoftver, hardver vagy egyéb, a dokumentum használatához szükséges eszközök, az elérés lejárati ideje). Nem kötelező elemek Tartalmi leírás/Description
A dokumentum tartalmának összegző leírása.
Szabad szöveges összefoglalás, kivonat, tartalomjegyzék. Nem kötelező elemek Kapcsolat/Relation
Hivatkozás a dokumentummal kapcsolatos másik dokumentumra.
A hivatkozásban ajánlatos megadni a kapcsolódó dokumentum hivatalos azonosítóját. Források: z39.50 Burmeister Erzsébet, Timár Zsolt: A Z39.50 protokoll és könyvtári alkalmazása Magyarországon és a világban http://www.niif.hu/rendezvenyek/networkshop/97/tartalom/NWS/3/3/index.htm
Burmeister Erzsébet: A z39.50 információkeresési szabvány és alkalmazása http://mek.oszk.hu/03100/03108/index.phtml
Vajda Mária: Nem cél, csak egy újabb állomás http://tmt.omikk.bme.hu/show_news.html?id=2157&issue_id=62
Wikipedia http://en.wikipedia.org/wiki/Z39.50
z39.50 Maintenance Agency http://www.loc.gov/z3950/agency/ Elérhetőségek Kármán László
lkarman@monguz.hu
+36-20/383-9119
http://www.monguz.hu Feladat - kérdés Információk
tárolása
megőrzése
újrahasznosítása
cseréje
folyamatosan változó hardver és szoftver környezetben
Létezik-e univerzális formátum? Követelmények II. Nyílt (közösség fejleszti), elterjedt
Független (non-profit) szervezet gondozza
Egyszerű (szöveges nem bináris)
Szöveges és WYSWYG editorokkal is szerkeszthető
Nemzeti karakterkészletek támogatása
Jogosultságok támogatása
Verziók támogatása Szöveges és bináris formátumok Szöveges formátumok
Akár embert által is olvasható, értelmezhető
Egyszerű szövegszerkesztővel szerkeszthető
Bináris formátumok
Gépi úton olvasható
Speciális szoftverekkel kezelhető
Esetenként tömörebb (vagy tömörített) formátum Van-e univerzális formátum? Szent Grál keresése
Nem teljesen lehetetlen
Maga a formátum a lehető legtöbb követelménynek tegyen eleget Leíró nyelvek története GenCode, TeX, LaTeX
1969: GML (Generalized Markup Language)
1978-1986: SGML (ISO szabvány)
1991: HTML (W3C)
1996-1998: XML ajánlás (W3C)
1998-: az XML széles körű alkalmazásai Az SGML Standard Generalized Markup Language - szabványos általános jelölő nyelv
dokumentumok belső szerkezetének leírására
metanyelv
szabvány: ISO8879-1986
10 évig szinte változatlan Az SGML előnyei általánosan elfogadott, gyártófüggetlen szabvány
az SGML-ben feldolgozott szöveges információk
szerkezete ember és gép számára egyaránt leírható
megjelölhetőek, azonosíthatóak a fontosabb részek
gépi, platformfüggetlen feldolgozása, felhasználhatósága
újrafelhasználhatóak, konvertálhatóak
elterjedtség (múlt és jövő) XML tervezés: 10 cél (#1-4) könnyű használhatóság
néhány SGML konvenció elhagyása
DTD nélkül is felhasználható legyen
széles körű alkalmazhatóság
SGML kompatibilitás
az SGML részhalmaza
SGML eszközökkel is feldolgozható
könnyű szoftveres támogathatóság XML tervezés: 10 cél (#5-8) korlátozott opcionális lehetőségek
ugyanazt a célt kevesebb úton lehessen elérni
érthetőség, olvashatóság ember által
XML gyors fejlesztése és szabványosítása
formális és tömör tervezés
az XML formális nyelv
(FNY: véges ábécéből generálható, véges hosszúságú szavak halmaza) XML tervezés: 10 cél (#9-10) Dokumentumok könnyű létrehozhatósága szöveges szerkesztőktől a WYSWYG editorokig
Nem kell minimalizálni
a jelölők nem elhagyhatók mint az SGML/HTML-ben Az SGML/XML jelölésrendszer az SGML/XML nem programozási nyelv!!!
XML programok jelyett XML struktúrák
könnyű elsajátítani
HTML-hez képest „új” szemlélet
leíró jelölés vs. műveleti jelölés Leíró és műveleti jelölés Leíró jelölés
nevekkel azonosít, kategorizál
pl.: <cím>, <szerző>, <versszak>
elválik a tartalom a formától
Műveleti jelölés
szekvenciális
milyen utasítást kell végrehajtani egy ponton
pl. formázás
HTML: leíró -> műveleti SGML/XML szintaktika #2 Észrevétel
a tag-ekben nincsenek ékezetek
a hordozhatóság miatt (7 bites ASCII karakterek)
ugyanakkor ez nem megkötés
Elemek (elements)
jelölőkódokkal körülvett
szerkezeti egységek
szabadon definiálhatóak SGML/XML elemnevek Nincsenek előre definiálva
Definiálásuk – SGML/XML alkalmazás
Hosszuk nincs korlátozva
Karakterek
kezdő: betűk, „_”, „:”
folytatás: u.a. és számok, „.”, „-”
whitespace tilos: szóköz, TAB, sorvégjelek SGML/XML elemnevek Kisbetűk/nagybetűk
XML-ben megkülönböztetjük
Általában
csupa kisbetű (jobban tömöríthető)
csupa nagybetű (jobban elkülönül a tartalomtól) <NEV>Kovács János</NEV>
vegyes (tömören is olvashatóbb) <testuleti_nev>...</testuleti_nev> <TestuletiNev>...</TestuletiNev> Elemek egymásba ágyazása hierarchia, szülő-gyerek viszony
gyökérelem HTML példa: <html> … </html>
elemek „egymásba ágyazása”
fa struktúrában is ábrázolható
Példa:
<!-- SGML/XML -->
<bekezdes> A szövegben lehet <kiemeles> kiemelés </kiemeles> és <labjegyzet> lábjegyzet </labjegyzet> is.</bekezdes> Üres elemek nincs hordozott szöveg
hosszú forma <sortores></sortores>
rövid forma: <sortores/>
csak SGML-ben: <sortores>
példa sortörésre
XHTML (XML): <br/>
HTML (SGML): <br> Minimalizálási lehetőségek csak SGML-ben!
minimalizálás nélkül: normalizált forma
normalizált SGML = XML
DTD-ben
szabályokat definiálhatunk
ezeket felhasználva egyes elemeket elhagyhatunk Minimalizálási lehetőségek Példa szabályokra (formálisan DTD-ben írjuk le):

1. Az antológia csakis verseket tartalmazhat, semmi mást.
2. A versnek legfeljebb egy címeleme van, mégpedig az első versszak előtt, a címelemet pedig a szerző neve előzi meg.
3. A címtől és a szerzőtől eltekintve a vers versszakokból áll.
4. A versszakok csak sorokat tartalmaznak, és minden sor csakis versszakon belül állhat.
5. A versszak után vagy egy másik versszak következik, vagy a vers vége.
6. A sor után vagy egy másik sor következik, vagy egy új versszak. Kezdő jelölő elem elhagyása Példa
versszak után biztosan sor megtartjuk a záró elemet -> a nyitó elhagyható
sor után sor vagy versszak vége megtartjuk a záró elemet -> a nyitó elhagyható
<versszak>
Bárányfelhő ezüst uszálya. </sor>
A béka elbűvölten nézi, </sor>
s lassan fordítja a fejét utána. </sor>
</versszak> Üres befejező jelölőelem egyértelmű esetben elhagyható az elemnév
<!-- SGML -->
”...”
<versszak>
<sor>Kilépek a büdös budiból. Szemben</>
<sor>gyönyörű lepke száll.</>
<sor>Elpirulok. Ezt most nem érdemeltem.</>
</versszak>
”...” Üres kezdő jelölőelem üres lehet, ha megegyezik az előző kezdővel
<!-- SGML -->
”...”
<versszak>
<sor>Kilépek a büdös budiból. Szemben</sor>
<>gyönyörű lepke száll.</sor>
<>Elpirulok. Ezt most nem érdemeltem.</sor>
</versszak>
”...” SGML/XML attribútumok Jellemzi az elem adott előfordulását attribútum ~ jellemző
Az elem paramétere
Módosíthatja annak jelentését
Adott elemen belül egyedi
Az elemhez „tartozik” különböző elemeknél ugyanaz az elnevezés -> különböző attribútum Elem vs. attribútum: szabályok Elemként a dokumentum szerkezeti összetevőit jelöljük.
Az elemek neve mindig az általuk hordozott tartalomra utal.
Attribútumként azokat a tulajdonságokat jelöljük, amelyek az elemet többletinformációval látják el – jellemzik az elemet. Példa <!-- SGML/XML -->
<antologia>
<vers azon=”V1” statusz=”publikalt”>
<szerzo>Petőfi Sándor</szerzo>
<cim>Méz és csók</cim>
<versszak>
<sor>Kis méh! te a füvet, fát,</sor>
"..." SGML/XML attribútumnevek Ld. SGML/XML elemnevek
Nincsenek előre definiálva
Hosszuk nincs korlátozva
Karakterek
kezdő: betűk, „_”, „:”
folytatás: u.a. és számok, „.”, „-”
whitespace tilos: szóköz, TAB, sorvégjelek
XML: kisbetű/nagybetű különböző Nyelv azonosítása -> „xml:lang” Az „xml:lang” attribútum értéke token (jel)
Nyelvi token 4 lehetséges sémája
ISO 639 (két karakteres) pl.: xml:lang=”en”
felhasználó által definiált („x-” prefix) pl.: xml:lang=”x-hungarian”
IANA kód („i”-vel vagy „I”-vel kezdődik) pl.: xml:lang=”i-hungarian”
részkódok pl.: xml:lang=”en-US” Üres helyek megtartása Jelentéssel nem bíró üres helyek: az olyan elemek közötti üres helyek, melyek között nincs tartalmi rész
Jelentéssel bíró üres helyek: tartalmi részt hordozó elemek közötti üres helyek
Normalizálás
a feldolgozó szoftvertől függ
befolyásolható -> xml:space attribútum Példa <!-- XML -->
<bekezdes xml:space=”preserve”>
\ /
-------
-| 0 0 |-
| o |
| --- |
-------
</bekezdes> Attribútum értékek Idézőjelek vagy aposztrófok között
Tartalmazhat whitespace karaktereket
CR, LF, szóköz, tabulátor -> szóköz Feladat #1 Az alábbi szöveg egy lehetséges feldolgozása XML elemek és attribútumok segítségével. Jelöljük a szerzőt, a címet, az alcímet, a versszakokat és a sorokat, és az utóbbiakat számozzuk is meg.
Ügyelj arra, hogy az XML részek eltávolításával visszakaphassuk az eredeti szöveget! François Villon:
NÉGYSOROS VERS,
melyet Villon halálítélete szélére írt

Francia vagyok Párizs városából,
mely lábam alatt a piszkos mélybe vész,
s most méterhosszan lógok egy nyárfaágról,
és nyakamon érzem, hogy seggem míly nehéz. Házirobotod az alábbi receptet választotta mára, de elromlott a humán kimenete, ezért kinyomtatta a receptet XML formátumban. Alakítsd szöveges formátumra, hogy a nagymama is megértse:
<recept id=”23” mennyiseg=”4 személyre”>
<nev>
Filézett vegyes hal nyersen
</nev>
<hozzavalok>
<hozzavalo mennyiseg=”0,5 kg” id=”1”> harcsa </hozzavalo>
<hozzavalo mennyiseg=”0,5 kg” id=”2”> ponty </hozzavalo>
<hozzavalo id=”3”> só </hozzavalo>
</hozzavalok>
<elkeszites>
A vegyes halat gondosan megpucoljuk, filézzük, ízlés szerint sózzuk és nyersen tálaljuk.
</elkeszites>
</recept> Entitások Eddig a dokumentum struktúrájával foglalkoztunk
Most a tartalommal
Tetszőleges részek hordozható
kódolása
azonosítása
entitások (egyedek) segítségével Entitások SGML-ben gyakori a használatuk
XML-ben főleg a speciális karakterek kódolására
Egyéb felhasználás
Adatok átemelése külső fájlból
Bináris adatok (pl. képek) beillesztése
Rövidítések bevezetése dokumentum szinten Entitáshivatkozások Karakterentitás-hivatkozások
&#...;
&#x...;
Decimális hivatkozások
… -> szám: karakter helye a karakterkészletben
7-bites ASCII32: 0-127 ( &#65; -> „A”)
8-bites ISO8859-1: 0-255
Hexadecimális hivatkozások
&#x00E9; -> „é” Beépített entitáshivatkozások (foglalt karakterek) &lt; a < helyett – decimális ASCII kódja: &#60;
&gt; a > helyett – decimális ASCII kódja: &#62;
&amp; az & helyett – decimális ASCII kódja: &#38;
&apos; a ’ helyett (attribútum-értékekben) – decimális ASCII kódja: &#39;
&quot; a ” helyett (attribútum-értékekben) – decimális ASCII kódja: &#34; Megjegyzések Nyitó elem: <--!
Záró elem: -->
A megjegyzés elem tartalmát a feldolgozó figyelmen kívül hagyja
Akár több sorban is
Általában magyarázatot, hozzáfűzéseket tartalmaz
„Emberi” felhasználásra Nem elemzett karakteres adatok Vezérlőkódokkal (ld. jelöléshatárolók-kal megegyező karakterek használata)
pl.: &lt; a „<” helyett, &gt; a „>” helyett
halmozott használata kényelmetlen:
<!-- SGML/XML -->
Lapozáshoz nyomja meg a &lt;&lt;&lt;SPACE billentyűt&gt;&gt;&gt;

Lapozáshoz nyomja meg a <<<SPACE>>> billentyűt Nem elemzett karakteres adatok Alakítsd XML formátumra az alábbi (egyszerűsített) HUNMARC rekord részletet:

005 20040114000000.0
035 a 79675
035 a 180349
040 a KÉE
b hun
d MVK
245 a Aktív jódtartalmú fertőtlenítőszerek üzemi alkalmazása a borászatban
b Applicatiob of disifectants with active iodine content in wineries
c Edelényi Miklós, Sárkány Péter
300 a 139-150. p.
500 a Angol és orosz nyelvű összefoglalóval.

HUNMARC segítség:
http://www.bdtf.hu/konyvtar/oktatas/marc/hunmarc.htm XML-deklaráció Három részből áll
verzió (version) kötelező, általában „1.0”
kódolás (encoding) opcionális, pl.: „iso-8859-2”
egyedülálló (standalone) opcionális, lehetséges értékei „yes” / „no” a feldolgozást befolyásolja-e külsőleg meghatározott deklarációkészlet Dokumentumtípus deklaráció SGML-ben kötelező, XML-ben opcionális
Nyitó elem: <!
Kulcsszó: DOCTYPE
Záró elem: >
Példák:
<!-- SGML -->
<!DOCTYPE név kulcsszó külső-azonosító [definíciók]>

<!-- XML -->
<?xml version=”1.0” ... ?>
<!DOCTYPE név kulcsszó külső-azonosító [definíciók]> Dokumentumtípus deklaráció A DOCTYPE-ot követő név a dokumentum gyökércsomópontját azonosítja, pl.:

<!-- SGML/XML -->
<!DOCTYPE dokumentum ... >
<dokumentum>
”...”
</dokumentum> Dokumentumtípus deklaráció Külső-azonosító
SYSTEM kulcsszó esetén egy URI
PUBLIC esetén valamilyen publikus azonosító egy URI
<!-- SGML/XML -->
<!DOCTYPE dokumentum SYSTEM ”dokumentum.dtd” ... >

<!DOCTYPE dokumentum PUBLIC ”-//MONGUZ//DTD JaDoX.TEI-LIGHT.DTD//HU”
”http://www.monguz.hu/dtd/tei-light.dtd” ... > Dokumentumtípus deklaráció [definíciók] rész: entitások vagy belső DTD használata esetén érdekes
a gyakorlatban a dokumentumtípus-deklaráció akkor jelenik meg, amikor egy külső fájlban található DTD-re hivatkozunk, egyébként ritkán. Belső DTD deklarációk Vegyes DTD deklarációk Dokumentumtípus deklaráció Helyes (valid) SGML/XML
ha megfelel a hozzá tartozó DTD-nek
XML esetében
a DTD használata opcionális
és van más módszer is (XML Schema) A deklarációk szintaxisa XML <!kulcsszó név (tartalmi modell)>
SGML <!kulcsszó név minimalizálási szabályok (tartalmi modell)> Elem-típus deklarációk Új elemet határozhatunk meg
Megadhatjuk a hozzá tartozó elemtartalmat
Példa:
<!-- XML -->
<!ELEMENT antologia (vers+) >
<!ELEMENT vers (szerzo?, cim?, versszak+) >
<!ELEMENT szerzo (#PCDATA) >
<!ELEMENT cim (#PCDATA) >
<!ELEMENT versszak (sor+) >
<!ELEMENT sor (#PCDATA) > Elem-típus deklarációk Felépítésük XML-ben
Nyitó elem: <!
Kulcsszó: pl. ELEMENT
Név: pl. antológia
Tartalmi modell: pl. (vers+)
A fentieket white space karakterek választják el Elem-típus deklarációk Felépítésük SGML-ben
Hasonló, de az elemnév és a tartalmi modell között helyet kap a
Minimalizálási szabály (-/o) kötelező/ opcionális Elem-típus deklarációk Példa:
<!-- SGML -->
<!ELEMENT antologia - - (vers+) >
<!ELEMENT vers - O (szerzo?, cim?, versszak+) >
<!ELEMENT szerzo - O (#PCDATA) >
<!ELEMENT cim - O (#PCDATA) >
<!ELEMENT versszak - O (sor+) >
<!ELEMENT sor - O (#PCDATA) > Elem-típus deklarációk <!-- SGML -->
<antologia>
<vers>
<szerzo>Petőfi Sándor
<cim>Méz és csók
<versszak>
<sor>Kis méh! te a füvet, fát,
<sor>S virágokat leped,
<sor>Hogy édes kelyheikből
<sor>Gyüjthessed mézedet.
<versszak>
<sor>Kis méh! Lidim füvet, fát
<sor>S virágokat nem lep,
<sor>Mézednél csókja mégis
<sor>Mi sokkal édesebb.
<!-- Antológiáról lévén szó, itt további versek következnek. -->
</antologia> Tartalmi modell A deklaráció utolsó része
Kerek zárójelek között áll
Megszabja, hogy az adott elem mit tartalmazhat
Megadható
Más elemekkel való összefüggéssel
Vagy szabványos kulcsszavakkal Pl: „PCDATA” - tetszőleges, elemzett karakter adat Előfordulási gyakoriság Gyakoriság-jelző: egy elem hányszor fordulhat elő
+ (plusz): legalább egyszer, de akár többször is
? (kérdőjel): legfeljebb egyszer
* (csillag): vagy egyszer sem, vagy egyszer, vagy akár többször is Feladat #7 Adj meg egy lehetséges DTD-t az alábbi XML szövegrészlethez
<recept>
<nev>
Filézett vegyes hal nyersen
</nev>
<hozzavalok>
<hozzavalo> harcsa </hozzavalo>
<hozzavalo> ponty </hozzavalo>
<hozzavalo> só </hozzavalo>
</hozzavalok>
<elkeszites>
A vegyes halat gondosan megpucoljuk, filézzük, ízlés szerint sózzuk és nyersen tálaljuk.
</elkeszites>
</recept> Feladat #9 A sarki kisboltba e-mailben is küldhetsz bevásárlólistát, hogy az árút elő tudják készíteni számodra. Sajnos, csak XML formátumú rendeléseket fogadnak el, ezért alakítsd át az alábbi listát, és add meg az alkalmazott DTD-t is:

tejtermék: tej (2l; 2,8%-as), vaj (25 dkg), tehéntúró (50 dkg)
pékárú: kenyér (1 kg; rozsos), zsömle (5 db; szezámmagos), kifli (10 db)
édesség: túró rudi (2 db, málnás) Találj ki egy XML alkalmazást az alábbi versrészlet feldolgozására. Ügyelj arra, hogy az XML részek eltávolításával visszakaphassuk az eredeti szöveget!
(készítsd el a DTD-t és dolgozd fel a szöveget szerző, cím, verssor stb. megkülönböztetésével, az utóbbi számozásával):

ÉVSZAKOK
KLASSZIKUS JAPÁN HAIKU MŰFORDÍTÁSOK
BARCZIKAY ZOLTÁN és BAKOS FERENC fordításai
Nagyvilág, 2005/10. szám, 772-774. oldal

Hét vonással
az örrökkévalóság -
hamuba írva
....................................... Barczikay Zoltán

Téli haiku
fordításába fogva -
betakarózom
................................. Bakos Ferenc Dokumentumtípus deklaráció Sorrendiség, csatolójelek
Ha az elem-típus deklaráció tartalmi modellje több komponenst tartamaz
Megadható a sorrendiség
„,” az összetevők ebben a sorrendben jelenhetek meg
„|” az összetevők közül csak az egyik jelenhet meg
„&” mindkét összetevőnek meg kell jelennie, de tetszőleges sorrendben Attribútum-lista deklarációk Attribútumok: további információkat tartalmaznak az elemről, annak tartalmáról
Az elemtől függetlenül, de vele összefüggésben deklaráljuk
Kulcsszó: „ATTLIST”
Szerkezet: <!ATTLIST elem-név attribútum-név attribútum-típus alapérték> Szerkezet <!ATTLIST elem-név attribútum-név attribútum-típus alapérték>
elem-név: mely elemhez kapcsolódik
attribútum-név: az attribútum neve
attribútum-típus: attribútum érték típusa
alapérték: alapértelmezett érték
attribútumonként egy-egy sor a deklaráción belül Attribútum-típusok Értelmezés: az első név az SGML-ben használt alak, a / utáni pedig az XML-ben
CDATA/CDATA: Az attribútum csak karakteres adat lehet. Ezt az adattípust az értelmező nem dolgozza fel, változatlan formában átengedi az ellenőrzésnél.
ENTITY/ENTITY: Az attribútumban egy entitásra vonatkozó hivatkozás található.
ENTITIES/ENTITIES: Több entitást is meg lehet adni referenciaként. Az egyedeket egy listában, egymástól térköz karakterekkel elválasztva kell megadni.
ID/ID: Az attribútum egyedi azonosító, mely a dokumentum egy meghatározott pontját adja meg.
IDREF/IDREF: Az attribútum referenciát tartalmaz egy ID-re, mely a DTD egy más pontján van deklarálva. (Az ID-ket a dokumentum tartalmának hiperhivatkozásokkal való jelölésére használhatjuk.) IDREFS/IDREFS: Olyan, mint az IDREF, de itt az attribútum ID-k egy listáját tartalmazza.
NAME/NMTOKEN: Az attribútum értéke lehet bármilyen szó vagy lexikális elem – szám, betű, írásjelek (kötőjel, kettőspont, aláhúzásjel).
NAMES/NMTOKENS: Egymástól szóközzel elválasztott NMTOKEN értékek listája.
NMTOKEN/NMTOKEN, NMTOKENS/NMTOKENS, NUMBER/NMTOKEN, NUMBERS/NMTOKENS, NUTOKEN/NMTOKEN, NUTOKENS/NMTOKENS,
NOTATION/NOTATION: Az attribútum értéke egy NOTATION adattípus, melynek deklarációja a DTD egy másik pontján helyezkedik el.
Felsorolás/Felsorolás: A lehetséges értékek egy listáját tartalmazza. A listát zárójelek közt kell elhelyezni, ahol az adatok függőleges vonallal vannak elválasztva egymástól. A konkrét érték mindig a felsorolás valamelyik eleme kell, hogy legyen. Alapértelmezett érték Kulcsszavak:
#REQUIRED (kötelező): Mindenképpen meg kell adnunk valamely értéket
#IMPLIED (hallgatólagos, bennfoglalt): Nem muszáj megadnunk értéket – ilyen például az előzőekben az ID esete
#FIXED (rögzített): jelzi, hogy az attribútum neve után megadott érték rögzített, tehát nem változik, állandó
#CURRENT (aktuális, legutóbbi): Ha az adott elemnél nem adunk meg attribútumot, akkor az attribútum az ilyen típusú elemnél legutóbb megadott attribútumértéket veszi fel Példánkban a <lista> kettő vagy több <elemertek>-et tartalmazhat. Ezt a megszorítást azért tettük, mert úgy véljük, felsorolást csak abban az esetben szabad használni, ha annak legalább két eleme van.
A tartalmi modellben tehát beállítottuk, hogy a <lista> tartalmazhasson egy <elemertek> elemet, majd ezt kövesse – a vessző („,”) jel miatt – egy vagy több <elemertek> – a plusz („+”) jel miatt.
A <lista> elem kapott egy „tipus” attribútumot, ami a felsorolt értékek valamelyikét veheti fel – a függőleges vonal („|”) jel miatt –, a "disk" pedig alapértelmezett.
Mindez azt eredményezi, hogy listatípus beállításának elmaradása esetén körrel jelölt lesz a felsorolás.
Az <elemertek> tartalma bármilyen normál, feldolgozható karakteres adat lehet – #PCDATA Szövegjelölés TEI DTD alapján SGML/XML általánosan bővíthető jelölések
DTD-vel meghatározható konkrét alkalmazásuk
De-facto szabvánnyá vált DTD-k
TEI, TEI-Lite: irodalmi szövegek feldolgozásához
DocBook: könyv, cikk és referencia adatok feldolgozásához
stb. TEI Text Encoding Inititative Szövegkódolási kezdeményezés
1987-től
számítógépes nyelvészeti és irodalmi kutató szervezetek által
ajánlás géppel olvasható szövegek
kódolására
közvetítésére
cseréjére Felhasználási területei általános tartalmú szövegek
szépirodalmi művek
kritikai kiadások
történeti források
élőszöveg átiratok
elektronikus feldolgozására TEI verziók, konzorcium TEI P1 –> TEI P5
2000: TEI konzorcium (kormányzati támogatással)
2002: TEI P4 -től XML támogatással
2007: TEI P5
XML támogatás
SGML mellett XML DTD
XML Schema TEI szűkítések TEI Lite
egyszerűsített változat
TEI-kompatibilis
Pizza Chief
online eszköz
TEI konform DTD-k létrehozására
„wizard” jellegű működés Két új szövegtípus/kódkészlet TEI P4-től
TEI.generaláltalános típusú dokumentumok
TEI.mixedvegyes típusú dokumentumok 11. kiegészítő kódkészlet TEI P4-től
TEI.msdescription kéziratos, vagy korai nyomtatású anyagok leírásához szükséges elemkészlet TEI fejléc szerkezet <teiHeader>
<fileDesc>
<!-- Az adott elektronikus fájl teljes bibliográfiai leírását tartalmazza. -->
</fileDesc>
<encodingDesc>
<!-- Leírja az elektronikus és a forrásszöveg közötti kapcsolatot. -->
</encodingDesc>
<profileDesc>
<!-- A szöveg nem bibliográfiai jellegű tulajdonságait írja le, különös tekintettel
a megjelenítésre, a nyelvhasználatra és az elrendezésre. -->
</profileDesc>
<revisionDesc>
<!-- Összegzi a fájlon végzett javításokat. -->
</revisionDesc>
</teiHeader> TEI P5 szövegstruktúra <!-- SGML/XML -->
”...”
<TEI>
<teiHeader/>
<text>
<front/>
<body/>
<back/>
</text>
</TEI> TEI P5 szövegstruktúra text
front: címoldal leírása (előszó, köszönetnyilvánítás, ajánlás, összegzés, tartalomjegyzék és az esetleges címlapfotó)
body: tényleges szövegtartalom (egyes fejezetek, szakaszok,mottó, ajánlás, nyelvhasználat, egyéb szemantikai tulajdonságok, címhierarchia)
back: glosszárium, jegyzetek, index, bibliográfia és appendix Címoldal példa <!-- SGML/XML -->
”...”
<front>
<titlePage>
<docTitle>
<titlePart type="main">A kőszívű ember fiai</titlePart>
</docTitle>
<docAuthor>Jókai Mór</docAuthor>
<docImprint>
<publisher>Akadémiai Kiadó</publisher>
<pubPlace>Budapest, Magyarország</pubPlace>
</docImprint>
</titlePage>
</front>
”...” Példa: vers <TEI>
<text>
<body>
<div type="vers">
<head>
<title>Juhász Gyula: Örök zene</title>
</head>
<lg>
<l>Gondolj el nem múló zenékre lelkem,</l>
<l>Száz csillagokon fönn az égi kertben.</l>
</lg>
<lg>
<l>És éjszakára, melynek tükörében</l>
<l>Elsápad minden árnyék földön, égen.</l>
</lg>
<lg>
<l>Ember Fiára, ki lenn járt e tájon,</l>
<l>Hogy minden szív eztán remélve fájjon,</l>
<l>...</l>
</lg>
</div>
</body>
</text>
</TEI> Megoldás Egyezmények
keresési modell (RPN Boole-keresés)
kommunikációs protokoll
keresőkérdés
rekordformátum
Egységes lekérdező protokoll: z39.50
Z szerverek a meglévő rendszerekhez
Z kliensek a lekérdezéshez
z39.50/Web gateway-ek Főbb z39.50 szolgáltatások I. 43 z39.50 szolgáltatás a szabványban
1-es és 2-es verzió
Kezdeményezés (Init)
Keresés (Search)
Megjelenítés/Visszaküldés (Present)
Törlés (Delete)
Hozzáférés ellenőrzés (Access control)
Erőforrás jelentés (Resource report) Kezdeményezés - kötelező Javaslat kezdő paraméterekre akár többször
Z kapcsolat létrejön
Verzió egyeztetés
További kompatibilitási egyeztetés milyen műveltek engedélyezettek
Üzenetméret, rekorméret egyeztetése
stb. Visszaküldés - kötelező Megjelenítés szolgáltatás - Kötelező
Rekordok adott pozíciótól
Rekordszerkezet megadása
Szegmentálás szolgáltatás
Nagy halmaz esetén rekordok átküldése csomagokban Erőforrás ellenőrzés Erőforrás ellenőrzés
Előre megállapított keretek túllépése
Cél kezdeményezi
Indított erőforrás ellenőrzés
Eredet kezdeményezi
Erőforrás jelentés
Befejezett műveletre
Befejezett Z kapcsolatra Rendezés, Böngészés Találati halmazok
Egyesítése
Rendezése
Rendezés
Mely elemekre
Növekvő / csökkenő
Kis és nagybetűk kezelése
Böngészés
Rendezett listákra (szerző, cím, tárgyszó stb.) Tájékoztatás Cél lehetőségeinek lekérdezése
Kereshető adatbázisok listája
Használt attribútum halmazok
Rekordszintakszis
stb.
Dedikált adatbázisban (IR-Explain-1)
z39.50 protokollal lekérdezhető
Előre definiált kérdések Befejezés Standard
Minden aktív művelet befejezve
Z kapcsolat megszüntetése
Hiba következtében
költségek túllépése
biztonság megsértése
aktivitás hiánya
protokollhiba
stb. Dublin Core Metaadat Kezdeményezés DCMI: Dublin Core Metadata Initiative
1995-ben kezdeményezték (Dublin, Ohio)
könyvtárosok
elektronikus források szakértői
tartalom-szolgáltatók
OCLC Kutatási és Speciális Projekt Iroda gondozta
Most: DCMI nyílt, publikus, non-profit cég Adatelemek 15 db, mind
Ismételhető
Sorrendjük nem meghatározott
Minősítőkkel finomítható a jelentés Kötelező adatelemek Cím/Title
A dokumentumban szereplő szó, kifejezés vagy egyéb jelcsoport, amely a dokumentum megnevezésére szolgál.
Kitüntetett szerepe van a főcímnek, illetve az egységesített címnek, amelyek nem ismételhetők. Valamennyi további cím ismételhető (pl. alcím, párhuzamos cím, címváltozat). Kötelező adatelemek Kiadó/Publisher
Az a természetes vagy jogi személy, vagy jogi személyiséggel nem rendelkező gazdasági társaság, aki/amely anyagi és/vagy irányítási, igazgatási felelősséget vállal a dokumentum nyilvánossághoz közvetítéséért.
A dokumentum kiadójának a neve. Kötelező adatelemek Dátum/Date
A dokumentumhoz kapcsolódó események dátuma.
A dokumentum létrehozásával, nyilvánossághoz közvetítésével kapcsolatos időpont. Megadása az ISO 8601 előírásai szerint ajánlatos. Kötelező adatelemek Típus/Type
A dokumentum típusát, műfaját, általánosabb sajátosságait jelölő kifejezés.
A dokumentum fizikai (digitális) megjelenítésének megnevezését a "Formátum" adatelemben kell megadni. Kötelező adatelemek Azonosító/Identifier
A dokumentumot egyértelműen azonosító kód.
Pl.:
URI=Uniform Resource Identifier
DOI=Digital Object Identifier
ISBN=International Standard Book Number Feltételesen kötelező elemek Létrehozó/Creator
Aki/amely a dokumentum vagy annak fő része szellemi tartalmának alkotója, aki/amely e tartalomért elsősorban felelős.
A szellemi (szakmai, tudományos, irodalmi, művészi stb.) tartalom létrehozójának a neve. Feltételesen kötelező elemek Nyelv/Language
A dokumentumban előforduló szövegek nyelve.
Az ISO 639 háromjegyű azonosító kódja. Megfelelője magyarországi használatra az MSZ 3400-2001 Feltételesen kötelező elemek Jogok/Rights
Adatok a dokumentum felhasználásával kapcsolatos jogokról.
Jogkezelésre vonatkozó adatok, amelyek kiterjedhetnek a szellemi, szerzői és különböző tulajdonosi jogokra. Nem kötelező elemek Közreműködő/Contributor
Aki/amely a dokumentum szellemi tartalmának alkotásában részt vesz, és a létrehozóhoz képest alárendelt, illetve járulékos szerepet tölt be, illetve aki/amely a dokumentum valamely járulékos részének létrehozója.
A szellemi tartalom létrejöttéhez hozzájáruló(k) neve. Nem kötelező elemek Tér-idő vonatkozás/Coverage
A dokumentum tartalmának térbeli vagy időbeli vonatkozásai.
Földrajzi (térbeli) nevek vagy időbeli adatok(időhatárok), amelyekre a dokumentum vonatkozik (amelyeket magába foglal). Ajánlatos földrajzi nevek tézauruszának használata, illetve az időhatárok megadása számokkal kifejezve. Open Archives Initiative Digitális tartalmakkal rendelkező archívumok, repozitóriumok együttműködésére
Szolgáltatási pont (Service provider)
Begyűjtés (harvest)
Adatgazda (Data Provider
Adatszolgáltatás OAI protokoll OAI-PMH: Open Archives Initiative Protocol for Metadata Harvesting
V2.0
Metaadatok:
Legalább Dublin Core
Támogathat mást is
XML fromátumban
HTTP protokoll felett Források: SGML/XML/TEI Bíró Szabolcs: Szövegfeldolgozás XML alapokon
Elektronikus formában:
http://www.tankonyvtar.hu/hu/tartalom/tkt/szovegfeldolgozas-xml Források: DC/OAI http://en.wikipedia.org/wiki/Dublin_Core
http://dublincore.org/
http://en.wikipedia.org/wiki/Open_Archives_Initiative SGML/XML, TEI, z39.50, OAI-PMH, DC Monguz Kft. <!-- SGML/XML -->
<konyv>
<szerzo>
<vezeteknev>Petőfi</vezeteknev>
<keresztnev>Sándor</keresztnev>
</szerzo>
<cim>Petőfi Sándor összes költeményei</cim>
<kiado>Szépirodalmi Könyvkiadó</kiado>
<hely>Budapest</hely>
<ev>1955</ev>
</konyv> <alma>
<szin> piros </szin>
<mennyiseg> 2 </mennyiség>
</alma> Feladat #3 Feladat #5 Feladat #6 Feladat #10 Feladat #11 Feladat #4 Keresőkérdés példa: 1,1; 2,3; 3,3; 4,2; 5,3; 6,1; "arany"
Jelentése: személynévre keresünk; egyenlőséget; bárhol a mezőben; szót; balról és jobbról csonkolva; nem teljes almezőben; és a keresett szó: "arany"
Full transcript