Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Klaster analiza

No description
by

Marko Stupar

on 28 October 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Klaster analiza

KLASTER ANALIZA
Klaster analiza
- Uvod
- Mere bliskosti
- Hijerarhijske metode
- Nehijerarhijske metode
- Klaster analiza u statističkom softveru
Prezentacija
- Uvod
- Merama bliskosti
- Hijerarhijskom metod
- Zaključak
MERE BLISKOSTI
-Koristimo za određivanje blizine među objektima
MERA RAZLIKE OBJEKATA
dij>0 ako se objekti i,j razlikuju
dij=dji uslov simetričnosti
dij<=dik+dkj nejednakost trouglova
MERE SLIČNOSTI
0<=dij<=1 uslov normalnosti
dij=1 ako su objekti i,j jednaki
dij=dji (Uslov simetričnosti)


Za početak...
- Ideja sortiranja
- Fundametalni proces u nauci
- Klaster analiza, uopšteno ime
- Ovom procedurom se formiraju klasteri, grupe
- Reorganizacija entiteta u homogene grupe
- Lakše organizovanje velikog broja podataka

MERE SLIČNOSTI I RAZLIKE ZA NEPREKIDNE PODATKE
- najčešće koristimo mere razlike

MERE SLIČNOSTI ZA KATEGORIČKE PODATKE

- koristimo mere sličnosti
- interval [0,1]

PRIMER
Posmatra se sedam karakteristika baštenskog cveća:
1. Da li biljka može da stoji u bašti kada dolazi do smrzavanja? (da=1, ne=0)
2. Da li može biljka da raste u hladu? (da=1, ne=0)
3. Da li se biljka razvija iz lukovice? (da=1, ne=0)
4. Boja cveta (bela=1, žuta=2, roza=3, crvena=4, plava=5)
5. Tip zemljišta u kojem biljka uspeva (1=suvo, 2=normalno, 3=vlažno)
6. Visina biljke (cm)
7. Idealno odstojanje između biljaka (cm)

- Biologija
- Genetika
- Hemija
- Medicina
- Kompijuterski inžinjering
- Matematika
- Statistika
Numeričke metode klasifikacije
klaster analize
- Cilj - Objektivna i stabilna klasifikacija
- Matrica podataka X
- nxp , n broj objkata a p broj promenljivih
- promenljive: neprekitdne, kategoričke ili
mešovite
- Matrica D - matrica sličnosti, razlike ili udaljenosti
MERE SLIČNOSTI ZA BINARNE PODATKE
- najčešća vrsta kategoričkih promenljivih
- polaznu osnovu tih mera predstavlja sledeća tabela kontigencije:

MERE SLIČNOSTI ZA KATEGORIČKE PODATKE SA VIŠE OD DVA NIVOA
-svaki nivo promenljive posmatra kao jedna promenljiva
-dodeli se iznos koji prima vrednost 0 ili 1 za svaku promenljivu k u zavisnosti da li su objekti isti u toj promenljivoj ili ne
MERE SLIČNOSTI ZA MEŠOVITE PODATKE
- Gower-ov koeficjent:
Želimo da odredimo koeficijent sličnosti za biljke 3 i 5. Pri tome, zna se da je opseg podataka za 6. promenjivu 180cm, a za 7. promenjivu je 50cm. Kako dve sadnice sa lukovicom imaju nešto slično, dok sadnice bez lukovice rastu na potpuno drugačiji način, to Wij3 iznosi 0 kada sadnice i i j nemaju lukovicu jer se smatra da taj podatak nije relevantan za računanje mere sličnosti, što je na primer slučaj za Camelia i Forget-me-not ( W353=0). Gower-ov koeficijent za ove dve sadnice iznosi:
HIJERARHIJSKI METOD
-2 grupe, hijerarhijski i nehijerarhijski
-metode udruživanja i deljenja
-jednom spojena 2 objekta ne mogu biti razdvojena

METODE UDRUŽIVANJA
- Standardne metode
(Jednostruko, kompletno, prosečno i centroidi)


PRIMER HIJERARHIJSKE METODE JEDNOSTRUKOG POVEZIVANJA:
Imamo matricu odstojanja:
Najmanji ne-nula element u matrici je za odstojanje objekata 1 i 2, tako da ćemo njih sada spojiti u jedan klaster. Rastojanje između ovog klastera i ostala tri se posmatra na sledeći način
Nova matrica izgleda ovako:
Najmanji element u D2 je odstojanje za objekte 4 i 5, tako da ovi objekti sada formiraju drugi dvočlani klaster i imamo novu matricu odstojanja određenu na sledeći način:
Dobijamo sledeću matricu:
Najmanje odstojanje je sada d(45)3 i sada se objekat 3 dodaje grupi koja sadrži objekte 4 i 5. Na kraju grupa objektima 1 i 2 i grupa sa objektima 3,4 i 5 se udružuju u jedan novi klaster
Full transcript