Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Materiaaliteknisten mikroskooppikuvien analyysi logistisella

No description
by

Masi Valkonen

on 17 January 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Materiaaliteknisten mikroskooppikuvien analyysi logistisella

Contrast limited adaptive histogram equalization
Piirteen irrotus
Normalisointi
Jokaisen piirteen keskiarvo nollaksi
ja keskihajonta yhdeksi
Lasketaan histogrammin ekvalisointi ikkunoittain
Opetus
Käytettiin TTYn merope klusteria, koska 44x3000000 matriisi vei paljon keskusmuistia (~40GB)
lassoglm - matlabin oma funktio
Saadaan parametrit β0 ja
β
Contrast limited adaptive histogram equalization
Lasketaan histogrammin ekvalisointi ikkunoittain
Piirteen irrotus
β =
[0 0.3658 0 0 0.2373 0 ...]
Opitut parametrit β0

Normalisoidaan uudet piirteet samoilla arvoilla kuin opetusvaiheessa
Riittää että lasketaan vain osa piirteistä
Luokittelu
Opitut parametrit β0

Kynnystys
Normalisointi
Kynnystetään todennäköisyyskuva
p > 0.5 -> huokonen
p ≤ 0.5 -> ei huokonen
Ground truth kuvat
Kuviin merkattu käsin missä huokoset ovat

Yhteensä 42 piirrettä
Piirrematriisi
X
Piirrematriisi
X
Esikäsitelty kuva
Esikäsitelty kuva
Piirrematriisi
X
Piirrematriisi
X
Opetettu luokittelija
Todennäköisyyskuva
Ajo kesti ~48h yhdellä prosessorin ytimellä
Luokittelija
Materiaaliteknisten mikroskooppikuvien analyysi logistisella regressiolla
Nanomateriaalien tutkiminen nojautuu mikroskooppikuvien analysointiin
Paljon työstä tehdään vieläkin käsin

Vie aikaa
Työn tulos riippuu henkilöstä
Automaattinen analysointi nopeampaa ja tarkempaa
Kehitettiin menetelmät kahteen esimerkkitapaukseen käyttäen logistista regressiota
Työn tarkoitus:
Selvittää kuinka hyvin menetelmä soveltuu ongelmien ratkaisuun
Toteuttaa automaattiset menetelmät materiaalitutkijoille


Logistinen regressio
Johdanto
Esim. partikkelien pinta-alan tai muodon määrittäminen
Segmentointi
Tyypillinen tapa laskea huokosten keskimääräinen muoto
Erotellaan jokainen partikkeli kuvasta
Segmentoinnin jälkeen parametrien laskeminen suoraviivaista

Pinta-ala: punaisten pikselien lukumäärä
Lineaarinen tilastollinen luokittelija, jolla voidaan mallintaa näytteen todennäköisyyttä kuulua johonkin luokkaan
Malli sopii hyvin binääristen ilmiöiden ennustamiseen esim. kuuluuko pikseli haluttuun luokaan vai ei (segmentointi)
-> kahden luokan ongelma
Parametrit β0 ja
β
löydetään etsimällä
suurimman uskottavuuden estimaatti
(Maximum likelihood)
Löydetyt parametrit määrittävät uskottavimman todennäköisyysjakauman, josta opetusdata olisi voinut tulla.
Kun on tiedossa jokaisen näytteen
x
i todellinen luokka ci, estimaatti on funktion
Parametrien oppiminen opetusdatasta
maksimoivat parametrit β0 ja
β
Regularisointi
Logistista regressiota voi soveltaa myös useamman luokan ongelmiin, mutta tässä työssä keskitytään vain kahteen luokkaan
Tarkoituksena löytää mallin parametrit

β0 ja
β
, jotka antavat mahdollisimman korkean todennäköisyyden P(c=1 |
x
) yleisesti kaikille niille näytteille, jotka kuuluvat luokkaan 1

Koitetaan ennustaa näytteen luokkaa lineaarisen regression keinoin
Koska luokkatieto on binäärinen (0/1), suoran sovittaminen ei mielekästä
Parempi keino on sovittaa suora näytteen todennäköisyyteen kuulua johonkin luokkaan P(c|
x
), mutta todennäköisyydet ovat välillä [0,1] ja suoran yhtälön antamia arvoja ei ole rajoitettu
Logit-muunnos muuntaa todennäköisyydet välille [-∞,∞]
Ratkaistaan yhtälö P(c|
x
) suhteen niin saadaan näytteen
x
todennäköisyys kuulua luokkaan c (posterioritodennäköisyys)
Ideana on että näytteen
x
ja parametrin
β
pistetulo + vakiotermi antaa hyvin suuren arvon kun x kuuluu luokkaan 1 ja hyvin pienen arvon kun x kuuluu luokkaan 0
Pistetulo + vakiotermi annetaan sigmoid funktiolle, joka muuntaa tuloksen todennäköisyydeksi
Rajoitetaan sallittuja parametreja β0 ja
β
opetusvaiheessa

LASSO regularisointi rajoittaa parametrivektorin L1-normin suuruutta
Parantaa joissain tapauksissa suurimman uskottavuuden estimaattia
||
β
|| ≤ t

1
Hyödyllinen ominaisuus: riippuen parametrista t antaa ratkaisuja, joissa osa parametrista on nollia.
Antaa "harvan"(sparse) estimaatin

Case 1
Case 2
Luokittelu
Segmentointiongelmia lähdettiin ratkaisemaan luokittelijaa apuna käyttäen
paikallinen varianssi
gradientti
alipäästösuodatus
...

Piirrevektori/näyte
Voidaa valita automaattisesti vain osa piirteistä, jotka sopii hyvin ongelman ratkaisuun
Tuloksia
Piirteen irrotus
Yhteensä 44 piirrettä
Opetusvaihe:
Opetettiin luokittelija tunnistamaan partikkelien reunoja
Normalisointi
Jokaisen piirteen keskiarvo nollaksi
ja keskihajonta yhdeksi
Testausvaihe/segmentointi:
Annetaan luokittelijalta saatu todennäköisyyskuva watershed segmentointi menetelmälle
Opetusvaihe:
Opetettiin luokittelija tunnistamaan missä on huokonen
Testausvaihe/segmentointi:
Käytetään luokittelijaa erottelemaan huokoset uusista kuvista
Piirrematriisi
X
Piirrematriisi
X
Ground truth kuvat
Kuviin merkattu käsin missä reunat ovat

Opetus
Käytettiin TTYn merope klusteria, koska ajo vei paljon keskusmuistia (~60GB)
piirrematriisin koko ennen tasausta 44x15064896
piirrematriisin koko tasauksen jälkeen 44x1622593
glmnet
Opetuksessa oli ongelmia, koska reunojen määrä suhteessa ei-reunoihin oli hyvin pieni(~0,6%). Luokittelija päätyi luokittelemaan kaikki näytteet ei-reunoiksi ja sai hyvän luokitusvirheen(~0,6%)
Reunjen ja ei reunojen lukumäärä tasattiin
Ajo kesti noin 18 min
Nopeampi algoritmi
Enemmän prosessorin ytimiä käytössä (12)
saadaan parametrit

β0 ja
β

Luokittelija
Opitut parametrit β0

Opitut parametrit β0

Piirrematriisi
X
Todennäköisyyskuva
Piirrematriisi
X
Opetettu luokittelija
Piirteen irrotus
β =
[0 0.3658 0 0 0.2373 0 ...]
Riittää että lasketaan vain osa piirteistä
Normalisoidaan uudet piirteet samoilla arvoilla kuin opetusvaiheessa
Normalisointi
Luokittelu
Aloituspisteiden etsiminen
Ideana löytää partikkelien keskipisteet, jotka annetaan watershed menetelmälle
Watershed segmentointi alkupisteillä
Idea
: reunakuvan päälle alkaa sataa vettä ja jokaisen alkupisteen kohdalle muodostuu lammikko
Kun kaksi lammikkoa on yhdistymässä, niiden väliin rakennetaan pato.
Kun vesi on niin korkealla, että vain patoja näkyy pinnan yläpuolella, segmentointi on valmis
Muodostetut padot ovat segmentoinnin tulos
Aloituspisteet saadaan etäisyysmunnoksen paikallisista maksimeista
Etäisyysmuunnos Otsun menetelmällä kynnystetylle kuvalle.
Tuloksia
Luokittelijan tuloksia
Segmentoinnin tuloksia
Parempia virhemittareita tulossa
Luokittelijan tuloksia
Segmentoinnin tuloksia
Johtopäätökset
Logistinen regressio soveltuu hyvin auomaattiseen segmentointiin
Nopeampaa kuin manuaalinen segmentointi
Tulokset objektiivisia ja johdonmukaisia
malli on helposti tulkittavissa (esim. nähdään mitkä piirteet ovat hyvä ennustamisessa ja kuinka paljon ne vaikuttavat lopputulokseen)

Erityisesti LASSO regularisointi mahdollistaisi automaattisen segmentointiohjelman tekemisen, jossa voitaisiin automaattisesti valita muutama piirre suuresta joukosta yleispäteviä piirteitä ratkaisemaan haluttu ongelma
Esimerkiksi materiaalitutkijat voisivat halutessaan klikkailla hiirellä opetusdataa kuvasta, jonka jälkeen uusia kuvia voitaisiin näyttää luokittelijalle
Ohjelman käyttäjällä ei tarvisi olla mitään tuntemusta luokittelusta tai piirteiden valinnasta

Mitä pienempi t sitä harvempi estimaatti
Full transcript