Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

bayesian network

presentation
by

Gözde Nur Beşler

on 4 January 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of bayesian network

Bayes Ağlarının tarihteki yeri? UYGULAMA 1. Mart ayına ait analizler: Önem Dereceleri: BAYES AĞLARI - Bayesian Ağları 1985 yılında «Judea Pearl» tarafından icat edilmiştir. Judea Pearl’un amacı aşağıdaki 3 noktaya dikkat çekmekti:

Girdi bilgilerinin subjektif doğası
Nedensel ve kanıtsal modlar arasındaki ayrım
Bilgilerin güncellenebilir olması TAN modeli: Bayes Ağları Nedir?

-Bayes ağları , problem kümesinin olaylar ile arasındaki ilişkilerini, koşullu olasılıklar kullanarak gösteren grafiksel modellerdir.

-En yeni yapay zeka teknolojilerinden olan Bayes Ağları, karmaşık durumlarda, beraber birçok kafa karıştıran, belirsiz ve çelişen bilgi kaynaklarını kullanarak, problemi çözmek için akıl yürütmeye imkan vermektedir.

-Bayes ağları temellerini olasılık kuramı içerisinde incelenen Bayes teoreminden almaktadır.

-Bu teorem bir rassal değişken için olasılık dağılımı içinde koşullu olasılıklar
ile marjinal olasılıklar arasındaki ilişkiyi gösterir. Bayes ağları, istatistikte uzun bir tarihe sahiptir. 1980’lerin başında uzman sistemlerde kesin olmayışlık ile ilgili çalışmalar yapılmıştır.

Son 10 yıl süresince, Bayes ağ, uzman sistemlerde kesin olmayan bilgiden yararlanmak için popüler bir gösterim oluşturmuştur.

Daha yakın bir geçmişte, araştırmacılar, verilerden Bayes ağın öğrenilmesi için metotlar geliştirmişlerdir. Bu teknikler yeni olup, gelişimleri sürmektedir ve bu tekniklerin birçok veri-analiz problemleri için etkili olduğu gösterilmiştir. Bayes Ağlarının Kullanım Alanları:


 

  Bayes ağları araştırmacılar, uygulayıcılar ve yönetsel karar vericiler için son derece evrensel bir araç haline gelmiştir.

-Bazı kullanım alanları :
*İş Zekası
*Veri madenciliği

*Pazarlama
-Müşteri kümeleme
-Tüketici araştırmaları içindeki sürücü analizi

*Finans / Bankacılık
-Kredi skorlama
-Sahtekarlık algılama

*Sağlık
*Hukuk
-Dava danışmanlık
-Adli bilimler . . .

Bayes ağları alternatif modelleme yaklaşımları üzerinde çeşitli avantajlar sunmaktadır.:

-Belirsiz bilgilerin işlenmesi için tutarlı, teorik olarak sağlam bir mekanizmadır.
-Düğümler arasındaki bağımlılığı ve bağımsızlığı tanımak kolaydır.
-Eksik veri durumlarında da çalışabilir.
-Gürültülü sistemleri modellemek için çözüm üretir.
-Sistem kısıtlamalarından (maliyet vs.) dolayı tamamını ölçmenin mümkün olmadığı yerlerdeki senaryoları tespit edebilir.
 


-Ağ hesaplaması zor ve maliyetlidir.
-Sonuçların kalitesi inanç modelin kalitesine bağlıdır.
-Tüm dallar herhangi bir dal olasılığını hesaplamak için hesaplanmalıdır Avantajlar : Dezavantajlar: Judea Pearl -Yaş (age)
-Cinsiyet (sex)
-Kan basıncı (tansiyon-BP)
-Sodyum miktarı (Na)
-Potasyum miktarı (K)
-İlaç Türleri (Drug A,Y,B,X,C) Kullanılan kolesterol ilaçlarının tedavideki etkinliğini tespit etmek için, yaşları 15-74 arasında değişen 1000 kolesterol hastası rasgele seçilmiştir.
Seçilen 1000 hastanın 1 ay ara ile ölçümleri yapılmış ve kaydedilmiştir. (mart ve nisan o.ü) Analizimizde, kolesterol düzeyini başlıca etkileyen aşağıdaki 6 değişken kullanılmıştır. Kolesterol seviyesi üzerinde;
"En önemli" etken %85.8 ile "ilaç türü"dür.
2.önemli değişken; %7,9 ile kandaki "Potasyum" seviyesidir.
3. önemli değişken; %3,7 ile "yaş" değişkenidir.
4.önemli değişken; %1,4 ile kandaki "Sodyum" miktarıdır.
"Tansiyonun" %1,2 ile "önemsiz" sayılabilecek kadar az bir etkisi var.
"Cinsiyetin", hiç etkisi YOKTUR. " Yaşı 27'den küçük ve kolesterol seviyesi "normal" düzeyde olma olasılığı %21,5 tir. Yaşı 51 ile 62 aralığında olup kolesterol seviyesi "Yüksek" olması olasılığı %20,4 tür. Kandaki "Potasyum" seviyesi 0,03 ile 0,04 arasında olan ve "Y" ilaç türünü kullanan kişilerin kolesterol seviyesinin "Yüksek" olma olasılığı %39,5 tir. Kandaki "Potasyum" seviyesi 0,06'dan yüksek olan ve "A" ilaç türünü kullanan kişilerin kolesterol seviyesinin "Normal" olması olasılığı %45,6 dır. MARKOV Modeli Bu grafiğe baktığımızda hedef değişken (kolesterol) ile ilgili 1 bağlantı çıkmamış. Dolayısıyla tahminleri yapmada diğer değişkenlerin bir önemi yoktur. Bu nedenle önemli değişken %'likleri hesaplanamamıştır. MARKOV grafiğine baktığımızda Drug için birden fazla parents değeri vardı. Bu parents değerleri ne olduğunda hangi ilaçların kullanacağı olasılıkları verilmiş.
Ör. "age=0, BP=High, Na=0, K=0 ve normal kolesterel seviyesindeki biri için drug Y kullanım olasılığı 1 dir. TAN modelinin, kolesterol değişkenini DOĞRU açıklama sayısı "681", oranı "%68.1" dir.
TAN modelinin, kolesterol değişkenini YANLIŞ açıklama oranı, "%51.9"dur. MARKOV'un, kolesterol değişkenini DOĞRU açıklama, oranı "%73,3" dür. "TAN" ve "Markov" modelleri ortaklaşa, "716" göze ile ilgili aynı kararı vermişlerdir. Her 2 modelin gerçekle olan karşılaştırması sonucu; "Doğru" sayısı 565 (%78.91), "Yanlış" sayısı 151 (%21,6) dır.
Toplam 716 göze için "AYNİ" kararı vermişlerdir. Evaluation grafiğinde yer alan mavi ve kırmızı çizgiler birbirine ne kadar yakınsa; modellerin tahminlerinin gerçek değere o kadar yakın olduğunu söyleriz. 2. Mart-Nisan aylarına ait verilerin "BİRLİKTE" analizi: TAN modeli: Önem Dereceleri: Kolesterol seviyesi üzerinde en önemli etken %92.2 ile ‘ilaç türü’dür.
2.önemli değişken %3 ile ‘kandaki sodyum seviyesi‘ dir.
3.önemli değişken %2.8 ile ‘yaş‘ tır
4.önemli değişken %2 ile ‘cinsiyet‘ tir.
Tansiyon ve potasyumun ise hiç etkisi yoktur. Yaşı 26’dan küçük ve kolesterol seviyesi normal düzeyde olması olasılığı %21.2 ‘dir. Yaşı 51 ile 62 aralığında olup kolesterol seviyesi yüksek düzeyde olması olasılığı %19.8 ‘dir. TAN mart modelinin kolesterol değişkenini doğru açıklama sayısı: 681, yüzdesi : %34.05’ tir.
TAN mart modelinin kolesterol değişkenini yanlış açıklama sayısı: 1319, yüzdesi : %65.95’ tir. TAN mart/nisan modelinin kolesterol değişkenini doğru açıklama sayısı: 618, yüzdesi : %30.9 ‘dur.
TAN mart/nisan modelinin kolesterol değişkenini yanlış açıklama sayısı: 1382, yüzdesi : %69.1 ‘dir. TAN mart modeli ve TAN mart/nisan modelleri 1348 göze ile ilgili aynı kararı vermişlerdir.
TAN mart modeli ve TAN mart/nisan modelleri 652 göze ile ilgili farklı kararı vermişlerdir. Her iki modelin gerçekle olan karşılaştırması sonucu ; %36.5 doğru,
% 63.5 yanlış karar vermişlerdir. Toplam 716 göze için aynı kararı vermişlerdir. Evaluation grafiğinde yer alan mavi ve kırmızı çizgiler birbirine ne kadar yakınsa; modellerin tahminlerinin gerçek değere o kadar yakın olduğunu söyleriz.
Bu grafiğe bakıldığında TAN mart ve TAN mart/nisan modell tahminlerinin gerçek değere yakınlıktan oldukça uzak olduğu görülüyor. Başka tahmin yöntemleri denenebilir. Çisil HİKMET
Gözde Nur BEŞLER
Full transcript