Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

FEATURE SELECTION

No description
by

Murat Özkale

on 5 January 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of FEATURE SELECTION

VARIABLE SELECTION
Modelleme Algoritmalarında Feature Selection Kullanımı
Feature Selection Kullanan Algoritmalar ve destekledikleri metodlar;
Bayesian With K2 Prior
Bayesçi analiz yapısı kullanan bu metod veri madenciliğinde sıklıkla kullanılan bir algoritmadır. Skor değeri ölçeklenebilir ve çok sayıda değişken analiz edilebilir.
Interestıngness Score
Bir özellik yararlı bilgi içeriyorsa ilgi çekicidir. Bir özelliğin yararlı, kullanışlı olup olmadığı uygulamaya göre farklılık gösterir, ve pek çok farklı Interestingness Score tespit yöntemi vardır.
Shannon's Entropy
Shannon's Entropy yönteminde bir rastgele değişkenin belirlenmiş bir sonucu için belirsizlik değeri hesaplanarak skor değeri bulunur.
FEATURE SLECTION METODLARI
Feature Selection esnasında kullanılan skorlama metodları, üzerinde çalışılan değişkene ve kullanılacak model algoritmasına göre farklılıklar gösterir.
Özelliklerin seçiminde kullanılacak eşik skor değeri kişi tarafından belirlenebilir.
Feature Selection her zaman modelin training aşamasından önce uygulanır.
Feature Selection aşamasında kullanılan Metodlar uygulanan model algoritmalarına göre farklılık gösterir
Feature Selection yanlızca sütunları-değişkenleri etkiler.
Feature Selection ile model dışında tutulan değişkenler Data Set üzerinde kalır, silinmez.
Nasıl Uygulanır?
Neden Kullanılır
Veri Setlerinin içerdiği gereksiz bilgiyi ayıklamak
Kurulan modelin daha anlamlı olmasını sağlamak
Maliyetin ve bellek kullanımının düşürülmesi
Modeli hızlandırmak
VARIABLE SELECTION NEDIR?
Variable Selection Nedir?
Bazı seçim kriterlerine dayanarak veri setindeki en kullanışlı bilgileri elde etmektir.
Variable Selection
, yani değişken seçimi ayrıca
Feature Selection
, yani özellik seçimi olarak da geçer.
NEDEN KULLANILIR?
NASIL UYGULANIR?
Temel prensip her özellik için bir skor hesaplanarak, yüksek skora sahip özelliklerin modellemede kullanılması üzerinedir.
Bunlardan bir tanesi entropi temelli ölçüm yöntemidir.
Entropi temelde termodinamiğe ait bir kavramdır.
Veri seti üzerinde ise bir rasgelelik ve düzensizlik ölçüsü olarak açıklanabilir.
Rasgele dağılımlar daha yüksek entropi değerine sahip olduğundan daha düşük bilgi kazancı sağlar
Interestingness(Attribute) =
- (m - Entropy(Attribute)) * (m - Entropy(Attribute))
Interestingness Score değeri bir özelliğin entropi değerinin bütün özelliklerin entropi değerleri ile karşılaştırılarak bulunur
H(X) = -∑ P(xi) log(P(xi))
(Sürekli)
(Kesikli ve Sıralı)
Algoritmanın İşleyişi;
Bir düğümü ebeveynsiz olarak ele alır ve o düğüme ebeveyn ekleyerek skorunu arttırmaya çalışır. Eklenen ebeveyn skor üzerinde etki etmediği zaman algoritma durur.
(Kesikli ve Sıralı)
Bayesian Dirichlet Equivelant With Uniform Prior
(Kesikli ve Sıralı)
Bu metod Dirichlet dağılımının özel bir durumunun varsayımıyla uygulanır.
Bu varsayımda, bir sabit değer kullanılarak öncelikli durumlara ait fixed (sabit) veya uniform dağılım elde edildiğidir
BDE skor sistemi Bayesçi analizi kullanarak eldeki veri setini değerlendirir.
Naive Bayes
Shannon's Entropy
Bayesian With K2 Prior
BDU With Uniform Prior
Karar Ağacı
Interestingness Score
Shannon's Entropy
Bayesian With K2 Prior
BDU With Uniform Prior
Özelliklerden biri sürekli ise istikrarlılığın sağlanması için hepsinde Interestingness score kullanılır. Öteki durumlarda varsayılan metod kullanılır.
Sinir Ağları
Interestingness Score
Shannon's Entropy
Bayesian With K2 Prior
BDU With Uniform Prior
Lojistik Regresyon
Interestingness Score
Shannon's Entropy
Bayesian With K2 Prior
BDU With Uniform Prior
Kümeleme
Interestingness score
Lineer Regresyon
Interestingness Score
Full transcript