Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

VERi MADENCiLiĞiNDE APRiORi ALGORiTMASI

No description
by

Mehmet Umut Salur

on 7 September 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of VERi MADENCiLiĞiNDE APRiORi ALGORiTMASI

VERİ MADENCİLİĞİNDE APRİORİ ALGORİTMASI
ve FARKLI VERİ KÜMELERİNDE UYGULANMASI

İçerik
Veri Madenciliği
VM Uygulama Alanları
VM Teknikleri
Birliktelik Kuralları
Apriori Algortiması
Uygulama

Veri Madenciliği
1990'lı yıllarda ortaya çıkmış
Büyük ölçekli veriler arasından bilgiye ulaşma, bilgiyi madenleme işidir.
Önceden bilinmeyen ve potansiyel olarak faydalı olabilecek, veri içinde gizli bilgilerin çıkarılmasına VM denir (Frawley, Piatetsky-Shapiro ve Matheus, 1991).
Büyük boyuttaki verilerden yararlanmak için, bu verilerüzerinde yöntem ve kurallar uygulanarak değerli bilginin keşfedilmesine gerek duyulmuştur.
Veri Tabanlarında Bilgi Keşfi-VTBK (Knowledge Discovery in Databases)
Bilgi çıkarımı (knowledge extraction)
Veri ve örüntü analizi (data/pattern analysis)
VM, VTBK sürecinin bir aşaması olarak kabul görmektedir.
Veri Tabanlarında Bilgi Keşfi(VTBK) Aşamaları
VM Uygulama Basamakları
Veri Temizleme
(gürültü ve tutarsız verileri çıkarmak)
Veri Bütünleştirme
(birçok veri kaynağını birleştirmek)
Veri Seçme
(yapılacak olan analiz ile ilgili olan verileri belirlemek)
Veri Dönüşümü
(verinin, veri madenciliği tekniğinde kullanılabilecek şekilde dönüşümünü gerçekleştirmek)
Veri Madenciliği
(veri örüntülerini yakalayabilmek için akıllı metotları uygulamak)
Örüntü Değerlendirme
(bazı ölçümlere göre elde edilmiş bilgiyi temsil eden ilginç örüntüleri tanımlamak)
Bilgi Sunumu
(madenciliği yapılmış olan elde edilmiş bilginin kullanıcıya sunumunu gerçekleştirmek)
VM Uygulama Alanları

Bankacılık (51) 12%
Bioteknoloji / Genetik (11) 3%
Kredi skorlama (35) 8%
CRM(Customer Relationship Management) (52) 12%
Doğrudan pazarlama (34) 8%
E-Ticaret (11) 3%
Eğlence/ Müzik (4) 1%
Sahtekarlık tespiti (31) 7%
Şans oyunu (2) 0,01%
Kamu uygulamaları (12) 3%
Sigortacılık (24) 6%
Yatırım / Hisse senedi (5) 1%
Junk email / Anti-spam (5) 1%
Sağlık (15) 4%
İmalat (19) 5%
Tıp/ Farmakoloji (12) 3%
Perakende (25) 6%
Bilim (17) 4%
Güvenlik / Anti-terörizm(5) 1%
Telekomünikasyon (23) 5%
Seyahat (8) 2%
Web (9) 2%
Diğer (11) 3%
VM Uygulama Alanları
Veri Madenciliği Teknikleri
Sınıflama
Kümeleme
Birliktelik Kuralları ve Sıralı Örüntüler
Sınıflama Teknikleri
• Diskriminant analizi
• Naive Bayes
• Karar ağaçları
• Yapay Sinir ağları
• Kaba kümeler
• Genetik algoritma
• Regresyon analizi

Kümeleme Teknikleri
Bölümleme yöntemleri
Hiyerarşik yöntemler
Yoğunluk tabanlı yöntemler
Izgara tabanlı yöntemler
Model tabanlı yöntemler

Apriori Algoritması
Agrawal ve Srikat, 1994 yılında
Birliktelik kuralları için en çok kullanılan algoritma
Boolean ilişki kuralları için geçerli bir VM algoritması
Bilgileri bir önceki adımdan aldığı için “prior”
Özünde iteratif (tekrarlayan) bir niteliğe sahip
k-öğe kümesi,{bal, süt, ekmek}
Temel yaklaşım;
"Eğer k-öğe kümesi minimum destek değerini sağlıyorsa,bu kümenin alt kümeleri de min destek kriterini sağlar."
Apriori Algoritması
Veri Madenciliği Teknikleri
Sonuçları bilinen verilerden hareket edilerek bir model geliştirilmesi ve bu modelden yararlanılarak sonuçlan bilinmeyen veri kümeleri için sonuç değerlerin tahmin edilmesi
Karar vermeye rehberlik etmede kullanılabilecek mevcut verilerdeki örüntülerin tanımlanması sağlanmak
Birliktelik Kuralları
Geçmiş verilerin analiz edilerek bu veriler içindeki birliktelik davranışlarının tespiti ile geleceğe yönelik çalışmalar yapılmasını destekleyen bir yaklaşımdır.
En çok market sepetinde uygulanır.
Örneğin:
Bir süpermarkette ekmek ve peynir satın alınan satış hareketlerinin %75'inde zeytin de satın alınmıştır.
Birliktelik Kuralı Matematiksel Gösterimi
A==>B formunda ifade edilir
Ürün (X, ”dijital fotoğraf makinesi”) ==>Ürün (X, ”bellek kartı”)
Burada X bir hareketteki değişkeni simgelemektedir.
Bu kural da, dijital fotoğraf makinesi alan müşterinin aynı zamanda ayrıca ek bellek kartı almaya yöneldiği anlamı çıkarılmaktadır.
Birliktelik Kuralı Matematiksel Gösterimi
Yaş (X, “12 – 17”), Meslek (X, “öğrenci”)==> Ürün (X, ”oyun konsolu -playstation”)
Bu kural ile, “12-17 yaşları arasındaki öğrenci en çok “oyun konsolu (playstation) almaktadır”
Güven ve Destek Kavramları
Kuralın ilginçliğini ve ilgililiğini belirleyen ölçüt
Kuralın yararlılığı ve kesinliği ifade eder
Güven
(
A==>B) = (A ve B‟ nin bulunduğu satır sayısı) / (A‟ nın bulunduğu satır sayısı)
Destek
(A==>B) = (A ve B‟ nin bulunduğu satır sayısı) / (toplam satır sayısı)
Destek kriteri; veride öğeler arasındaki bağlantının ne kadar sık olduğunu belirtir.
Güven kriteri;B ürünün hangi olasılıkla A ürünü ile birlikte alınacağını söyler.
Güven değerinin %100 olması kesin kural olduğunu ifade eder.
Güven ve Destek Değerlerinin Hesaplanması
Toplam alış hareketlerine göre {Kek, Süt} ile Su arasındaki ilişki ??
Destek= (Kek,süt,su)/ToplamH=2/5=0.4
Güven=(Kek,süt,su)/(Kek,süt)=2/4=0.5
Sonuç: {Kek, Süt}==>Su kuralı %40 destek, %50 güven ölçülerine sahiptir
Birliktelik kuralı çıkarmak için en çok kullanılan algoritma
“Apriori”
algoritmasıdır.
Birliktelik Kuralları
Algoritmaları
AIS(Agrawal vd., 1993)
SETM (Houtsma ve Swami, 1995)
Apriori (Agrawal ve Srikant, 1994)
Partition (Savasere vd., 1995)
RARM - Rapid Association Rule
Mining (Das vd., 2001)
CHARM (Zaki ve Hsiao, 2002).
Apriori Algoritması
Pseudocode
Apriori Algoritması
Budama
Apriori Algoritması
Örnek
Minimum Destek: 3
Minimum Güven: %70 olarak seçilmiştir.
Apriori Algoritması
Örnek
Minimum destek değerini sağlayan ürünler
Tekli birlikteliklerin destek değerleri
Hareketler ve ürünler tablosu
Apriori Algoritması
Örnek
İkili birliktelikler ve destek değerleri
İkili birlikteliklerden destek değerini sağlayan setler
Apriori Algoritması
Örnek
Uygulama
Futbol taraftar grubuna uygulanmış
Taraftarlardan yaş, eğitim, maaş gibi genel bilgileri içeren veriler
Anketin verilerine apriori algoritması uygulanarak kurallar çıkarılması
Uygulama Akış Diyagramı
Uygulama Veritabanı Tasarımı
Uygulama Sonuç Kuralları
Dinlediğiniz için teşekkürler
Apriori Algoritması
Budama
Ck aday öğe kümesindeki öğelerin alt
kümelerinin Lk-1 sık geçen öğe
kümesindeki varlığı
Apriori Algoritması
Ck :Aday öğe kümesi
Lk:Sık geçen öğe kümesi
Apriori Algoritması Örnek-2
Full transcript