Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

veri maden

adile tatlıyer
by

msacid gök

on 4 January 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of veri maden

VERİ MADENCİLİĞİ Veri madenciliği nedir? Veri Madenciliğinin İstatistik ile Olan İlişkisi Gözlem, sayım veya ölçüm sonucu elde edilen sembol ve rakamlar veri olarak tanımlanır. Biverinin düzenlenmiş şseklidir. Günümüzde birçok kaynaktan veri alıp bu verileri veri tabanlarında saklayan kurumlaın amaçlarından biri de ham verileri bilgiye dönüstürmektir.
Kendi başsına değgersiz olan veri amaca yönelik islendigğinde bilgiye dönüsşür. Verinin bilgiye çevirmesine Veri Analizi denir.
 Örnegğin eskiden süpermarketteki kasalar basit toplama makineleri iken sşimdilerde, satısş noktaları terminalleri ile saklanan binlerce malın ve müsşterinin hareket bilgileri (sayısal veri) sayesinde, her malın zaman içindeki hareketleri (veri) ve eger müşsteriler müşsteri kod numarası ile kodlanmısş ise zaman içindeki verilerine ulaşsmak ve analiz etmek çok kolay olmaktadır.
Süpermarket örnegğimizde veri analizi yaparak her mal için bir sonraki ayın satışs tahminleri çıkarılabilir; müsşteriler satın aldıkları mallara bağglı olarak gruplanabilir; yeni bir ürün için potansiyel müsşteriler belirlenebilir; müsşterilerin zaman içindeki hareketleri incelenerek onların davranışsları ile ilgili tahminler yapılabilir. Binlerce malın ve müşsterinin olabileceği düşsünülürse bu analizin gözle ve elle yapılamayacağgı, otomatik olarak yapılmasının gerektigği ortaya çıkar. Veri madenciligği bu noktada devreye girmektedir.
Aynı sekilde tarım bakanlıgı,yetitirciler birlikleri ve isletmelerin topladıkları veriler de veri madenciligınde degerlendirilebilir. Gelişsen bilim teknolojisi ve verinin oluşsumu

Veri madenciliğgi çalısşmaları günümüz bilgi toplumunda kritik bir alan olmaya basşlamıştır. Bilişsim, Internet ve medya teknolojilerindeki olagğan üstü gelisşmeler bizleri bir veri okyanusu ile karşsı karsşıya bırakmısştır. Knowledge Discovery in Databases Veri madenciligği genel anlamda büyük miktarda veri içerisinden gizli kalmıs,degerli,kullanılabilir bilgilerin acıga cıkartıldıgı bir süreçtir.

Veri madenciligği, büyük veri depolarındaki gizlenmişs en önemli bilgilerin ortaya çıkartıldıgğı ve elde edilen bu bilgilerle gelecegğe yönelik ilgili tahminlerde bulunabilmemizi sağglayacak bağgıntıların bilgisayar programı kullanarak aranmasıdır. Veri madenciliğgi araçları, gelecekteki davranışs ve trendleri tahmin ederek aratırmacıların etkin kararlar almalarını sağglar. Böylelikle bu araçlar, çözümü çok zaman gerektiren isşletme sorunlarına da yanıt bulabilmeye imkan tanımaktadır. Veri madenciligği ilgili alanları;
Veri madenciliğgi sahası, istatistik, yapay zeka, veri tabanları ve veri görselleşstirme gibi alanlar ile yakından ilisşkilidir. Hazırlayan : Adile TATLIYER
Danışman: Doç. Dr. Hikmet ORHAN
Süleyman Demirel Üniversitesi Ziraat Fakültesi Zootekni Bölümü, Biyometri ve Genetik Anabilim Dalı Veri Madenciliği ve Hayvancılık Alanında Kullanımı
Veri madenciliğgini istatistiğgin kullanıldıgğı yöntemler serisi olarak da tanımlanabilir. Veri madenciligği ile geleneksel istatistiktigğin amacı aynı dogğrultuda olmasına rağgmen veri madenciliğginde kolaylıkla mantıksal kurallara ya da görsel sunumlara çevrilebilecek nitel modellerin çıkarılması ile geleneksel istatistikten farklıdır. Bundan dolayı veri madenciliğgi insan merkezlidir ve bazen insan – bilgisayar ara yüzü birlesştirilir. Hem veri madenciligğinde hemde geleneksel istatistik tekniklerinde temel unsurlar veri ve bilgidir.

Hatırlatma: iİstatistik verilerin toplanması, sınıflandırılması, özetlenmesi, grafik ve tablolarla sunulması, analiz edilerek ana kütle hakkında anlamlı bilgiler elde edilmesi ve yorumlar yapılmasıdır.. Veri madenciliği; Veri madenciligğinin istatistikle benzer yönleri;
Veri madenciligği istatistik ile birçok yönden çok yakın ilisşki içindedir. Veri madenciligği ile istatistigğin ortak özelliğgi “veriden ögğrenilmesi veya “verinin bilgiye dönüşstürülmesidir.

Veri madenciligğinin istatistikten farklı yönleri;
iİstatistiksel analizler arastırma konusu ile ilgili teori ile balar ve teorinin onaylanması veya red edilmesi hakkında bilgi verir. İistatistik doğgası geregği dogğrulayıcı bir süreçtir. Öte yandan veri madenciliğgi teorinin doğgrulanması üzerine odaklanmaz. Bu bilgisayarın otomatik olarak örüntüleri bulacağgı veya öngörü yapacagğı anlamına gelmez. Tam tersi, veri madenciligği analistten açık talimatlar bekler.
Veri madenciliğgi tümden gelim, istatistik tüme varım ile ilgilenir.


Hipotez testinin veri madenciliğgi için özel bir anlamı yoktur, çünkü veri madenciligğine bir teori veya hipotez ile veya özel bir ana kütlenin sonuçlarının genellesştirilmesinin vurgulanması ile başslanılmaz.

Veri madenciligğinde büyük hacimli veri kullanılmaktadır ve hatta çoğgu zaman anakütle ile çalışsılmaktadır. istatistik de populasyonla çalısabilir ancak, zaman ve maaliyetten kazanç saglamak amacıyla örnekleri kullanır. Aratırıc açısından maaliyet bakımından bu bir avantajdır.
Istatistik testler kullanılırken bazı varsayımların saglanması kosulları aranırken, vveri madenciliginde varsayımlara ihtiyaç duyulmamamktadır. Bilgi keşsfi için veri madenciliğginin temel adımlarını tanımlayan kademeli bir süreçtir. Adımları;
İşIsin Kavranması(business understanding) – en önemli asamadır. isletme açısından amaçları anlama ve bu bilgiyi bir VM problemine dönüsştürme,
Verinin Kavranması(data understanding) – veri toplamayla başslama ile baslar veri karakteristigini belirler.Yani veri tanımlamasıdır.
Verinin Hazırlanması(data preparation)– son veri setini olusşturmak için tüm faaliyetlerin kapsama alınması,
Modelleme(modelling) – değgişsik modelleme tekniklerinin seçilip, uygulanması ve ayarlanması,
Değgerleme (evaluation) – Modelin kalitesinin degğerlendirilmesi,
Yayılım (deployment)– Karar verme sürecine yardım etmek için “güncel” bir model organizasyonda uygulanması, adımlarından olusşur. Veri Madenciliği Sürecinde İzlenmesi Gereken Adımlar; Sınıflandırma ve Regresyon
en yaygın olarak kullanılan VM tekniklerinden biri olan sınıflamada; yapay sinir agları,genetik algoritmalar,K-en yakın komsu,bellek temelli nedenleme, Naive-Bayes, lojistik regresyon ve karar agaçları en yaygın kullanılan tekniklerdir. sınıfı belli olmayan verileri sınıfını tahmin eder
Kümeleme;
Nesnelerin alt dizinlere gruplanmasını yapan islemidir.sınıflamanın aksine yeniden tanımlanmı sınıflara dayalı degildir.
Birliktelik kuralları ve Ardıık Zamanlı Örüntüler
birliktelik kurallar analizi süreci market sepeti analizi olarak da adlandırılır.bu analizde müsteri ile ilgili veri hareketlerinden gelecekte müsterinin nasıl tercih yapacaına dair sonuçlar tahmin edilir. veri madenciliği yöntem ve teknikleri Istisnalar (Fark Saptanması)
“Normalden farklı davranıs gösteren müsterilerim var mı?”

Döküman Madenciligi (Web Madenciligi)
“Bu arsivde (veya internet üzerinde) bu dökümana benzer hangi dökümanlar var?”
web madenciligi ise web içerikleri, sayfa yapıları ve web istatistiklerinin de içinde oldgu web ile iliskili verinin analizini içermektedir. KENDİ ÇALIŞMAMIZ Kendi çalışmamız WEKA 3.6 yazılımı Etlik Piliçlerde Toplam Karkas Ağırlığı Ve Tüketilebilir Karkasın Veri Madenciliği İle Tahmini Genis bir istihdam salayan tavukçuluk sektöründe, etlik piliç üretiminde toplam karkas agırlıgı ve tüketilebilir karkas, yetistiriciler için önemli bir konudur.
Bu çalısmanın amacı, veri madenciligi süreci kullanılarak tavukçuluk sektöründe önemli verim kriteri olan toplam karkas ve tüketilebilir karkas aırlıının tahmin edilebilmesidir
Çalışsmada veri madenciligği hayvancılık alanındaki probleme uygulanmısştır.
Arasştırmada, hayvan materyali olarak Arber acress etlik piliç genotipinden 288 adet günlük civciv kullanılmısştır.
42 gün sonunda karkas agğırlığgı ve tüketilebilir sakatat ağgırlıgğı saptanmısştır.
Civcivlerin günlük yem tüketimleri ile haftalık canlı ağgırlıkları (6 hafta), girdi degğişskeni olarak alındı. Veri madenciliğgi ve istatistigğin her ikisi de bir olayı etkileyen önemli faktörleri belirlemek ve türetilen modeller ile gelecekteki olayları daha iyi öngörmek ile ilgilenir. Bu nedenle veri madenciliğgi biyoistatistik alanında son yıllarda çok kullanısşlı bir şsekilde kullanılabilen, sağglıklı sonuçlara ulasştıran, günümüz veri yoğgun dünyasının vazgeçilmez uygulamalarından birisi olma yolundadır. Sonuç; Alpaydın, E., Zeki Veri Madenciliği: Ham Veriden Altın Veriye Ulaşma Yöntemleri,
www.cmpe.boun.edu.tr/~ethem/files/.../veri-maden_2k-notlar.doc, Bilişim 2000 Eğitim Semineri.
 
Bartholomew, D.J., 1959a, A test of homogenetiy for ordered alternatives, Biometrica 46, 36-48.
 
Baykasoğlu A., Veri Madenciliği Ve Çimento Sektöründe Uygulama,
http://ab.org.tr/ab05/tammetin/171.pdf , Son erişme 21 Aralık 2012
 
Brunk, H.D., Ewing G.M., Utz W.R., 1957, Minimizing integrals in certain classes of monotone functions, Pac. J. Math. 7,833-847.
 
Brunk, H. D, 1965, Conditional expectation given a s -lattice and applications, Ann. Math. Stat. 36,1339-1350.
 
Eeden, C. V., 1957a, Maximum likelihood estimation of partially or completely ordered parameters, I. Indagationes Math. 19,128-136.
 
Eeden, C. V., 1957b, Maximum likelihood estimation of partially or completely ordered parameters, II. Indagationes Math. 19, 201-211.
 
Küçüksille E., 2009,Veri Madenciliği Süreci Kullanılarak Portföy Performansının Değerlendirilmesi Ve İmkb Hisse Senetleri Piyasasında Bir Uygulama (doktora tezi).
 
Miles, R. E., 1959, The complete amalgamation into blocks by weighted means of a finite set of real numbers, Biometrika 46, 317-327.
 Vahaplar, A., İnceoğlu, M.M., Veri Madenciliği Ve Elektronik Ticaret, http://www.bayar.edu.tr/bid/dokumanlar/inceoglu.doc, Son erişme 21 Aralık 2012 Kaynaklar Adile TATLIYER Veri madenciligi; Saglık,telekominasyon,astronomi,tıp,bankacılık, sigorta alanlarında kullanılabilecegi gibi tarım alanında da kullanılabilmektedir.
Full transcript