Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Metin Madenciliği

No description
by

Mukaddes Büyükkavut

on 10 May 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Metin Madenciliği

Text Mining
Data Mining
Literature
Article
Survey

Metin Madenciliği Nedir?
Metin Madenciliği Teknikleri
Metin Madenciliği Uygulamaları

İçerik
Metin Madenciliği Teknikleri
Metin Madenciliği Uygulamaları
Metin Madenciliği ile E -ticaret sitesi belirlenmesi

Metin Madenciliği
Metin Madenciliği
Metin madenciliği; yapısal olmayan veriden ilginç, önceden bilinmeyen ve önemsiz olmayan bilgileri keşfeden, çok sayıda dokümanı analiz eden bir teknolojidir.
Metin Madenciliği Uygulamaları
Metin Madenciliği ile soru cevaplama sistemi
Internet ortamındaki tüketici yorumlarından özet bilgi çıkarımı
Metin Madenciliği Uygulamaları
A Survey of Text Mining Techniques and Applications
Metin Madenciliği Uygulamaları
Türkçe içeriklerden Otomatik
Etiket Bulutu Oluşturma
Metin Madenciliği Uygulamaları
Metin Madenciliği ile Benzer Haber Tespiti
Veri Seti
Haber Metinlerinin Temizlenmesi
Etiket Atama
Benzer Haber Tespiti
Sonuç
Anıl KARADAĞ*, Hidayet TAKÇI*
* Gebze Yüksek Teknoloji Enstitüsü, Bilgisayar Mühendisliği Bölümü, Kocaeli
Vishal Gupta, Gurpreet S. Lehal
JOURNAL OF EMERGING TECHNOLOGIES IN WEB INTELLIGENCE
Teşekkürler
Verileri sınıflandırmadan önce metnin formatı düzenlenmesi veri ön işleme
Dokümanlar arasında kıyaslama için anahtar kelimelerin belirlenmesi
1) Belirli kelimelerin seçilmesi
2) Metinde geçen tüm kelimelerin seçilmesi.
Dökümanlar arası ilişkilerin bulunmasında döküman vektörleri arasındaki açının kosinüsü hesaplanması
K-En- Yakın-Komşu ve Naïve Bayes algoritmaları
Benzerlik ve sonuçların değerlendirilmesinde WEKA kütüphanesi
Ara yüzü Java programlama dili ve Swing Kütüphanesi
Ön işleme
1)Fiiler için Zemberek kütüphanesini
2)Atma işlemi için java stringTokenizer
Bitsel tanımlama
Frekansa göre tanımlama
Tf-Idf Ağırlıklandırma Yöntemine göre tanımlama.
Benzerlik hesaplaması için vektörler arasındaki açının kosinüsünün hesabı
Tuğba KAŞIKÇI1 , Hadi GÖKÇEN2. (2014). Metin Madenciliği ile E-Ticaret Sitelerinin Belirlenmesi . BİLİŞİM TEKNOLOJİLERİ DERGİSİ. 7 (1), 25-32.

Sevinç İlhan1 , Nevcihan Duru2 , Şenol Karagöz3 , Merve Sağır 4. (2010). Metin Madenciliği ile Soru Cevaplama Sistemi . 1 Mühendislik Fakültesi Bilgisayar Mühendisliği Bölümü Kocaeli Üniversitesi. 1 (1), 1-5.

-Niteleme kurallarına göre agaç yapısı
-Zemberek doğal dil işleme kütüphanesi
-Incelenen ürün hakkındaki kelimeler manuel olarak tespit edilir
-Niteleyen (sıfat) kelimeler anlamlarına göre derecelendirilir
Metin Madenciliği Uygulamaları
Internet ortamındaki tüketici yorumlarından özet bilgi çıkarımı
-Ağaç yapısındaki niteleme kuralları oluşturulur
Niteleyen kelimeler 2, Nitelenen kelimeler 1
-Derinlik Öncelikli Arama Algoritması ile agaçta yeni durum oluştur.

Kadriye Ergün1, Cemalettin Kubat, Gültekin Çağıl, Raşit Cesur. (27.11.2012). Internet ortamındaki tüketici yorumlarından özet bilgi çıkarımı.
günlük haberlere erişimi daha işlevsel
-içerik alınır.
-html kodundan arındırılır
-metin analizi işlemi yapılır: zemberek kütüphanesi
-ikili –üçlü kelime gruplarına ayrılır.
-tekrarlama sayısı 1 den fazla ise o bir ETIKET tir.
Full transcript