Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Implementasi Algoritma Parallelized Rabin-Karp untuk Deteksi

No description
by

Faisal Morensya

on 19 February 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Implementasi Algoritma Parallelized Rabin-Karp untuk Deteksi

Implementasi Algoritma Parallelized Rabin-Karp
untuk Pendeteksian Dokumen Teks Plagiat
Dibawakan oleh
Faisal Morensya 09101002008
Pembimbing 1
Pembimbing 2
M. Fachrurrozi, S.Si, M.T.
Abdiansah, M.CS.
Latar Belakang
Dengan ekspansi dalam penggunaan internet sebagai sarana belajar dan tujuan penelitian, meningkatkan kesempatan tindak plagiarisme dalam berbagai bidang.
Tujuan dan Manfaat
Mengembangkan perangkat lunak pendeteksi plagiarisme pada dokumen yang dapat mempercepat waktu pengecekkan serta peningkatan pada hasil akurasi pencocokan dokumen.
Untuk mendeteksi tindak plagiarisme secara manual akan menghabiskan banyak waktu.
2008
2010
2011
Su et al
Pada penelitian ini, metode Smith-Waterman dan Levenshtein Distance dikembangkan untuk mendeteksi dokumen plagiat. Kedua metode ini memiliki kemiripan dalam melakukan pencocokan string, namun SW memiliki tingkat akurasi yang tinggi sebesar 216 dan LD sebesar 103 dari total 2578 token.
Osman, Salim, dan Binwahlan
Pada penelitian ini dikembangkan metode Graph-Based Representation untuk mendeteksi kemiripan diantara dokumen asli dan dokumen plagiat. Graph-Based Representation merepresentasikan kalimat sebagai node yang saling terhubung (Graph).
Brodanac et al
Pada penelitian ini algoritma Parallelized Rabin Karp digunakan untuk melakukan pencocokan string. Metode ini menggunakan cara yang lebih dinamis dengan membagi pekerjaan K bagian untuk string B. Dengan demikian setiap proses dapat berjalan bersama-sama secara terpisah dan meningkatkan kecepatan waktu proses.
Penelitian Sebelumnya
Landasan Teori
Plagiarisme
“menggunakan secara tidak sah atau menutup imitasi dari ide-ide dan bahasa / ekpresi dari seseorang dan melibatkan diri dalam merepresentasikan pekerjaan orang sebagai milik anda”
(Hannabus, 2001)
Bentuk Plagiarisme (Martin, 1994)
1. word for word plagiarism;
2. paraphrasing plagiarism;
3. plagiarism of secondary sources;
4. plagirism of the term of a source;
5. plagiarism of ideas;
6. plagiarism of authorship.
Teknik Menganalisis Plagiarisme
1. Substring Matching;
2. Keyword Similarity;
3. Fingerprint Analysis.
Pencocokan String
Rolling Hash
Parallelized Rabin Karp
K-gram
Pengukuran Similarity
Rolling hash memperbaiki keambiguan yang terjadi untuk beberapa kasus pencarian. Rolling hash menggunakan basis bilangan yang merupakan bilangan prima yang besar.
Prinsip utama algoritma Parallelized Rabin-Karp adalah untuk membagi suatu string B kedalam K bagian, dan memulai proses individu untuk setiap bagian. Masalah yang dihadapi adalah membagi string B menjadi K bagian yang sama. Misalkan sebuah string dengan panjag n, dan dicari sebuah string dengan panjang m, yang semuanya pararel sebagai proses K.
Metode k-gram digunakan untuk mengambil potongan-potongan karakter huruf sejumlah k dari sebuah kata yang dibaca secara berkelanjutan dari awal hingga akhir dokumen.
Penggunaan ukuran similarity yang tepat tidak hanya meningkatkan kualitas pilihan informasi tapi juga membantu mengurangi waktu dan biaya proses. Untuk mengukur nilai similarity diterapkan metode Dice’s Similarity Coefficient menggunakan pendekatan k-gram.
S=2C/((A+B))
Gambaran Proses Keseluruhan
Dokumen Sumber
Dokumen Target
Input
Persentase Kemiripan
Output
Proses
Prapengolahan
Pencocokan String
Pengukuran Nilai Similarity
Sekian & Terima Kasih
Wassalamualaikum wr.wb
Full transcript