Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

FİLOGENETİK

No description
by

yasemin şahin

on 12 May 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of FİLOGENETİK

FİLOGENETİK
Biyolojide filogenetik çeşitli organizma grupları (örneğin türler veya topluluklar) arasındaki evrimsel ilişkinin araştırmasıdır.
Bu ilişkiler filogeni olarak adlandırılır.
Organzimaların sınıflandırması ve adlandırması olan taksonomi, filogenetikten büyük miktarda etkilenmiştir ama yöntemsel ve mantıksal olarak farklıdır.
Filogenetik sistematikte taksonları birbirinden ayırt etmek için sadece filogenetik ağaçlar kullanılır. Evrimsel hayat ağacının araştırılması için filogenetik analiz yöntemleri vazgeçilmez hâle gelmiştir

Filogenetiğin çözmeye çalıştığı sorun, genetik verilerin sadece bugüne ait olması, fosil kayıtlarının (osteometrik verilerin) ise tesadüfi ve güvenilmez olmasıdır.
Tüm ağacın çizilebilmesi içine evrimin nasıl çalıştığı hakkındaki bilgiler kullanılır.
Dolayısıyla filogenetik ağaç, evrimsel olayların meydana gelme sırasıyla ilgili bir hipoteze bağlıdır.

Carl Woese..
Canlılarda üç domain teorisini ortaya atmıştır.
Filogenileri oluşturmak için ribozomal RNA dizilerin moleküler saat olarak kullanılması yaygın bir yöntemdir.

Bu yöntem özellikle mikroorganizmaların filogenisi için özellikle faydalı olmuştur çünkü mikroorganzimalar fenotipik özelliklerine dayanarak sınıflandırılamayacak kadar birbirlerine benzerler.
Ayrıca biyolojik türlere hakkındaki geleneksel kavramlar mikroorganizmalara uygulanamaktadır.

Çoklu dizi hizalaması
Üç ya da çok biyolojik dizinin (genelde protein, DNA veyaRNA dizisinin) dizi hizalamasıdır.
Çoğu durumda, girdi kümesindeki sorgu dizilerinin evrimsel bir ilişkiye sahip olduğu, yani ortak bir ataya sahip oldukları varsayılır.
Elde edilen çoklu dizi hizalamasından homoloji olduğu çıkarımı yapılabilir ve filogenetik analiz ile dizilerin evrimsel kökenleri değerlendirilebilir.

Dinamik programlama
ve berimsel karmaşıklık
Bir ÇDH üretiminde global optimal çözümünü bulmak için dinamik programlama tekniği kullanılır.
Proteinler için, bu yöntem iki parametre grubu kullanılır: bir boşluk cezası ve bir substitusyon matrisi.
Substitusyon matrisi, her bir amino asit çiftinin birbiriyle hizalanmasına karşılık gelen bir puan (skor) veya olasılık değeri içerir, bu değerler amino asitlerin kimyasal özelliklerinin benzerliğine ve mutasyonun olmasının evrimsel olasılığına dayalıdır.
Nükleotit dizileri için benzer bir boşluk ceza değeri vardır ama substitusyon matrisi çok daha basittir, tipik olarak sadece aynı olma veya olmamaya göre skorlar bulunur.
Substitusyon matrisindeki skorlar global hizalamalar durumunda ya sırf pozitif olabilir veya hem pozitif hem negatif değerler içerebilirler, ama lokal hizalama durumunda hem pozitif hem negatif değerler içermek zorundadır.

İlgili bir kavram olan filogenez, bir biyolojik türün (veya bir organizmalar grubunun) bir dizi şekillerden geçerek meydana gelen evrimsel gelişimidir.
Bu terim bir organizmanın belli bir özelliğinin (örneğin anatomik bir yapısının) gelişimi için de kullanılabilir. Bu ismin sıfat hali filogeniktir.
Evrim bir dallanma süreci olarak düşünülebilir.
Topluluklar zaman içinde değişime uğrar ve bunun sonucu farklı dallar halinde türleşir, birbiriyle melezlenir veya tükenerek son bulur.
Bu süreçler bir filogenetik ağaç olarak gösterilebilir.

Kladistik, canlı gruplarının birbiriyle paylaştığı özelliklere göre sınıflandırma yapması nedeniyle filogenetik ağaçlar hakkında çıkarım yapmak için hâlen tercih edilen yöntemdir.
Filogenik çıkarımları yapmak için kullanılan en yaygın yöntemler arasında parsimoni, maksimum olasılık ve Markov zinciri Monte Karlo-temelli Bayes çıkarımı sayılabilir.
Tüm bu yöntemler söz konusu biyolojik türlerde gözlemlenen özelliklerin evrimleşmesini betimleyen matematik modellere dayalıdır ve genelde moleküler filogenetikte uygulanırlar.

Filogenetik gruplar (taksonlar) monofiletik, parafiletik veya polifiletik olabilir.
Filogenetik ağaçlardaki gruplamaları tarif etmek için belli terimler vardır.
Örneğin, tüm kuşlar ve sürüngenlerin tek bir ortak atadan geldiğine inanılmaktadır, dolayısıyla bu taksonomik gruplamaya (sağdaki şekilde sarı gösterilen) monofiletik denir.
"Modern sürüngenler" (şekilde siyan renkli) ortak bir ataya sahip olan bir gruptur ama bu atanın tüm ahvadını içermez (kuşlar hariçtir). Bu, parafiletik bir grubun örneğidir.
Sıcak kanlı hayvanlar gibi bir grup, hem memelileri hem de kuşları (şekilde kırmızı/turuncu) ve polifiletik olarak adlandırılır çünkü bu grubun üyeleri en yakın ortak atayı içermez.

Genelde organizmalar genleri iki yoldan kalıt alabilirler:
Dikey gen transferi ve yatay gen transferi/ Dikey gen transferi genlerin ebeveynden yavruya aktarımıdır; yatay gen transferi ise birbiriyle ilişkisiz organizmalar arasında genlerin geçmesi ile meydana gelir.
Yatay gen transferi prokaryotlarda sık rastlanan bir olgudur.
Yatay gen transferi organizmaların filogenisinin belirlenmesini karmaşıklaştırmıştır.
Belli organizma gruplarında filogenetik ağacı çizmek için hangi gene bakıldığına bağlı olarak farklı filogenilerin elde edildiği rapor edilmiştir.

Ağaç inşasının doğruluğuna etki eden bir diğer önemli unsur, kullanılan veride faydalı bir filogenetik sinyal olup olmadığıdır.
Filogenetik sinyal terimi, birbiriyle ilişkili organizmaların genetik malzeme veya fenotipik özellikleri bakımından birbirlerine benzeyip benzemedikleri ile ilgilidir.

Hizalamanın sağdaki resimdeki gibi gösterimiyle noktasal mutasyonlar, hizalamadaki sütunlardan birinde farklı bir harf olarak, ensersiyon ve delesyonlar ise hizalamadaki satırlardan bir veya daha fazlasında tire şeklinde beliren eklemeler şeklinde mutasyon olayları görülebilir.
Protein bölgelerinde, ikincil veya üçüncül yapılarda ve hatta bireysel amino asit veya nükleotitlerin dizi korunumunu değerlendirmek için çoklu dizi hizalamaları sıkça kullanılır.
Çoklu dizi hizalaması terimi ayrıca bir dizi kümesinin hizalanması süreci için kullanılır.
Üç veya daha çok dizinin elle hizalanması zor olduğu ve genelde çok zaman alıcı olduğu için hizalamaların üretim ve analizi için hesaplamalı algoritmalar kullanılır.
ÇDH'ler ikili dizi hizalamasından daha ileri yöntemlerin kullanımını gerektirir.

İlerleyici hizalama inşası
Çoklu dizi hizalamasında en yaygın kullanılan yöntem, ilerleyici yöntem olarak bilinen (hiyerarşik veya ağaç yöntemi olarak da bilinir) bir buluşsal aramadır.
Bu yöntemde, ÇDH'yi inşa etmek için önce birbirine en benzer olan çiftten başlanır, sonra gittikçe daha az benzeşen çiftler eklenir.
İlerleyici hizalama yöntemlerinin hepsi iki aşamadan oluşur:
**diziler arasındaki ilişkinin kılavuz ağaç denen bir filogenetik ağaç olarak gösterildiği birinci aşama..
**büyüyen ÇDH'ye dizilerin sırayla eklenerek ÇDH'nin inşa edildiği bir ikinci aşama..
İlk kılavuz ağacı oluşturmak için, dinamik programlama hizalaması yapmak yerine, verimli bir kümeleme (clustering) yöntemi kullanılır (komşu birleştirme veya UPGMA gibi).
Çoğu modern ilerleyici yöntemler, sorgu kümesinin her bir üyesi için skor fonksiyonlarını değiştirir.
Bu değişken skor, dizilerin en yakın komşularına olan genetik uzaklığına bağlı olarak nonlineer değişen bir ağırlık fonksiyonuyla hesaplanır.
Böylece, hizalama programının dizileri rastgele olmayan bir şekilde seçmesinin etkisi düzeltilmiş olur.


T-Coffee olarak adlandırılan bir yaygın ilerleyici hizalama yöntemi, Clustal ve onun türevlerinden daha yavaştır ama birbiriyle uzaktan ilişkili diziler için daha doğru hizalamalar üretir.
İkili hizalamalar hesaplamak için T-Coffee iki farklı yöntemle elde edilen hizalamaları birleştirir: çiftin doğrudan hizalaması ve, çiftteki her diziyi üçüncü bir dizi ile hizalanması ile elde edilen, indirekt hizalamalar.
Bu program, hem Clustal çıktısını, hem de başka bir lokal hizalama programı olan ve iki dizideki çoklu lokal hizalanma bölgeleri bulan LALIGN programını kullanır.
Elde edilen hizalama ve filogenetik ağaç, yeni ve daha doğru ağırlık faktörleri üretmek için kullanılır.
İleleyici yöntemler buluşsal oldukları için, global bir optimuma yakınsama garantileri yoktur, hizalamanın kalitesini değerlendirmek zor olabilir ve gerçek biyolojik anlamı belirsiz olabilir.

Tekrarlayıcı yöntemler
ÇDH üretip, ilerleyici yöntemlere özgü hataları azaltan bir yöntemler grubu "tekrarlayıcı" (iterative) olarak sınıflandırılmıştır.
Çünkü bunlar ilerleyici yöntemlere benzer olarak çalışmakla beraber, büyüyen ÇDH'ye yeni diziler eklerken ilk dizileri tekrar tekrar hizalamaya devam eder.
İlerleyici yöntemlerin yüksek kaliteli ilk hizalamalara muhtaç olmalarının nedeni, bu hizalamaların hep nihai sonuçta yer almasıdır.
Yani bir dizi bir ÇDH içinde yerini aldıktan sonra onun hizalaması tekrar gözden geçirilmez. Bu yaklaşıklık (approximation) hesaplamalı hızı artırır.
Buna karşın, tekrarlayıcı yöntemler, daha önce hesaplanmış ikili hizalamalara veya sorgu dizisini içeren alt-ÇDH'ler geri gelebilirler.
Bu sayede, yüksek kaliteli bir hizalama skoru elde etmeyi sağlayacak bir genel objektif fonksiyon optimize edilebilir.
Tekrarlama-temelli diğer bir popüler yöntem MUSCLE olarak adlandırılır, iki dizinin yakınlığını belirlemek için daha doğruluklu bir uzaklık değeri hesaplayarak, ilerleyici yöntemlerden daha yüksek bir başarı gösterir.
Uzaklık ölçütü, tekrarlama aşamaları arasında yenilenir.

Gizli Markov modelleri
Gizli Markov modelleri (GMM), boşluk, uyuşma ve uyuşmamaların tüm kombinasyonlarına bir olasılık değeri atayan olasılıksal modellerdir.
GMMler yüksek skorlu bir çıktı verebilirler ama ayrıca bir olasıl hizalamalar ailesi de üretebilirler, bunlar sonradan biyolojik anlamlılıkları bakımından değerlendirilebilir.

Tipik bir gizli Markov modeli için, gözlemlenen haller, bireysel hizalama sütunlarıdır, "gizli" haller ise, sorgu kümesinde bulunan dizilerin evrimleşmiş olduğu varsayılan atasal diziyi temsil eder.
Dinamik programlama yönteminin verimli bir varyantı olan Viterbi algoritması, büyüyen ÇDH'yi sorgu kümesindeki bir sonraki dizi ile hizalamak için kullanılır, böylece yeni bir ÇDH elde edilir.
Bu yöntem, ilerleyici hizalama yönteminden farklıdır çünkü her yeni dizi eklenmesinde evvel ki dizilerin hizalaması da yenilenir.
Ancak, ilerleyici yöntemlerde olduğu gibi, bu yöntem de sorgu kümesindeki dizilerin hizalamaya katılmasının sırasına bağlı sonuç verebilir, özellikle diziler uzak ilişkilyse.

Filogenetikteki kullanımı
Çoklu dizi hizalamaları filogenetik ağaç üretmekte kullanılabilir.
Bunun iki nedeni vardır.
Birincisi, açıklamalı (annotated) dizilerdeki işlevsel protein bölgeleri bilinmeyen protein bölgelerinin hizalanmasında kullanılabilir.
Öbür neden ise işlevsel olarak önemli olan korunmuş bölgeler bu yolla bulunabilir.
Çoklu dizi hizalamaları kullanılarak, diziler arasında homolojiden yararlanarak evrimsel ilişkiler bulunabilir.
Nokta mutasyonlar ve delesyonlar (indel olarak adlandırılır) tespit edilebilir
Çoklu dizi hizalamaları işlevsel olarak önemli konumların tespit edilmesinde kullanılabilir.
Korunmuş bölgeler sayesinde örneğin, bağlanma bölgeleri, aktif bölgeler, veya diğer anahtar fonksiyonlara karşılık gelen konumlar bulunabilir.
Çoklu dizi hizalamalarına bakarken, dizileri kıyaslamakta farklı özellikleri göz önüne almak yararlı olabilir.
Bu özelliklerin arasında aynılık, benzerlik, ve homoloji sayılabilir.
Aynılık, dizilerin birbirine karşılık gelen pozisyonlarında aynı kalıntıya (rezidüye) sahip olmasıdır. Buna karşın, benzerlik, karşılaştırılan dizilerin nitel olarak benzer kimyasal kalıntılara sahip olmasıdır.
Benzerlik sonunda homolojiye varır, diziler ne kadar birbirlerine benzerse homolog olmaya o kadar yakındırlar.
Dizilerde homoloji, ortak ataları bulmaya yardımcı olur

FİLOGENETİK AĞAÇ OLUŞTURMA METOTLARI
1) Mesafe Temelli Yöntemler
2) Karakter Temelli Yöntemler

MESAFE TEMELLİ YÖNTEMLER(DİSTANCE-BASED)
a) Kümelenme Temelli Yöntem
• UPGMA(Unweighted Pair Group Method Algorithm)
• Neighbor-Joining (NJ)
b) En iyi durum(optimum) Temelli Yöntem
KARAKTER TEMELLİ YÖNTEMLER
(CHARACTER-BASED)
Maximum Parsimony(MP)
Maximum Likelihood(ML)
Bayesian inference

MESAFE TEMELLİ YÖNTEMLER
 Dizi hizalanması (alignment) temeline dayanarak hesaplanan dizi çiftleri arasındaki farklılıkların miktarına dayanır.
 Dizi hizalanması sonucu hesaplanan evrimsel mesafeler, her bir takson çifti arasındaki mesafelerin bir matrisinin oluşturulmasında kullanılabilirler.

 Matristeki bu çiftli mesafe skorlarına dayanarak tüm taksonlar için bir filogenetik ağaç oluşturulabilir.
 Bu yöntemde kullanılan algoritmalar, kümelenme temelli veya en iyi durum (optimum durum) temelli olarak iki kola ayrılırlar.
 Kümelenme temelli algoritmalar, en benzer dizi çiftlerinden başlayan bir mesafe matrisine dayanarak filogenetik ağacı hesap ederler.
 Bu algoritmalar, aritmetik ortalamayı kullanarak ağırlıklı olmayan çift grup yöntemini UPGMA ve komşu birleştirme yöntemini içerirler.

UPGMA YÖNTEMİ
 UPGMA yönteminde tahmin edilen mesafeler ile gerçek evrimsel mesafeler tam olarak uyuşmamaktadır. Bu da yöntemin yeterince başarılı olmadığını göstermektedir.
 Ağacın dalları boyunca değişiklik hızının sabit olduğunu varsayar.
 Bu nedenle hesaplamaları yaparken ağacın kökünü (root – ortak ata) de hesaplar

Kümelenme Temelli Algoritmalar :
En benzer dizi çiftlerinden başlayan bir mesafe matrisine dayanarak filogenetik ağacı hesap ederler. Bu algoritmalar, aritmetik ortalamayı kullanırlar.


Avantajları
 İndirekt ölçümlü uzaklıklarda kullanılabilir (immunolojik, hybridizasyon).
 Uzaklıklar görülmeyen eventslarla düzeltilebilir.
 En hızlı metotlardandır.
 Bundan dolayı çok geniş data setleri çabukça analiz edebilir.
 Bazı orantı analizlerinde kullanılabilirler.

Dezavantajları
 Benzerlik ve ilişkiler aynı karakterde kullanılmaz, benzerliğe göre sıralama, evrimsel ağacın verilişinde kullanılmaz.
 Karakter analizinde kullanılamazlar.
 4 takson (A,B,C,D) içeren bir mesafe matrisi kullanılarak UPGMA yöntemi ile öncellikle en yakın iki takson ( A ve C, aralarındaki mesafe 0,35) birleştirilir.
 Tüm taksonlar boğum noktasından eşit uzaklıkta olduklarından (Bu, UPGMA yönteminde bir varsayımdır.) A’dan ve C’den düğüm noktasında olan dal uzunluğu 0,35/2= 0,175’tir.
 Sonuç olarak UPGMA yönteminde iki uzaklık arasındaki mesafe birbirine eşit olmak zorundadır.
 Bu yöntem günümüzde tercih edilen yöntem değildir.
Full transcript