AI neredeyse bilinen her proteinin şeklini tahmin eder

AlphaFold'un siyah bir arka plan üzerinde Vitellogenin Proteininin tahmini yapısı

AlphaFold aracı tarafından tahmin edildiği gibi, yumurta sarısının bir öncüsü olan vitellogenin proteininin yapısı.Kredi bilgileri: DeepMind

Bugünden itibaren, bilimin bildiği hemen hemen her proteinin 3 boyutlu şeklini belirlemek, bir Google aramasına yazmak kadar basit olacak.

Araştırmacılar, gezegendeki neredeyse tüm bilinen proteinleri kapsayan 1 milyon türden yaklaşık 200 milyon proteinin yapılarını tahmin etmek için devrim niteliğindeki yapay zeka (AI) ağı AlphaFold’u kullandılar.

Veri dökümü, Google’ın AlphaFold’u geliştiren Londra merkezli AI şirketi DeepMind ve Cambridge, İngiltere yakınlarındaki hükümetler arası bir kuruluş olan Avrupa Moleküler Biyoloji Laboratuvarı’nın Avrupa Biyoinformatik Enstitüsü (EMBL-EBI) tarafından kurulan bir veritabanında ücretsiz olarak sunulacak.

DeepMind CEO’su Demis Hassabis bir basın brifinginde, “Aslında bunun tüm protein evrenini kapsadığını düşünebilirsiniz” dedi. “Dijital biyolojide yeni çağın başlangıcındayız.”

Bir proteinin 3B şekli veya yapısı, hücrelerdeki işlevini belirleyen şeydir. Çoğu ilaç yapısal bilgiler kullanılarak tasarlanır ve doğru haritalar genellikle proteinlerin nasıl çalıştığına dair keşiflerin ilk adımıdır.

DeepMind, AlphaFold ağını derin öğrenme adı verilen bir yapay zeka tekniği kullanarak geliştirdi ve AlphaFold veritabanı, insanlar, fareler ve geniş çapta incelenen diğer 19 organizma tarafından üretilen neredeyse her proteini kapsayan 350.000 yapı tahminiyle bir yıl önce piyasaya sürüldü. Katalog o zamandan beri yaklaşık 1 milyon girişe ulaştı.

AlphaFold veri tabanını yeni protein ailelerini tanımlamak için kullanan University College London’da bilgisayarlı bir biyolog olan Christine Orengo, “Bu devasa hazinenin serbest bırakılması için kendimizi hazırlıyoruz” diyor. “Bizim için tahmin edilen tüm verilere sahip olmak harika.”

Yüksek kaliteli yapılar

AlphaFold’un geçen yıl piyasaya sürülmesi, araçtan yararlanmak için çabalayan yaşam bilimleri camiasında bir sıçrama yaptı. Ağ, proteinlerin 3B şekli veya yapısı hakkında oldukça hassas tahminler üretir. Ayrıca, tahminlerinin doğruluğu hakkında bilgi sağlar, böylece araştırmacılar hangisine güveneceklerini bilir. Geleneksel olarak bilim adamları, protein yapılarını çözmek için X-ışını kristalografisi ve kriyo-elektron mikroskobu gibi zaman alıcı ve maliyetli deneysel yöntemler kullanmışlardır.

EMBL-EBI’ye göre, 214 milyondan fazla tahminin yaklaşık %35’i oldukça doğru kabul ediliyor, bu da deneysel olarak belirlenmiş yapılar kadar iyi oldukları anlamına geliyor. Diğer bir %45’lik ise birçok uygulama için güvenebilecek kadar kendinden emin olarak kabul edildi.

Birçok AlphaFold yapısı, bazı uygulamalar için deneysel yapıların yerini alacak kadar iyidir. Diğer durumlarda, araştırmacılar deneysel verileri doğrulamak ve anlamlandırmak için AlphaFold tahminlerini kullanır. Kötü tahminler genellikle açıktır ve bazılarına proteinin kendisindeki, en azından başka moleküller olmadan, tanımlanmış bir şekli olmadığı anlamına gelen içsel bozukluk neden olur.

Bugün yayınlanan 200 milyon tahmin, UNIPROT adlı başka bir veritabanındaki dizilere dayanmaktadır. Josep Carreras Lösemi Araştırma Enstitüsü’nden hesaplamalı biyolog Eduard Porta Pardo, bilim adamlarının bu proteinlerin bazılarının şekli hakkında zaten bir fikre sahip olmaları muhtemeldir, çünkü bunlar deneysel yapıların veritabanlarında kapsanır veya bu tür depolardaki diğer proteinlere benzerler, diyor. (IJC) Barselona’da.

Ancak Porta, bu tür girdilerin insan, fare ve diğer memeli proteinlerine yönelik olma eğiliminde olduğunu söylüyor, bu nedenle AlphaFold çöplüğünün çok daha çeşitli organizmalardan yararlandığı için önemli bilgiler eklemesi muhtemel. “Müthiş bir kaynak olacak. Ve muhtemelen çıkar çıkmaz indireceğim” diyor Porta.

AlphaFold yazılımı bir yıldan beri mevcut olduğundan, araştırmacılar istedikleri herhangi bir proteinin yapısını tahmin etme kapasitesine zaten sahip oldular. Ancak çoğu kişi, tahminlerin tek bir veritabanında bulunmasının araştırmacılara zamandan, paradan ve işlerden tasarruf sağlayacağını söylüyor.Porta, kaldırdığınız başka bir giriş engelidir” diyor. “Birçok AlahFold modeli kullandım. AlphaFold’u hiç kendim çalıştırmadım.”

Almanya’da EMBL Hamburg’da geçen yıl AlphaFold ağını yöneten yapısal modelleyici Jan Kosinski, veritabanı genişletmesini sabırsızlıkla bekliyor. Ekibi, bir patojenin proteomunu – bir organizmanın tüm proteinlerinin kümesini – tahmin etmek için 3 hafta harcadı. Brifingde “Artık tüm modelleri indirebiliriz” dedi.

yüz terabayt

Bilinen hemen hemen her proteinin veri tabanında bulunması yeni tür çalışmalara da olanak sağlayacaktır. Orengo’nun ekibi, yeni tür protein ailelerini tanımlamak için AlphaFold veri tabanını kullandı ve şimdi bunu çok daha büyük bir ölçekte yapacaklar. Laboratuvarı ayrıca, plastik tüketme yeteneği gibi yararlı özelliklere sahip proteinlerin evrimini veya kansere yol açabilenler gibi endişe verici proteinlerin evrimini anlamak için genişletilmiş veritabanını kullanacak. Veritabanında bu proteinlerin uzak akrabalarının belirlenmesi, özelliklerinin temelini belirleyebilir.

AlphaFold’un bulut tabanlı bir versiyonunun geliştirilmesine yardımcı olan Seul Ulusal Üniversitesi’nde bir hesaplamalı biyolog olan Martin Steinegger, veritabanının genişlediğini görmekten heyecan duyuyor. Ancak araştırmacıların muhtemelen ağı kendilerinin yönetmesi gerektiğini söylüyor. İnsanlar, proteinlerin nasıl etkileşime girdiğini belirlemek için AlphaFold’u giderek daha fazla kullanıyor ve bu tür tahminler veri tabanında yer almıyor. Mikrobiyal proteinler de topraktan, okyanus suyundan ve diğer ‘metagenomik’ kaynaklardan gelen genetik materyalin sekanslanmasıyla tanımlanmaz.

Steinegger, genişletilmiş AlphaFold veritabanının bazı gelişmiş uygulamalarının 23 terabaytlık içeriğin tamamını indirmeye bağlı olabileceğini ve bunun birçok ekip için mümkün olmayacağını söylüyor. Bulut tabanlı depolama da maliyetli olabilir. Steinegger, yapısal olarak benzer proteinleri hızla bulabilen ve AlphaFold verilerini önemli ölçüde ezebilmesi gereken FoldSeek adlı bir yazılım aracını birlikte geliştirdi.

Bilinen her protein dahil edildiğinde bile, AlphaFold veritabanının yeni organizmalar keşfedildikçe güncellenmesi gerekecektir. AlphaFold’un tahminleri, yeni yapısal bilgiler elde edildikçe iyileşebilir. Hassabis, DeepMind’in veritabanını uzun süre desteklemeyi taahhüt ettiğini ve yıllık olarak meydana gelen güncellemeleri görebileceğini söyledi.

Umudu, kullanılabilirlik AlphaFold veritabanının yaşam bilimleri üzerinde kalıcı bir etkiye sahip olmasıdır. “Düşüncede oldukça büyük bir değişiklik gerektirecek.”

Leave a Reply

Your email address will not be published.