tech

Bio-IA: derin öğrenme protein araştırmasına uygulanıyor

3 de oct. de 2025 — Sabrina Bottazzi

Derin öğrenme uygulamalı bilimi devrim niteliğinde değiştiriyor ve 200 milyondan fazla protein yapısının ayrıntılı atom modellerini işlemeyi mümkün kılıyor.

7 min read

Bio-IA: derin öğrenme protein araştırmasına uygulanıyor

Yapay zeka hastalıkları iyileştirebilecek mi? Cevap henüz kesin değil, ancak bunu başarmak için çalışan insanlar olduğu hiç şüphesizdir. Buna ulaşmak için, önce proteinler dünyası ve bunun derin öğrenme sayesinde nasıl devrim yaptığı hakkında bilgi sahibi olmamız gerekiyor. Bu kadar ileri ki, geçen yıl proteinlerin oluşturulması için yapay zeka modelleri geliştiren iki bilimci grubuna Kimya Nobel Ödülü verildi. Proteinlerin "hesaplamalı tasarımı" için David Baker'a; ve proteinlerin "yapı tahmini" için Demis Hassabis ve John Jumper'a.

Şaşırtıcı olan şey, sağlık alanında üstel olarak etki gösteren ilgili sonuçların kısa sürede elde edilmesidir. Bildiğimiz ve kullandığımız çoğu yapay zeka modeli gibi, tüm bunlar 2017'de Transformers mimarisinin geliştirilmesi sayesinde mümkün oldu (bu ChatGPT'deki T'nin kaynağıdır); self-attention mekanizması metne veya görüntülere gibi farklı alanlara uygulanabilmiştir. Ve üç yıl sonra, bu notada ilgilenmemiz gereken alana da: proteinlere.

Belirli işlevlere sahip proteinleri tasarlanabilmek, bildiğimiz şekliyle sağlık endüstrisinde (ve diğer birçok endüstride) bir kırılma noktası temsil edecektir. Sentetik antikorlar, daha kısa sürede aşılar veya her hasta için kişiselleştirilmiş terapiler geliştirebilme kapasitesine sahip olmak, gerçeğe dönüşebilecek uygulamaların sadece birkaçıdır.

Proteinler nedir

Proteinlerin yaşamın temel makineleri olduğunu söyleyebiliriz. Daha az şiirsel bir şekilde, amino asitlerin (AA) çok uzun zincirler halinde olup, birbirlerine bağlanan küçük moleküllerden oluşan yapılardır. Doğada sadece 20 tane var ve sonsuz sayıda proteinin oluşumunu sağlarlar; en küçükleri yaklaşık 100AA'den oluşurken, binlerce AA'den oluşturulanlar da olabilir.

Bu makromoleküller çok çeşitli olduğundan, vücudumuzda farklı işlevler görürler. Belki de en bilinenleri kas doku (bu yüzden et yediğimizde "protein tüketiyoruz" deriz) oluşturanlar, ancak aynı zamanda kimyasal reaksiyonları hızlandıran, enzimler adı verilen olanlar da vardır; ya da hemoglobin gibi, oksijeni kan yoluyla taşıyan taşıyıcı proteinler vardır.

Diğer rolleri arasında bağışıklık sisteminin parçası olan antikorlar, sinyal ve düzenleme proteinleri ve membran ile tanıma proteinleri yer almaktadır. Bu son kategoride, pandemi sırasında SARS-Cov-2 virüsünün membranında bulunan Spike proteini çok bilinir hale geldi (war flashbacks). Spike, ACE2 reseptörü ile yüksek afiniteye sahiptir; ACE2, akciğer veya kalp gibi birçok organın hücrelerinin membranında bulunan bir enzimdir (evet, başka bir protein). Bu iki molekül birleştiğinde –başka işlemler ve daha fazla protein aracılığıyla– virüs genetik materyalini hücrenin içine salarak enfeksiyona neden olur.

Proteinler nasıl incelenir

Bir proteinin yapısını bilmek, onun işlevini anlayabilmek için önemli bir parçadır. Örneğin, Covid'e karşı bir aşı geliştirmek için (farklı teknolojiler vardır, ancak bu durumda "rekombinant protein" olacaktır), Spike proteini SARS-Cov-2'nin geri kalanından izole edilerek in vitro olarak üretilir. Yapısını bilerek, belirli değişiklikler uygulanarak virüsün membranında bulunduğu şekilde tutulur (füzyon öncesi durum, insan hücresinin reseptörüne bağlanmadan önce). Bu adım önemlidir çünkü aşı uygulandığında, bağışıklık sistemi Spike'a karşı ACE2 reseptörüne bağlanmayı blokelajı antikorlarla yanıt verir. Bu antikorlar Spike'a bağlanır, böylece yanıtı öğrenerek, virüs organizmaya girerse durumunda hareketlenirler.

Sorun, araştırmacıların bu durumda ~1200AA'ye ve ~15nm'ye (~0.000015 mm, çok minuscül) uzunluğa sahip bir proteini nasıl analiz edebileceğidir. Açıkçası, bu bu moleküllere dayalı biyoteknolojik gelişim için bir darboğaz oluşturmuştur, ve bu nedenle yapay zeka modellerinin uygulanması bütün bu mantığı kırmaya gelmiştir.

Standart yöntem X-ışını kristalografisi olarak adlandırılır ve öncelikle istikrarlı ve önemli miktarlarda protein elde etmeyi gerektirir. Daha sonra numunenin saflaştırılması ve kristaller elde etmek için kimyasal ortamın değiştirilmesi gerekir (o proteinin binlerce kopyası tekrarlanabilir ve düzgün şekilde düzenlenmelidir). Bu adım çok önemli ve zordur, çünkü tüm proteinler kristalin yapılar oluşturamaz. Sonraki adım onları X-ışınlarına maruz bırakarak, bu parçacıkların kristalle nasıl etkileştiğini ortaya koyan kırınım desenleri üretmektir. Zaten son aşama çok karmaşık hale gelir, Fourier dönüşümleri, elektron yoğunluğu haritaları ve yapısal modelleme programlarını kullanır. Bütün bu sürecin çıkış sonucu sonunda proteinin detaylı bir atomik modelidir.

Baker, Hassabis ve Jumper, Kimya Nobel Ödülünü alırken (2024)

AlphaFold ve RFdiffusion

Bilimsel toplumda yankı uyandıran iki model AlphaFold (Demis Hassabis ve John Jumper tarafından geliştirilmiştir) ve RoseTTAFold/RFdiffusion (David Baker tarafından sorumlu tutulmuştur).

2010'da, Hassabis, Shane Legg (hala parça olsa da artık çok alıntı yapılmamaktadır) ve Mustafa Suleyman (2019'da şirketten ayrılmıştır) ile birlikte DeepMind'i kurdu, genel yapay zeka (AGI) ve video oyunları alanında Reinforcement Learning (RL) üzerine odaklanan bir şirket. 2014'te Google bunu yaklaşık 500 milyon dolara satın aldı. Ve yıllar sonra, 2018'de Jumper sorumluluğunda AlphaFold1, proteinlerin geliştirilmesine uygulanan derin öğrenmeyi kullanan ilk model başlattılar. Bu, amino asit çiftleri arasında geometrik parametreleri (mesafeler ve açılar) tahmin etmek ve proteinin yapısını yeniden oluşturmak için CNN'leri uygulamıştır.

Bir dönüm noktası olsa da, atomların konumlarını tanımladığı doğruluk açısından hala sınırlamalar vardı. Patlama AlphaFold2 ile oldu; bu, Transformers'ın self-attention mekanizmalarına dayalı bir mimari oluşturdu (bu değiştirilmiş Transformer'a Evoformer adı verdiler), bunları AA dizisine uygulayarak, AA arasındaki yapısal ilişkileri belirleyerek, belki de dizide uzakta oldukları halde 3D yapısında katlama nedeniyle "komşu" olan AA'ları yakalar.

O zamana kadar, yaklaşık 120 bin proteinin yapısı biliniyordu ve bu, yıllar araştırma ve kristalografı gibi bahsedilen standart tekniklerin sonucu idi. AlphaFold2'nin ortaya çıkmasından sonra, 200 milyondan fazla yapıya erişilebilir, kendi veri tabanında yüklü AlphaFold DB, tabii ki DeepMind tarafından yönetilen.

Öte yandan, Baker'ın ilk araştırmaları 2000'lerin başlarına kadar uzanır ve Rosetta ile, fiziksel ve enerjetik modellere dayalı olarak proteinleri in silico (yani, sanal olarak) tahmin etmek ve tasarlamak için kullanılan bir program mevcuttur. Yaklaşımı klasik hesaplama algoritmalarına dayanıyor, yapay zeka araçları kullanmadan. 2010'ların ilk yarısında, ekip çalışmaya devam etti ve rastgele ormanlar veya regresyonlar gibi klasik makine öğrenmesini dahil etmeye başladı, ta ki 2021'de AlphaFold2'nin mimarisine dayanan ancak hesaplama açısından daha erişilebilir bir uygulama olan RoseTTAFold'u ve açık kaynak olarak yayınlandığını başlattı.

RFDiffusion 2023'te ortaya çıktı ve yenilikçi olan, son proteinin belirli işlevlere sahip olması gerektiğini bir giriş olarak girmenize izin vermesidir. Mimari düzeyinde, model üretken difüzyon işlemini uygular; bu, temel olarak giriş verisine gürültü eklemeyi ve ağını, RoseTTAFold ve 3D koordinatlara ilişkin dikkat mekanizmalarını kullanarak bu gürültüyü kaldıracağını ve proteinin "temiz" yapısını elde etmesini öğretmeyi geliştirmeyi içerir. Bu model bu nedenle sadece yapıları tahmin etmiyor, ancak belirli işlevlere sahip proteinleri tasarlamaya izin veriyor. Öncüsü gibi, RFdiffusion da açık kaynak.

Geçen yılın mayısında, AlphaFold3 yayınlandı; DeepMind'ın Isomorphic Labs ile işbirliği ürünü; Hassabis tarafından da kurulan başka bir şirket ve aynı zamanda Google'ın (gerçekte Alphabet Inc'in, Google'ın ana şirketi) parçasıdır. Bu yeni modelin çekirdeği, ligand-reseptör etkileşimini tahmin edebilmesidir, yani iki molekülün nasıl birleştiğini. Örneğin, ibuprofenin (ilaç veya ligand) sikloooksijenaza (ağrı ve iltihaplanma üreten molekülleri üreten bir protein) bağlanması.

Bunun için modelin mimarisinde bir değişiklik yapıldı ve RFdiffusion'la uyumlu olarak, daha karmaşık çok moleküler sistemlerin farklı konfigürasyonlarını tahmin edebilmek için yararlı olan üretken difüzyon kullanıldı. Aynı zamanda RNA veya antikor-antijen gibi diğer moleküler yapıları da içerir, ancak bu durumlar için elde edilen sonuçlar o kadar dikkat çekici değildir. Bu aracın umut verici yanı, şu anda standart tekniği, ligand-protein etkileşimini simüle etmek için hesaplamalı docking aşmakta, ligandın dahil edilmesinden etkilendiğinde proteinin esnekliğini yakalayabilmektedir.

Gelecek Neler Getiriyor

Isomorphic Labs, İY kullanarak ilaç tasarımıyla uğraşan birkaç şirketten biridir. Bu yılın başında, AlphaFold3'e dayalı olarak geliştirilen ilk ilacı 2025 sonuna kadar tamamlamayı hedeflediklerini ve odağı temel hastalıklara yönelttiklerini duyurdular: nörodejeneratif, kardiyovasküler ve onkolojik. Nisan ayında ilk yatırım turunda USD$600 milyon finansman sağladılar ve yakın zamanda, temmuz ayında, bir Fortune röportajında, başkanı Colin Murdoch, Eli Lilly ve Novartis gibi büyük ilaç şirketleriyle birlikte insan klinik denemelerine başlamaya doğru ilerlediklerini duyurdu.

Tüm bunlar oldukça umut verici görünüyor ve işe yarasa, normalde 5 ile 10 yıl arasında süren ilaç araştırması ve geliştirme süreçleri tamamen devrim geçirebilir, sadece zamanı ve maliyetleri optimize etmekle kalmayıp, aynı zamanda karmaşık hastalıkların tedavilerine erişim sağlanabilecek, çok sayıda simülasyon ve konfigürasyona dayalı olarak ilaçlar tasarlanabilecek ve spesifik ve daha verimli bir şekilde etki eden ilacı elde edebilecek.

İY'nin kalıcı olarak geldiğini biliyoruz ve protein meselesi, sağlık alanını desteklediği birçok açıdan biridir. Uygulamasının tanısı optimize ettiği durumlar zaten var, örneğin tomografi analizlemek için bir model uygulanarak akciğer kanseri erken teşhisi. Arjantin'de hatta, 2018'de kurulan ve bölgede İY tarafından desteklenen görüntü tanısının öncüsü konumunda olan Entelai adında bir şirket var.

Belirtmekten kaçınamayacağım ki İY'nin ilerlemesini donanım ve elektronik geliştirmesinin eşlik etmeden düşünmek imkansızdır, bu nedenle kuantum bilgisayarı (işleme kapasitesi optimizasyonuyla birlikte) giderek daha çok yankı uyandırıyor ve Google veya Microsoft gibi büyük şirketler kuantum işlemciler piyasaya sürmeye başlıyor.

Sabrina Bottazzi

Bio-IA: derin öğrenme protein araştırmasına uygulanıyor

Proteinler nedir

Proteinler nasıl incelenir

AlphaFold ve RFdiffusion

Gelecek Neler Getiriyor

Related posts