Η τεχνολογία Τεχνητής Νοημοσύνης AlphaFold της DeepMind (ανήκει στην Alphabet, τη “μαμά” της Google) ανοίγει νέους ορίζοντες για τους επιστήμονες αφού κατάφερε να επιλύσει ένα πρόβλημα 50ετίας. Οι βιολόγοι προσπαθούν όλα αυτά τα χρόνια να προβλέψουν τους τρόπους με τους οποίους δημιουργούνται οι τρισδιάστατες δομές των πρωτεϊνών, όπως και τις μεταβολές τους, έτσι ώστε να κατανοήσουν καλύτερα τις λειτουργίες τους και τον ρόλο τους στις διάφορες ασθένειες.
Οι πρωτεΐνες είναι απαραίτητες σε όλους τους ζωντανούς οργανισμούς και παίζουν σημαντικό ρόλο στις χημικές διαδικασίες που είναι απαραίτητες για τη ζωή. Αποτελούνται από αλυσίδες αμινοξέων και διπλώνονται με έναν πρακτικά άπειρο αριθμό τρόπων σε πολύπλοκα σχήματα, τα οποία κρύβουν το «κλειδί» για τον τρόπο που οι πρωτεΐνες πραγματοποιούν τις λειτουργίες τους. Εδώ και δεκαετίες οι ερευνητές χρησιμοποιούν σύγχρονα εργαλεία (π.χ. κρυσταλλογραφία ακτίνων Χ και ειδικά μικροσκόπια) για τη μελέτη τους, παρόλα αυτά, είναι εξαιρετικά δύσκολο να γίνει πρόβλεψη για την τελική μορφή που θα πάρει αυτή η αλληλουχία των αμινοξέων. Η γνώση επί της τρισδιάστατης δομής μιας πρωτεΐνης είναι σημαντική για τον σχεδιασμό φαρμάκων και την κατανόηση ασθενειών- μεταξύ των οποίων ο καρκίνος, η άνοια και άλλες, μολυσματικές ασθένειες, όπως η Covid-19.
Το 1972 ο Κρίστιαν Άνφινσεν είχε πάρει Νόμπελ για τη δουλειά του, η οποία έδειχνε ότι θα έπρεπε να είναι δυνατόν να καθοριστεί το σχήμα των πρωτεϊνών με βάση την αλληλουχία των αμινοξέων. Κάθε δύο χρόνια, πολλές ομάδες από πάνω από 20 χώρες προσπαθούν «στα τυφλά» να προβλέψουν με υπολογιστές το σχήμα ενός σετ περίπου 100 πρωτεϊνών από τις αλληλουχίες αμινοξέων τους.
Κάπου εδώ έρχεται να σώσει την κατάσταση το σύστημα AlphaFold της DeepMind, το οποίο πρωτοπαρουσιάστηκε σε μια πρώιμη μορφή του το 2018 στην εκδήλωση CASP (Critical Assessment of protein Structure Prediction) και ξεχώρισε μακράν απ’ όλους τους ανταγωνιστές του. Πλέον, η ανάπτυξη του έχει προχωρήσει σε τέτοιο βαθμό που κάνουν λόγο για “εκπληκτική πρόοδο”, διότι εκπαιδεύτηκε με δεδομένα από 170.000 γνωστές πρωτεϊνικές δομές και μια τεράστια βάση τυχαίων δομών. Η βαθμολογία που έλαβε στην κλίμακα Global Distance (αξιολογεί το ποσοστό των σωστών θέσεων των αμινοξέων στην πρωτεϊνική δομή) έφτασε στο 92.4 με άριστα το 100.
Το AlphaFold βασίζεται στο deep learning (μηχανική μάθηση). Επί της προκείμενης, η δομή μιας διπλωμένης πρωτεΐνης αναπαρίσταται ως γράφημα. Το πρόγραμμα μετά «μαθαίνει» χρησιμοποιώντας πληροφορίες για τα τρισδιάστατα σχήματα των γνωστών πρωτεϊνών που βρίσκονται στην Public Database of Proteins. Tο πρόγραμμα τεχνητής νοημοσύνης ήταν σε θέση να κάνει μέσα σε ημέρες αυτό που θα χρειαζόταν χρόνια στο εργαστήριο.
Όπως αναφέρει ο καθηγητής Andrei Lupas, διευθυντής του τμήματος Αναπτυξιακής Βιολογίας στο Max Planck Institute,
Τα εκπληκτικής ακρίβειας μοντέλα του συστήματος AlphaFold μας επέτρεψαν να λύσουμε ένα πρόβλημα πρωτεϊνικής δομής που μας απασχολούσε εδώ και σχεδόν 10 χρόνια, αλλά και να κατανοήσουμε πως μεταδίδονται τα σήματα σε κυτταρικές μεμβράνες. Είναι ένα εργαλείο που αλλάζει οριστικά το παιχνίδι.
Από την άλλη, ο βραβευμένος με Νόμπελ καθηγητής Venki Ramakrishnan, σημείωσε:
Πρόκειται για μια εκπληκτική εξέλιξη στην επίλυση του προβλήματος των πρωτεϊνικών δομών, το οποίο αποτελεί πρόκληση για τη Βιολογία εδώ και 50 χρόνια. Συνέβη, μάλιστα, δεκαετίες νωρίτερα απ’ ό,τι προέβλεπαν πολλοί ειδικοί του χώρου μας και ανυπομονούμε να τη δούμε να αλλάζει ριζικά την έρευνα στον τομέα μας.
Το σύστημα AlphaFold θα συνεχίσει να εκπαιδεύεται διαρκώς, άρα θα βελτιώνεται ακόμη περισσότερο με τον καιρό. Η εκμετάλλευση του θα βοηθήσει σημαντικά τους ερευνητές να αναγνωρίσουν τις “κακόβουλες” πρωτεΐνες και τους λόγους που προκαλούν συγκεκριμένες ασθένειες. Η αναγνώριση αυτή θα βοηθήσει στην ανάπτυξη θεραπειών και στη δημιουργία νέων φαρμάκων που θα επιταχύνουν δραματικά την καταπολέμηση τους. Δεν αποκλείεται η δυνατότητα πρόβλεψης να βοηθήσει στην αποφυγή μελλοντικών πανδημιών από νέους ιούς ή ακόμη και την ανάπτυξη ειδικών ενζύμων που θα λύσουν το πρόβλημα με την αποδόμηση των πλαστικών.