
וִידֵאוֹ: בקצה קוד החיים

2023 מְחַבֵּר: Peter Bradberry | [email protected]. שונה לאחרונה: 2023-05-21 22:33
באמצעות למידה ממוחשבת, כריס וויגינס מקווה לפתח מודלים שיכולים לחזות כיצד כל הגנים של האורגניזם מתנהגים בשום מצב - ובכך להסביר בדיוק מדוע תאים מסוימים חולים או סרטניים.

באוטובוס הסעות מ / אל שדה התעופה למכון קוולי לפיזיקה תיאורטית בסנטה ברברה, קליפורניה, כריס וויגינס קיבל את עצתו של עמית ופתח גיליון אלקטרוני של Microsoft Excel. זה לא היה קשור לדיבור על פיזיקה ביו-פולימרית שהוא הוזמן לתת. במקום זאת העמודות ושורות המספרים שהביטו בו בחזרה התייחסו לפעילות הגנטית של שמרים נובטים. באופן ספציפי, המספרים ייצגו את כמות ה- RNA של המסנג'ר (mRNA) שבאה לידי ביטוי על ידי כל 6, 200 הגנים של השמרים במהלך מחזור הרבייה שלה. "זו הייתה הפעם הראשונה שראיתי דבר כזה," נזכר ויגינס באותו יום האביב בשנת 2002. "איך אתה מתחיל להבין את כל הנתונים האלה?".
במקום להתרחק משאלה זו, המתמטיקאי והפיזיקאי היישומי בן ה -36 מאוניברסיטת קולומביה אימץ אותה - וכעת שש שנים אחר כך הוא חושב שיש לו תשובה. על ידי פשיטה לשדות מחוץ לשלו, וויגינס הטיל כלים מענף של בינה מלאכותית המכונה למידת מכונה כדי לדגמן את פעילות ייצור החלבון הקולקטיבי של גנים מנתונים ביולוגיים בעולם האמיתי. מהנדסים תכננו במקור כלים אלה בסוף שנות ה -50 לחיזוי תפוקה מהקלט. וויגינס ועמיתיו הביאו עתה למידת מכונה למדעי הטבע והתאימו אותה כך שתוכל לספר סיפור לא רק על קלט ופלט אלא גם על מה שקורה במודל של ויסות גנים, הקופסה השחורה שביניהם.
התנופה לעבודה זו החלה בסוף שנות התשעים, כאשר טכניקות תפוקה גבוהה ייצרו יותר פרופילי ביטוי mRNA ורצפי DNA מאי פעם, "ופתח דרך אחרת לגמרי לחשוב על תופעות ביולוגיות", אומר ויגינס. המפתח בין טכניקות אלה היו מיקרו מערכי DNA, שבבים המספקים תצוגה פנורמית של פעילות הגנים ורמות הביטוי שלהם בכל סוג תאים בו זמנית ובתנאים עצומים. ככל שהנתונים היו רועשים ולא שלמים, ביולוגים יכלו כעת לשאול אילו גנים נדלקים או נכבים בתאים שונים ולקבוע את אוסף החלבונים שמולידים את המאפיינים האופייניים של התא - בריאים או חולים.
עם זאת, ניבוי פעילות גנים מסוג זה מחייב גילוי הכללים הבסיסיים השולטים בה. "עם הזמן הכללים הללו ננעלו על ידי תאים", אומר הפיזיקאי התיאורטי הרמן בוסמייקר, כיום פרופסור חבר לביולוגיה בקולומביה. "האבולוציה שמרה על הדברים הטובים.".
כדי למצוא כללים אלה, המדענים היו זקוקים לסטטיסטיקה כדי להסיק את האינטראקציה בין גנים לחלבונים המווסתים אותם ולתאר באופן מתמטי את המבנה הבסיסי של רשת זו - הדפוס הדינמי של פעילות הגן והחלבון לאורך זמן. אבל פיזיקאים שלא עבדו עם חלקיקים (או כוכבי לכת, לצורך העניין) ראו בסטטיסטיקה לא פחות מאנאתמה. "אם הניסוי שלך דורש סטטיסטיקה", אמר פעם הפיזיקאי הבריטי ארנסט רתרפורד, "היית צריך לעשות ניסוי טוב יותר.".
אבל בעבודה עם מיקרו מערכים, "הניסוי נעשה בלעדיך", מסביר וויגינס. "וביולוגיה לא מעניקה לך מודל כדי להבין את הנתונים." מאתגר עוד יותר, אבני הבניין המרכיבות DNA, RNA וחלבונים מורכבים באינספור דרכים; יתר על כן, כללי אינטראקציה שונים בתכלית שולטים בפעילותם, מה שמקשה, אם לא בלתי אפשרי, להפחית את דפוסי האינטראקציה שלהם לחוקים בסיסיים. ישנם גנים וחלבונים שאינם ידועים אפילו. "אתה מנסה למצוא משהו משכנע על עולם הטבע בהקשר שבו אתה לא יודע כל כך הרבה", אומר ויליאם ביאלק, ביופיסיקאי מאוניברסיטת פרינסטון. "אתה נאלץ להיות אגנוסטי.".
וויגינס מאמין שאלגוריתמים רבים ללימוד מכונה מתפקדים היטב בתנאים אלה בדיוק. כשעובדים עם כל כך הרבה משתנים לא ידועים, "למידת מכונה מאפשרת לנתונים להחליט על מה כדאי להסתכל", הוא אומר.
במכון קוולי, ויגינס החל לבנות מודל של רשת ויסות גנים בשמרים - מכלול הכללים לפיו גנים ורגולטורים מתארזים באופן קולקטיבי עד כמה מועתק DNA בצורה נמרצת ל- mRNA. כשעבד עם אלגוריתמים שונים, הוא התחיל להשתתף בדיונים על ויסות גנים בהובלת כריסטינה לסלי, שניהלה באותה תקופה את קבוצת הביולוגיה החישובית בקולומביה. לסלי הציע להשתמש בכלי למידה מכונה ספציפי שנקרא מסווג. נניח שעל האלגוריתם להבחין בין תמונות שיש בהן אופניים לתמונות שאין. מסווג מעביר דוגמאות שכותרתו ומודד כל מה שהוא יכול לגביהם, ולומד בהדרגה את כללי ההחלטה השולטים בקיבוץ. מתוך כללים אלה, האלגוריתם מייצר מודל שיכול לקבוע אם תמונות חדשות כוללות אופניים או לא. ברשתות רגולטוריות גנטיות, משימת הלמידה הופכת לבעיית הניבוי האם הגנים מגדילים או מקטינים את פעילות יצירת החלבון שלהם.
האלגוריתם שוויגינס ולסלי החלו לבנות בסתיו 2002 הוכשר על רצפי ה- DNA ורמות ה- mRNA של הרגולטורים שבאו לידי ביטוי במהלך מגוון תנאים בשמרים - כאשר השמרים היו קרים, חמים, מורעבים וכו '. באופן ספציפי, אלגוריתם זה - MEDUSA (לאפליה של אלמנטים מוטיביים באמצעות צבירת רצפים) - סורק כל זיווג אפשרי בין קבוצה של רצפי מקדמי DNA, הנקראים מוטיבים ורגולטורים. ואז, כמו שילד עשוי להתאים לרשימת מילים להגדרות שלהם על ידי ציור קו בין השניים, MEDUSA מוצאת את הזיווג שמשפר בצורה הטובה ביותר את ההתאמה בין המודל לנתונים שהוא מנסה לחקות. (Wiggins מתייחס לזיווגים האלה כקצוות.) בכל פעם ש- MEDUSA מוצא זיווג, הוא מעדכן את הדגם על ידי הוספת כלל חדש כדי להנחות את החיפוש אחר הזיווג הבא. לאחר מכן הוא קובע את העוצמה של כל זיווג לפי מידת ההכללה המשפרת את המודל הקיים. היררכיית המספרים מאפשרת לוויגינס ועמיתיו לקבוע אילו זיווגים חשובים יותר מאחרים וכיצד הם יכולים להשפיע באופן קולקטיבי על הפעילות של כל אחד מ -6, 200 הגנים של השמרים. על ידי הוספת זיווג אחד בכל פעם, MEDUSA יכולה לנבא אילו גנים מחזירים את ייצור ה- RNA שלהם או מהדקים את הייצור הזה, כמו גם לחשוף את המנגנונים הקולקטיביים המתזמרים את הגיון התעתיק של האורגניזם.
ויגינס ועמיתיו יכולים כעת להרחיק לכת הרבה יותר מאשר שמרים. לאחרונה הם הראו כי MEDUSA יכולה לבנות במדויק מודלים ניבוי של רשתות ויסות גנים באורגניזמים גבוהים יותר כגון תולעים וכן במספר שורות תאים, כולל אלה של לימפוציטים אנושיים. בשורה של תאים סרטניים, הצוות יכול לקבוע אילו גנים מגבירים את פעילותם כאשר עליהם להפחית אותה, ולהיפך. המטרה הסופית, לעומת זאת, היא להבין את הפעילות המתואמת שלהם ולהסיק, עם נתונים סטטיסטיים, אילו אינטראקציות מובילות לתא חולה.
אף על פי ש- MEDUSA מנבאת חיזוי מדויק על נתוני הבדיקה, עדיין אין דרך לדעת אם היא משחזרת נאמנה רשתות ביולוגיות אמיתיות. לשם כך, כל חיבור יצטרך להיבדק בניסוי. לא ברור גם עד כמה נתוני מיקרו מערך מודדים את רמות הביטוי, ולכן חיזויים מדויקים עשויים לא בהכרח לשקף את האמת. יתר על כן, למידת מכונה מאלצת חוקרים לנסח השערות אד-הוק שעשויות להיות מוטות לתוצאותיהן, "כך שכל סוג של מתאם בנתונים עשוי להיות קל," מעיר יואב פרוינד מאוניברסיטת סן דייגו, שיצר את אלגוריתם הלמידה של MEDUSA.
כדי להתמודד עם מגבלות אלה, על החוקרים לא רק להמשיך לחצות תחומים אלא להיות מוכנים לאמץ את הכלים שלהם. "הייתי אומר שלימוד מכונה לא המריא כמו מאש בקהילת הפיזיקה", מעיר אלכס הרטמינק, מומחה למידת מכונות באוניברסיטת דיוק. "אבל לכריס נראה הכי נוח להגיע וללמוד טכניקות ממקומות אחרים. ואני חושב שאנחנו זקוקים לאנשים שהולכים לעשות את זה בכדי לצאת אל היער, למצוא משאבים חדשים ולהחזיר אותם לשבט ולהגיד, 'היי, חבר'ה, בדקו את זה - זה דברים נהדרים'."