یک مدل محاسباتی جدید، ساختار آنتی‌بادی‌ها را با دقت بیشتری پیش‌بینی می‌کند

پژوهشگران با تطبیق مدل‌های هوش مصنوعی که به‌عنوان مدل‌های زبانی بزرگ (Large Language Models) شناخته می‌شوند، توانسته‌اند پیشرفت چشمگیری در توانایی پیش‌بینی ساختار پروتئین‌ها از روی توالی آن‌ها حاصل کنند. اما این رویکرد برای آنتی‌بادی‌ها چندان موفق نبوده است، بخشی به دلیل تغییرپذیری بالایی که در این نوع پروتئین‌ها مشاهده می‌شود.

برای غلبه بر این محدودیت، پژوهشگران مؤسسه فناوری ماساچوست (MIT) یک تکنیک محاسباتی توسعه داده‌اند که به مدل‌های زبانی بزرگ کمک می‌کند ساختار آنتی‌بادی‌ها را با دقت بیشتری پیش‌بینی کنند. این کار می‌تواند به پژوهشگران کمک کند تا از میان میلیون‌ها آنتی‌بادی ممکن، آن‌هایی را شناسایی کنند که برای درمان بیماری‌هایی مانند SARS-CoV-2 و دیگر بیماری‌های عفونی مناسب هستند.

«روش ما امکان گسترش در سطح بالا را فراهم کرده، در حالی که روش‌های دیگر این‌گونه نیستند. این روش به ما کمک می‌کند که در نهایت چند مورد از بهترین گزینه‌ها را شناسایی کنیم»، می‌گوید بانی برگر، استاد ریاضیات در MIT، سرپرست گروه محاسبات و زیست‌شناسی در آزمایشگاه علوم کامپیوتر و هوش مصنوعی (CSAIL) این دانشگاه و یکی از نویسندگان ارشد این مطالعه. «اگر بتوانیم به شرکت‌های داروسازی کمک کنیم که از ورود به کارآزمایی‌های بالینی با مولکول‌های نادرست خودداری کنند، واقعاً می‌تواند مقدار زیادی از هزینه‌ها را صرفه‌جویی کند.»

این تکنیک که بر مدل‌سازی نواحی با تغییرپذیری بالا در آنتی‌بادی‌ها متمرکز است، پتانسیل مطالعه مجموعه کامل آنتی‌بادی‌های بدن افراد را نیز دارد. این می‌تواند برای بررسی پاسخ ایمنی افرادی که به بیماری‌هایی مانند HIV فراواکنش نشان می‌دهند، کمک‌کننده باشد تا دلایل کارایی بالای آنتی‌بادی‌های آن‌ها در مقابله با ویروس شناسایی شود.

این مقاله پژوهشی که توسط برایان بریسون، استاد مهندسی زیست‌پزشکی در MIT و یکی از نویسندگان ارشد این مطالعه نوشته شده است، در مجله آکادمی ملی علوم منتشر شده است. سایر نویسندگان اصلی این مقاله روحیت سینگ، پژوهشگر سابق CSAIL و اکنون استاد دانشگاه Duke، و چیهو ایم هستند. همچنین محققانی از شرکت Sanofi و ETH Zurich در این تحقیق مشارکت داشته‌اند.

مدل‌سازی تغییرپذیری بالا

پروتئین‌ها از زنجیره‌های طولانی اسید آمینه‌ها تشکیل شده‌اند که می‌توانند به تعداد بسیار زیادی از ساختارهای ممکن تا شوند. در سال‌های اخیر، با استفاده از برنامه‌های هوش مصنوعی مانند AlphaFold، پیش‌بینی این ساختارها به‌طور چشمگیری ساده‌تر شده است. بسیاری از این برنامه‌ها مانند ESMFold و OmegaFold بر اساس مدل‌های زبانی بزرگ ساخته شده‌اند، که در ابتدا برای تحلیل مقادیر عظیمی از متن توسعه پیدا کردند و به آن‌ها امکان پیش‌بینی کلمه بعدی در یک جمله را می‌دهند. این رویکرد مشابه می‌تواند در پیش‌بینی ساختار پروتئین‌ها از روی توالی اسید آمینه‌ها نیز کارگشا باشد.

با این حال، این روش برای آنتی‌بادی‌ها همیشه کارایی ندارد، به‌ویژه برای بخشی از آنتی‌بادی که به‌عنوان ناحیه تغییرپذیر بالا شناخته می‌شود. آنتی‌بادی‌ها ساختار Y‌شکل دارند و این نواحی در انتهای بازوی Y قرار دارند، جایی که پروتئین‌های خارجی یا آنتی‌ژن‌ها شناسایی و به آن‌ها متصل می‌شوند. بخش پایینی Y وظیفه پشتیبانی ساختاری و تعامل با سلول‌های ایمنی را بر عهده دارد.

برای غلبه بر این چالش، محققان دو ماژول طراحی کرده‌اند که بر اساس مدل‌های زبانی موجود برای پروتئین عمل می‌کنند. یکی از این ماژول‌ها با استفاده از حدود ۳۰۰۰ ساختار آنتی‌بادی موجود در بانک اطلاعاتی پروتئین (PDB) آموزش دیده است تا رابطه بین توالی‌ها و ساختارهای مشابه را تشخیص دهد. ماژول دیگر شامل داده‌هایی است که حدود ۳۷۰۰ توالی آنتی‌بادی را به قدرت اتصال آن‌ها به سه آنتی‌ژن مختلف مرتبط می‌کند.

مدل نهایی که “AbMap” نام دارد، می‌تواند ساختار آنتی‌بادی و قدرت اتصال آن به آنتی‌ژن‌ها را تنها با استفاده از توالی اسید آمینه آن پیش‌بینی کند. تیم پژوهشی برای نشان دادن کارایی این مدل، از آن برای پیش‌بینی ساختار آنتی‌بادی‌هایی استفاده کردند که به طور قوی می‌توانند با پروتئین اسپایک ویروس SARS-CoV-2 تعامل کنند.

مقایسه آنتی‌بادی‌ها

این روش همچنین می‌تواند به بررسی تفاوت پاسخ ایمنی افراد به عفونت کمک کند. برای مثال، چرا برخی افراد به شدت به کووید مبتلا می‌شوند، در حالی که برخی دیگر هرگز به HIV آلوده نمی‌شوند؟

تحقیقات پیشین نشان داده است که آنتی‌بادی‌های دو فرد ممکن است تنها ۱۰ درصد شباهت داشته باشند. اما این مدل جدید می‌تواند با سرعت بالا ساختار تمامی آنتی‌بادی‌های موجود در بدن یک فرد را تولید کند. یافته‌های اولیه تیم نشان می‌دهد که در هنگام در نظر گرفتن ساختار، همپوشانی آنتی‌بادی‌ها بین افراد بیشتر از ۱۰ درصدی است که از مقایسه توالی مشاهده شده بود.

این پژوهش توسط شرکت Sanofi و کلینیک عبداللطیف جمیل برای یادگیری ماشین در حوزه سلامت تأمین مالی شده است. برای اطلاعات بیشتر، می‌توانید به این لینک مراجعه کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *