مدلهای تولید ویدیویی برای دنیای مولکولی
با پیشرفتهای شگرف هوش مصنوعی مولد، شاهد بودیم که این فناوری چگونه میتواند متنهای ساده را به تصاویر فوقالعاده واقعی و حتی کلیپهای ویدیویی پیشرفته تبدیل کند. اما اکنون، این فناوری به حوزه علوم شیمی و زیستشناسی نیز راه پیدا کرده و امکان بررسی مولکولهای ایستا مانند پروتئینها و DNA را فراهم آورده است.
مدلهایی مانند **AlphaFold** امکان پیشبینی ساختار مولکولها را فراهم کردهاند و به کشف داروهای جدید سرعت میبخشند. همچنین مدلهایی از جمله “RFdiffusion” که با همکاری موسسه فناوری ماساچوست (MIT) توسعه یافتهاند، در طراحی پروتئینهای نوین کمک بزرگی ارائه میدهند. اما مشکل اینجاست که مولکولها دائماً در حال حرکت و تکان خوردن هستند و این جنبه باید برای طراحی داروها و پروتئینهای جدید به دقت شبیهسازی شود.
شبیهسازی این حرکات از طریق تکنیکهای سنتی فیزیکی، که به عنوان دینامیک مولکولی شناخته میشوند، نیازمند منابع محاسباتی بسیار سنگین است و ممکن است میلیاردها گام زمانی را در ابررایانهها نیاز داشته باشد.
### معرفی سیستم MDGen: فناوری جدید MIT برای شبیهسازی دینامیک مولکولی
برای مقابله با این چالش، گروهی از پژوهشگران MIT در بخش علوم کامپیوتر و هوش مصنوعی (CSAIL) و ریاضیات، مدل جدیدی به نام **MDGen** توسعه دادهاند. این مدل مولد از دادههای قبلی یاد میگیرد تا رفتار مولکولها را پیشبینی کند. به کمک MDGen، میتوان یک فریم سهبعدی از یک مولکول را دریافت کرده و پیشبینی کرد که در فریم بعدی چه رخ خواهد داد؛ مشابه یک ویدیو. همچنین این سیستم قادر است فریمهای جداگانه را به هم متصل کرده و فریمهای گمشده را بازسازی کند.
ابزار MDGen به نوعی “دکمه پخش” را بر روی دنیای مولکولی فشار میدهد و میتواند به شیمیدانان کمک کند مولکولهای جدید طراحی کنند و نحوه تعامل پروتوتایپهای دارویی خود را با ساختارهای مولکولی بررسی کنند.
یکی از نویسندگان اصلی این مقاله، **بوون جینگ** (Bowen Jing)، این فناوری را یک “اثبات مفهوم اولیه” میداند که مسیر جدید و هیجانانگیزی را در تحقیقات پیش رو باز میکند:
> “ابتدا مدلهای مولد ویدیوهای سادهای تولید میکردند، مانند پلک زدن یک فرد یا تکان دادن دم یک سگ. اما اکنون، با پیشرفتهایی که شاهد آن هستیم، این مدلها توانایی شبیهسازیهای بسیار دقیقی پیدا کردهاند. هدف ما این است که این رویکرد را به دنیای مولکولی بیاوریم، جایی که دینامیک مولکولها همانند ویدیوهای واقعی شبیهسازی شود.”
### تفاوت MDGen با روشهای پیشین
MDGen رویکردی متمایز نسبت به روشهای گذشته دارد. در حالی که روشهای قبلی به صورت **بازگشتی** (autoregressive) عمل میکردند و هر فریم را بر پایه فریم قبلی تولید میکردند، MDGen فریمها را به صورت **موازی** ایجاد میکند. این قابلیت به MDGen این امکان را میدهد که فریمها را در ابتدا و انتهای توالی به هم متصل کند یا نرخ فریمهای یک توالی را افزایش دهد.
این تحقیق در کنفرانس **NeurIPS** در دسامبر گذشته ارائه شد و تابستان پیش نیز در کنفرانس **Machine Learning for Pharmaceutical Discovery** به دلیل پتانسیل تجاریاش مورد تقدیر قرار گرفت.
### پیشرفتهای کوچک، گامهای بزرگ
در آزمایشها، تیم پژوهشی دریافت که شبیهسازیهای MDGen بسیار نزدیک به شبیهسازیهای فیزیکی واقعی هستند، اما 10 تا 100 برابر سریعتر انجام میشوند.
برای آزمایش، آنها قابلیتی از MDGen را بررسی کردند که توانست یک فریم سهبعدی از مولکول را دریافت کرده و 100 نانوثانیه متوالی را شبیهسازی کند. این مدل با دقتی قابلمقایسه با دیگر روشها، در کمتر از 1 دقیقه ویدیویی تولید کرد که به طور سنتی نیاز به 3 ساعت محاسبات داشت.
علاوه بر این، مدل توانست حرکات میان فریم اول و آخر یک توالی یکنانوثانیهای را با دقت شبیهسازی کند. در بیش از 100,000 پیشبینی، MDGen توانست حرکات محتملتری نسبت به مدلهای مرجع نشان دهد و حتی توانایی تعمیمدهی به مولکولهای جدید را نیز داشت.
یکی از ویژگیهای جالب MDGen قابلیت تولید فریمهای گمشده است که به دانشمندان اجازه میدهد حرکات مولکولی سریعتر را بهتر شبیهسازی کنند. این قابلیت میتواند برای طراحی پروتئینها بر اساس مشخصات خاص، بسیار مفید باشد.
### مسیر پیش رو
بوون جینگ و هانس استارک، دیگر نویسنده این پژوهش، بر این باورند که MDGen یک گام اولیه به سوی دینامیک مولکولی کارآمدتر است. اما هنوز داده کافی برای کاربردهای پیشرفتهتر مانند طراحی دقیق دارو یا مولکولهای هدفمند در دسترس ندارند.
آنها امیدوارند با توسعه این مدل، بتوانند تغییرات بلندمدت پروتئینها را پیشبینی کنند. استارک میگوید: “در حال حاضر ما از سیستمهایی ساده استفاده میکنیم. برای ارتقا MDGen به سطح پروتئینها، باید معماری مدل و دادههای موجود را افزایش دهیم. متأسفانه هنوز یک مخزن داده بزرگ مانند یوتیوب برای این شبیهسازیها وجود ندارد و به همین دلیل نیاز به توسعه روش جدیدی برای تسریع فرآیند جمعآوری دادهها داریم.”
در مجموع، MDGen پتانسیل زیادی برای شبیهسازی تغییرات مولکولی دارد که با چشم غیرمسلح قابل دیدن نیستند.
### نتیجهگیری
به گفته **بونی برگر**، استاد ریاضیات MIT و یکی از نویسندگان ارشد این مقاله:
> “روشهای یادگیری ماشین که از شبیهسازیهای فیزیکی یاد میگیرند، پیشرفت جدیدی در AI برای کاربردهای علمی هستند. MDGen یک چارچوب مدلسازی چندمنظوره و همهکاره است که میان این دو حوزه ارتباط برقرار میکند.”
برای خواندن مقاله کامل، به مرجع زیر مراجعه کنید:
[NeurIPS Conference](https://neurips.cc/)