هر سلول در بدن انسان حاوی یک توالی ژنتیکی یکسان است، اما هر سلول تنها بخشی از این ژنها را بیان میکند. این الگوهای خاص بیان ژن در سلولها که مشخص میکنند یک سلول مغزی با یک سلول پوستی متفاوت باشد، تا حدی توسط ساختار سهبعدی ماده ژنتیکی تعیین میشوند که کنترل دستیابی به هر ژن را بر عهده دارد.
شیمیدانهای موسسه فناوری ماساچوست (MIT) حالا با استفاده از هوش مصنوعی مولد (Generative AI) روشی جدید برای تعیین این ساختارهای سهبعدی ژنوم یافتهاند. این روش میتواند در عرض چند دقیقه هزاران ساختار را پیشبینی کند و به طرز چشمگیری سریعتر از روشهای تجربی موجود برای تحلیل این ساختارها عمل میکند.
با استفاده از این تکنیک، محققان میتوانند راحتتر بررسی کنند که سازماندهی سهبعدی ژنوم چگونه بر الگوهای بیان ژن و عملکرد سلولهای مختلف تأثیر میگذارد.
به گفته بین ژانگ، استادیار شیمی و نویسنده ارشد این مطالعه: “هدف ما پیشبینی ساختار سهبعدی ژنوم از توالی DNA اصلی بود. حالا که به این هدف رسیدهایم، این تکنیک همرده با روشهای تجربی پیشرفته قرار میگیرد و میتواند فرصتهای جالبتوجهی باز کند.”
این تحقیق توسط دانشجویان دکتری MIT، گِرِگ شوت و زووهان لائو، انجام شده و نتایج آن در مجله Science Advances منتشر شده است.
از توالی تا ساختار
درون هسته سلول، DNA و پروتئینها ساختاری به نام کروماتین را تشکیل میدهند که دارای چندین سطح از سازماندهی است و به سلولها امکان میدهد تا دو متر DNA را در هستهای به قطر تنها یک صدم میلیمتر جا دهند. رشتههای بلند DNA به دور پروتئینهایی به نام هیستون پیچیده میشوند و ساختاری شبیه به مهرههای روی نخ به وجود میآورند.
تگهای شیمیایی که به عنوان اصلاحات اپیژنتیک شناخته میشوند، میتوانند در نقاط خاصی به DNA متصل شوند و این تگها که بسته به نوع سلول متفاوت هستند، بر تا شدن کروماتین و دسترسیپذیری ژنهای اطراف تأثیر میگذارند. تفاوتهای موجود در ساختار کروماتین به تعیین اینکه کدام ژنها در انواع سلول مختلف یا در زمانهای متفاوت در یک سلول خاص بیان شوند، کمک میکند.
در دو دهه اخیر، دانشمندان تکنیکهای تجربی برای تعیین ساختارهای کروماتین توسعه دادهاند. یکی از روشهای پرکاربرد، که به عنوان Hi-C شناخته میشود، با متصل کردن رشتههای DNA مجاور درون هسته سلول عمل میکند. محققان سپس میتوانند با خرد کردن DNA به قطعات کوچک و توالییابی آن، مشخص کنند کدام بخشها در کنار یکدیگر قرار دارند.
با این حال، روشهایی مانند Hi-C بسیار زمانبر هستند و ممکن است یک هفته طول بکشد تا دادههای مربوط به یک سلول تولید شود.
برای رفع این محدودیتها، تیم تحقیقاتی MIT مدلی بر اساس هوش مصنوعی طراحی کرده است که به سرعت و دقت ساختارهای کروماتین را برای سلولهای منفرد پیشبینی میکند. این مدل میتواند توالیهای DNA را به سرعت تحلیل کرده و ساختارهایی را پیشبینی کند که آن توالیها ممکن است در سلول ایجاد کنند.
مدل پیشرفته ChromoGen
مدلی که محققان با نام ChromoGen ایجاد کردهاند، از دو بخش تشکیل شده است. بخش اول، یک مدل یادگیری عمیق است که برای “خواندن” ژنوم طراحی شده و اطلاعات رمزگذاریشده در توالی DNA و دادههای دسترسیپذیری کروماتین را تحلیل میکند. این دادهها به طور گسترده در دسترس هستند و برای انواع سلول متفاوتاند.
بخش دوم یک مدل تولیدی هوش مصنوعی است که قادر به پیشبینی ساختارهای کروماتین بهصورت فیزیکی دقیق است. این مدل با استفاده از بیش از 11 میلیون ساختار کروماتین که از آزمایشهای روش Dip-C به دست آمده، آموزش داده شده است.
این ترکیب از دو بخش به مدل امکان میدهد ویژگیهای خاص هر نوع سلول را در پیشبینی ساختارها لحاظ کند. برای هر توالی، مدل چندین ساختار ممکن را تولید میکند، زیرا DNA یک مولکول بسیار نامنظم است و میتواند ساختارهای متفاوتی ایجاد کند.
تحلیل سریع و دقیق
پس از آموزش، این مدل میتواند پیشبینیهای خود را با سرعتی بسیار بالاتر از روشهای تجربی مانند Hi-C انجام دهد. به گفته شوت: “در حالی که ممکن است شش ماه زمان صرف کنید تا با آزمایش چند ده ساختار را برای یک نوع سلول دریافت کنید، مدل ما میتواند در 20 دقیقه هزار ساختار را تنها با یک GPU تولید کند.”
محققان پس از آموزش مدل خود، پیشبینی ساختارها را برای بیش از 2000 توالی DNA انجام دادند و آنها را با دادههای تجربی مقایسه کردند. نتایج نشان داد که ساختارهای پیشبینیشده توسط مدل مشابه یا تقریباً همانند ساختارهای مشاهدهشده در دادههای آزمایشی بودند.
این مدل همچنین توانست پیشبینیهای دقیقی برای دادههای سلولهایی غیر از آنچه بر اساس آن آموزش دیده بود ارائه کند. این موضوع نشان میدهد که مدل میتواند به تحلیل تفاوتهای ساختارهای کروماتین بین انواع سلولها کمک کند و نقش این تفاوتها در عملکرد سلول را بررسی کند.
یکی دیگر از کاربردهای احتمالی این مدل، بررسی این است که چگونه جهشهای موجود در یک توالی خاص DNA ساختار کروماتین را تغییر میدهند و این تغییرات چگونه ممکن است باعث بیماری شوند.
ژانگ در اینباره میگوید: “سؤالات جذاب زیادی وجود دارند که میتوانیم با این نوع مدل بررسی کنیم.”
تمام دادهها و مدل این تحقیق توسط تیم به صورت عمومی در دسترس قرار گرفته است تا سایر پژوهشگران نیز بتوانند از آن بهره ببرند.
این پژوهش با حمایت مؤسسه ملی سلامت ایالات متحده تأمین مالی شده است.