هر سلول در بدن انسان حاوی یک توالی ژنتیکی یکسان است، اما هر سلول تنها بخشی از این ژن‌ها را بیان می‌کند. این الگوهای خاص بیان ژن در سلول‌ها که مشخص می‌کنند یک سلول مغزی با یک سلول پوستی متفاوت باشد، تا حدی توسط ساختار سه‌بعدی ماده ژنتیکی تعیین می‌شوند که کنترل دستیابی به هر ژن را بر عهده دارد.

شیمی‌دان‌های موسسه فناوری ماساچوست (MIT) حالا با استفاده از هوش مصنوعی مولد (Generative AI) روشی جدید برای تعیین این ساختارهای سه‌بعدی ژنوم یافته‌اند. این روش می‌تواند در عرض چند دقیقه هزاران ساختار را پیش‌بینی کند و به طرز چشمگیری سریع‌تر از روش‌های تجربی موجود برای تحلیل این ساختارها عمل می‌کند.

با استفاده از این تکنیک، محققان می‌توانند راحت‌تر بررسی کنند که سازمان‌دهی سه‌بعدی ژنوم چگونه بر الگوهای بیان ژن و عملکرد سلول‌های مختلف تأثیر می‌گذارد.

به گفته بین ژانگ، استادیار شیمی و نویسنده ارشد این مطالعه: “هدف ما پیش‌بینی ساختار سه‌بعدی ژنوم از توالی DNA اصلی بود. حالا که به این هدف رسیده‌ایم، این تکنیک هم‌رده با روش‌های تجربی پیشرفته قرار می‌گیرد و می‌تواند فرصت‌های جالب‌توجهی باز کند.”

این تحقیق توسط دانشجویان دکتری MIT، گِرِگ شوت و زووهان لائو، انجام شده و نتایج آن در مجله Science Advances منتشر شده است.

از توالی تا ساختار

درون هسته سلول، DNA و پروتئین‌ها ساختاری به نام کروماتین را تشکیل می‌دهند که دارای چندین سطح از سازمان‌دهی است و به سلول‌ها امکان می‌دهد تا دو متر DNA را در هسته‌ای به قطر تنها یک صدم میلی‌متر جا دهند. رشته‌های بلند DNA به دور پروتئین‌هایی به نام هیستون پیچیده می‌شوند و ساختاری شبیه به مهره‌های روی نخ به وجود می‌آورند.

تگ‌های شیمیایی که به عنوان اصلاحات اپی‌ژنتیک شناخته می‌شوند، می‌توانند در نقاط خاصی به DNA متصل شوند و این تگ‌ها که بسته به نوع سلول متفاوت هستند، بر تا شدن کروماتین و دسترسی‌پذیری ژن‌های اطراف تأثیر می‌گذارند. تفاوت‌های موجود در ساختار کروماتین به تعیین این‌که کدام ژن‌ها در انواع سلول‌ مختلف یا در زمان‌های متفاوت در یک سلول خاص بیان شوند، کمک می‌کند.

در دو دهه اخیر، دانشمندان تکنیک‌های تجربی برای تعیین ساختارهای کروماتین توسعه داده‌اند. یکی از روش‌های پرکاربرد، که به عنوان Hi-C شناخته می‌شود، با متصل کردن رشته‌های DNA مجاور درون هسته سلول عمل می‌کند. محققان سپس می‌توانند با خرد کردن DNA به قطعات کوچک و توالی‌یابی آن، مشخص کنند کدام بخش‌ها در کنار یکدیگر قرار دارند.

با این حال، روش‌هایی مانند Hi-C بسیار زمان‌بر هستند و ممکن است یک هفته طول بکشد تا داده‌های مربوط به یک سلول تولید شود.

برای رفع این محدودیت‌ها، تیم تحقیقاتی MIT مدلی بر اساس هوش مصنوعی طراحی کرده است که به سرعت و دقت ساختارهای کروماتین را برای سلول‌های منفرد پیش‌بینی می‌کند. این مدل می‌تواند توالی‌های DNA را به سرعت تحلیل کرده و ساختارهایی را پیش‌بینی کند که آن توالی‌ها ممکن است در سلول ایجاد کنند.

مدل پیشرفته ChromoGen

مدلی که محققان با نام ChromoGen ایجاد کرده‌اند، از دو بخش تشکیل شده است. بخش اول، یک مدل یادگیری عمیق است که برای “خواندن” ژنوم طراحی شده و اطلاعات رمزگذاری‌شده در توالی DNA و داده‌های دسترسی‌پذیری کروماتین را تحلیل می‌کند. این داده‌ها به طور گسترده در دسترس هستند و برای انواع سلول متفاوت‌اند.

بخش دوم یک مدل تولیدی هوش مصنوعی است که قادر به پیش‌بینی ساختارهای کروماتین به‌صورت فیزیکی دقیق است. این مدل با استفاده از بیش از 11 میلیون ساختار کروماتین که از آزمایش‌های روش Dip-C به دست آمده، آموزش داده شده است.

این ترکیب از دو بخش به مدل امکان می‌دهد ویژگی‌های خاص هر نوع سلول را در پیش‌بینی ساختارها لحاظ کند. برای هر توالی، مدل چندین ساختار ممکن را تولید می‌کند، زیرا DNA یک مولکول بسیار نامنظم است و می‌تواند ساختارهای متفاوتی ایجاد کند.

تحلیل سریع و دقیق

پس از آموزش، این مدل می‌تواند پیش‌بینی‌های خود را با سرعتی بسیار بالاتر از روش‌های تجربی مانند Hi-C انجام دهد. به گفته شوت: “در حالی که ممکن است شش ماه زمان صرف کنید تا با آزمایش چند ده ساختار را برای یک نوع سلول دریافت کنید، مدل ما می‌تواند در 20 دقیقه هزار ساختار را تنها با یک GPU تولید کند.”

محققان پس از آموزش مدل خود، پیش‌بینی ساختارها را برای بیش از 2000 توالی DNA انجام دادند و آن‌ها را با داده‌های تجربی مقایسه کردند. نتایج نشان داد که ساختارهای پیش‌بینی‌شده توسط مدل مشابه یا تقریباً همانند ساختارهای مشاهده‌شده در داده‌های آزمایشی بودند.

این مدل همچنین توانست پیش‌بینی‌های دقیقی برای داده‌های سلول‌هایی غیر از آنچه بر اساس آن آموزش دیده بود ارائه کند. این موضوع نشان می‌دهد که مدل می‌تواند به تحلیل تفاوت‌های ساختارهای کروماتین بین انواع سلول‌ها کمک کند و نقش این تفاوت‌ها در عملکرد سلول را بررسی کند.

یکی دیگر از کاربردهای احتمالی این مدل، بررسی این است که چگونه جهش‌های موجود در یک توالی خاص DNA ساختار کروماتین را تغییر می‌دهند و این تغییرات چگونه ممکن است باعث بیماری شوند.

ژانگ در این‌باره می‌گوید: “سؤالات جذاب زیادی وجود دارند که می‌توانیم با این نوع مدل بررسی کنیم.”

تمام داده‌ها و مدل این تحقیق توسط تیم به صورت عمومی در دسترس قرار گرفته است تا سایر پژوهشگران نیز بتوانند از آن بهره ببرند.

این پژوهش با حمایت مؤسسه ملی سلامت ایالات متحده تأمین مالی شده است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *