کابرد علم داده (Data Science) در تحلیل داده‌های ژنومیکی چیست؟


ژنتیک و ژنومیک هر دو در سلامت و بیماری نقش دارند. ژنتیک به مطالعه ژن‌ها و نحوه انتقال صفات یا شرایط خاص از نسلی به نسل دیگر اشاره دارد. ژنومیک مطالعه تمام ژن‌های یک فرد (ژنوم) را توصیف می‌کند. در این مقاله ابتدا به بررسی تفاوت‌های ژنتیک و ژنومیک پرداخته و سپس به توضیح کاربرد یک رشته‌ی نوظهور به نام علم داده (Data Science) در تجزیه و تحلیل داده های ژنتیکی و ژنومیکی می پردازیم.

تفاوت ژنتیک و ژنومیک در چیست؟

ژنتیک اصطلاحی است که به مطالعه ژن‌ها و نقش آن‌ها در وراثت اشاره دارد – به عبارت دیگر، نحوه انتقال برخی از صفات یا شرایط از نسلی به نسل دیگر. ژنتیک شامل مطالعات علمی ژن‌ها و اثرات آن‌ها می‌شود. ژن‌ها (واحدهای وراثت) حاوی دستورالعمل‌هایی برای ساخت پروتئین‌هایی هستند که فعالیت سلول‌ها و عملکردهای بدن را هدایت می‌کنند. نمونه‌هایی از اختلالات ژنتیکی یا ارثی عبارتند از فیبروز کیستیک (cystic fibrosis)، بیماری هانتینگتون (Huntington’s disease) و فنیل کتونوری (یا PKU که مخفف phenylketonuria است).

ژنومیک (Genomic) اصطلاح جدیدتری است که مطالعه همه ژن‌های یک فرد (ژنوم)، از جمله برهمکنش آن ژن‌ها با یکدیگر و با محیط اطراف را توصیف می‌کند. ژنومیک شامل مطالعه علمی بیماری‌های پیچیده مانند بیماری‌های قلبی، آسم، دیابت و سرطان است زیرا این بیماری‌ها معمولاً بیشتر توسط ترکیبی از عوامل ژنتیکی و محیطی ایجاد می‌شوند تا فقط ژن‌ها. ژنومیک امکانات جدیدی را برای معالجات و درمان برخی بیماری‌های پیچیده و همچنین روش‌های تشخیصی جدید ارائه می‌دهد.

اهمیت ژنتیک و ژنومیک برای سلامتی ما در چیست؟

ژنتیک و ژنومیک هر دو در سلامت و بیماری ما نقش دارند. ژنتیک به افراد کمک می‌کند تا در مورد چگونگی ارثی بودن بیماری‌هایی مانند کم‌خونی داسی‌شکل و فیبروز کیستیک، گزینه‌های غربالگری و آزمایشی در دسترس، و در برخی از شرایط ژنتیکی، درمان‌های در دسترس بیاموزند.

ژنومیک به محققان کمک می‌کند تا دریابند چرا برخی از افراد به دلیل برخی عفونت‌ها، عوامل محیطی و رفتارها(ی سبک زندگی) بیمار می‌شوند و برخی دیگر به این موارد پاسخ متفاوتی می‌دهند.

به‌عنوان مثال، برخی از افراد هستند که در تمام زندگی خود ورزش می‌کنند، رژیم غذایی سالمی دارند، معاینات پزشکی منظمی انجام می‌دهند و در سن ۴۰ سالگی بر اثر حمله قلبی می‌میرند. همچنین افرادی هستند که سیگار می‌کشند، هرگز ورزش نمی‌کنند، غذاهای ناسالم می‌خورند و تا ۱۰۰ سالگی زندگی می‌کنند. درواقع ژنومیک می‌تواند کلید درک این تفاوت‌ها باشد.

جدا از اتفاقات (مانند سقوط، تصادفات وسایل نقلیه، مسمومیت و …)، عوامل ژنومی در ۹ مورد از ده مورد علت اصلی مرگ‌ومیر در ایالات متحده نقش دارند (به‌عنوان مثال، بیماری قلبی، سرطان و دیابت. نگاه کنید به: علل اصلی مرگ‌و میر در ایالات متحده). همه انسان‌ها از نظر ساختار ژنتیکی ۹۹.۹ درصد یکسان هستند. تفاوت در ۰.۱ درصد باقی‌مانده سرنخ‌های مهمی در مورد علل بیماری‌ها دارد.

به دست آوردن درک بهتر از تعاملات بین ژن‌ها و محیط با استفاده از ژنومیک به محققان کمک می‌کند تا راه‌های بهتری برای بهبود سلامت و پیشگیری از بیماری‌ها پیدا کنند، مانند اصلاح رژیم غذایی و برنامه‌های ورزشی برای جلوگیری یا به تاخیر انداختن ابتلا به دیابت نوع ۲ در افراد دارای استعداد ژنتیکی برای ابتلا به این بیماری.

آزمایش ژنتیک

Photo by cottonbro from Pexels

چرا ژنتیک و ژنومیک برای سلامت خانوادگی مهم است؟

درک بیشتر بیماری‌های ناشی از یک ژن (با استفاده از ژنتیک) و بیماری‌های پیچیده ناشی از چندین ژن و عوامل محیطی (با استفاده از ژنومیک) می‌تواند به تشخیص‌ها، مداخلات و درمان‌های هدفمند سریع‌تر منجر شود. سلامت یک فرد تحت تأثیر سابقه خانوادگی و عوامل محیطی مشترک است. این موضوع، سابقه خانوادگی را به ابزاری مهم و شخصی‌سازی شده تبدیل می‌کند که می‌تواند به شناسایی بسیاری از عوامل ایجادکننده بیماری‌هایی که دارای یک جزء ژنتیکی نیز هستند، کمک کند.

سابقه خانوادگی می‌تواند به‌عنوان سنگ‌بنای تحقیق درمورد شرایط ژنتیکی و ژنومی در یک خانواده، و توسعه رویکردهای فردی برای پیشگیری، مداخله و درمان بیماری باشد.

تکنیک ها و فناوری های جدید ژنتیکی و ژنومی

  • پروتگان‌شناسی یا پروتئومیکس (Proteomics: دانش بررسی ساختار و عملکرد پروتئین‌ها)

پسوند “-ome” از زبان یونانی به معنی همه، همه یا کامل می آید. این در ابتدا در “ژنوم” استفاده می شد، که به تمام ژن های یک فرد یا موجودات دیگر اشاره دارد. با توجه به موفقیت پروژه‌های زیست‌شناسی در مقیاس بزرگ مانند تعیین توالی ژنوم انسان، پسوند “-ome” اکنون در زمینه‌های تحقیقاتی دیگر نیز استفاده می‌شود. پروتئومیکس یک نمونه از آن است.

توالی DNA ژن‌ها حاوی دستورالعمل‌ها یا کدهایی برای ساخت پروتئین‌ها هستند. این DNA به یک مولکول مرتبط به نام RNA رونویسی می‌شود و سپس به پروتئین ترجمه می‌شود. بنابراین، پروتئومیکس یک تجزیه و تحلیل مشابه در مقیاس بزرگ از همه پروتئین‌های موجود در یک ارگانیسم، نوع بافت یا سلول است. پروتئومیکس می‌تواند برای آشکارسازی پروتئین‌های خاص و غیرطبیعی که منجر به بیماری‌هایی مانند انواع خاصی از سرطان می‌شود، استفاده شود.

  • فارماکوژنتیک (Pharmacogenetics: داروژن‌شناسی) و فارماکوژنومیک (Pharmacogenomics)

اصطلاحات “فارماکوژنتیک” و “فارماکوژنومیک” در توصیف تلاقی دو زمینه‌ی علمی فارماکولوژی (مطالعه داروها) و تنوع ژنتیکی در تعیین پاسخ فرد به داروهای خاص اغلب به جای یکدیگر استفاده می‌شوند.

فارماکوژنتیک رشته مطالعاتی است که به تنوع پاسخ به داروها به دلیل تنوع در ژن‌های منفرد می‌پردازد. فارماکوژنتیک اطلاعات ژنتیکی فرد را درمورد گیرنده‌های دارویی خاص و نحوه انتقال و متابولیسم داروها توسط بدن در نظر می‌گیرد. هدف فارماکوژنتیک ایجاد یک دارو‌درمانی فردی است که امکان انتخاب و بهترین دوز دارو را فراهم می‌کند. یک نمونه از این زمینه‌ی علمی داروی سرطان سینه به نام  تراستوزوماب (trastuzumab یا Herceptin) است. این درمان فقط برای زنانی کار می‌کند که تومورهایشان مشخصات ژنتیکی خاصی دارد که منجر به تولید بیش از حد پروتئینی به نام HER2 می شود.

فارماکوژنومیک مشابه فارماکوژنتیک است، با این تفاوت که معمولاً شامل جستجوی تنوعات در چندین ژن است که با تنوع در پاسخ دارویی مرتبط است. از آنجایی که فارماکوژنومیک یکی از فناوری‌های “omic” در مقیاس بزرگ است، می‌تواند به جای ژن‌های منفرد کل ژنوم را بررسی کند. مطالعات فارماکوژنومیک همچنین ممکن است تنوع ژنتیکی را در میان گروه‌های بزرگی از افراد (جمعیت‌ها) بررسی کند تا ببیند داروهای مختلف چگونه میتواند بر گروه‌های نژادی یا قومی مختلف تأثیر بگذارد.

مطالعات فارماکوژنتیک و فارماکوژنومیک به ساخت داروهایی منجر می‌شود که می‌توانند برای افراد خاص ساخته شوند و با ساختار ژنتیکی خاص هر فرد سازگار شوند. اگرچه محیط، رژیم غذایی، سن، سبک زندگی و وضعیت سلامت فرد نیز می‌تواند بر پاسخ بدن آن فرد به داروها تأثیر بگذارد، اما درک ساختار ژنتیکی یک فرد کلیدی برای ایجاد داروهای شخصی‌سازی‌شده است که بهتر عمل می‌کنند و عوارض جانبی کمتری نسبت به داروهای یک‌‌دست برای همه -که امروزه رایج هستند- دارند.

به‌عنوان مثال، سازمان غذا و داروی ایالات متحده (FDA) آزمایش ژنتیکی را قبل از دادن داروی شیمی‌درمانی مرکاپتوپورین (Purinethol) به بیماران مبتلا به لوسمی لنفوبلاستیک حاد توصیه می‌کند. برخی از افراد یک نوع ژنتیکی دارند که در توانایی آن‌ها برای پردازش این دارو اختلال ایجاد می‌کند. این مشکل پردازش می‌تواند عوارض جانبی شدیدی ایجاد کند، مگر اینکه دوز استاندارد مطابق با ساختار ژنتیکی بیمار تنظیم شود.

  • درمان با سلولهای بنیادی

سلول‌های بنیادی دو ویژگی مهم دارند. اول، سلول‌های بنیادی سلول‌های غیرتخصصی هستند که می‌توانند به سلول‌های مختلف بدن تبدیل شوند. دوم اینکه سلول‌های بنیادی می‌توانند در حالت غیرتخصصی خود باقی بمانند و از خود کپی ایجاد کنند.

سلول‌های بنیادی جنینی از جنین در مراحل اولیه رشد (مرحله‌ی بلاستوسیست) حاصل می‌شوند. سلول‌های بنیادی بالغ از بافت‌های کاملاً توسعه‌یافته‌تر مانند خون بند ناف در نوزادان، خون در گردش، مغز استخوان یا پوست بدست می‌آیند.

امروزه محققان حوزه‌ی پزشکی استفاده از سلول‌های بنیادی را برای ترمیم یا جایگزینی بافت‌های آسیب‌دیده بدن استفاده می‌کنند. سلول‌های بنیادی جنینی توانایی تبدیل شدن از بلاستوسیست به هر نوع بافتی (پوست، کبد، کلیه، خون و غیره) که در یک انسان بالغ یافت می‌شود را دارند. سلول‌های بنیادی بالغ از نظر پتانسیل، محدودتر هستند (به‌عنوان مثال، سلول‌های بنیادی کبد می‌توانند فقط به سلول‌های کبدی تبدیل شوند).

ژنومیک چیست

Photo by cottonbro from Pexels

در پیوند اعضا، زمانی که بافت‌های اهدایی در بدن بیمار قرار می‌گیرد، این احتمال وجود دارد که سیستم ایمنی بیمار واکنش نشان دهد و بافت اهداشده را به‌عنوان “عامل خارجی” پس بزند. با این حال، با استفاده از سلول‌های بنیادی، ممکن است خطر این رد ایمنی کمتر باشد و درمان هم موفقیت‌آمیزتر باشد.

سلول‌های بنیادی در آزمایش‌هایی برای تشکیل سلول‌های مغز استخوان، قلب، عروق خونی و ماهیچه‌ها استفاده شده‌اند. از دهه ۱۹۹۰، سلول‌های بنیادی خون بند ناف برای درمان مشکلات قلبی و سایر مشکلات جسمی در کودکانی که شرایط متابولیک نادری دارند، یا برای درمان کودکان مبتلا به کم‌خونی‌ها و لوسمی‌های خاص استفاده شده است. به‌عنوان مثال، یکی از گزینه‌های درمانی برای لوسمی لنفوبلاستیک حاد دوران کودکی درمان پیوند سلول‌های بنیادی است.

بحث‌های زیادی درمورد استفاده از سلول‌های بنیادی جنینی، به‌ویژه درمورد خلق جنین‌های انسانی برای استفاده در آزمایش‌ها وجود داشته است. در سال ۱۹۹۵، کنگره آمریکا ممنوعیت تأمین مالی دولتی برای تحقیقات استفاده از جنین انسان را تصویب کرد. با این حال، این محدودیت‌ها باعث نشده است که محققان در ایالات متحده و جاهای دیگر برای ایجاد خطوط سلولی جنینی و انجام تحقیقات با آن‌ها از بودجه خصوصی استفاده نکنند.

جنین‌های چنین تحقیقاتی معمولاً از جنین‌هایی هستند که از تخمک‌هایی که در شرایط آزمایشگاهی بارور شده‌اند – مانند یک کلینیک لقاح آزمایشگاهی – ایجاد می‌شوند و سپس با رضایت آگاهانه اهداکنندگان برای اهداف تحقیقاتی اهدا می‌شوند.

  • Cloning یا همسانه‌سازی

همسانه‌سازی می‌تواند درمورد ژن‌ها، سلول‌ها یا موجودات کامل باشد. درمورد یک سلول، همسانه‌سازی به هر سلول ژنتیکی یکسان در جمعیتی اطلاق می‌شود که از یک جد منفرد و مشترک می‌آید. به‌عنوان مثال، وقتی یک سلول باکتریایی تک DNA خود را کپی می‌کند و هزاران بار تقسیم می‌شود، تمام سلول‌هایی که تشکیل می‌شوند حاوی DNA یکسان هستند و همسانه های یک سلول اجدادی باکتریایی مشترک خواهند بود.

همسانه‌سازی ژن شامل دستکاری هایی برای ایجاد چند نسخه یکسان از یک ژن واحد از یک ژن جد یکسان است. همسانه‌سازی ارگانیسم به معنای ساختن یک کپی ژنتیکی یکسان از تمام سلول‌ها، بافت‌ها و اندام‌های سازنده یک ارگانیسم است. دو نوع عمده همسانه‌سازی وجود دارد که ممکن است مربوط به انسان یا سایر حیوانات باشد: همسانه‌سازی درمانی و همسانه‌سازی تولید مثلی.

همسانه‌سازی درمانی شامل رشد سلول‌ها یا بافت‌های همسانه‌سازی‌شده از یک فرد، مانند بافت کبد جدید برای بیمار مبتلا به بیماری کبدی است. چنین تلاش‌هایی در همسانه‌سازی معمولاً شامل استفاده از سلول‌های بنیادی است. هسته از سلول بدن بیمار، مثلا از سلول کبد، گرفته می‌شود و در تخمکی که هسته‌ی آن برداشته شده، قرار می‌گیرد. این روند در نهایت یک بلاستوسیست تولید می‌کند که سلول‌های بنیادی آن می‌تواند برای ایجاد بافت جدیدی که از نظر ژنتیکی با بافت بیمار یکسان است مورد استفاده قرار گیرد.

همسانه‌سازی تولیدمثلی فرآیندی است که برای تولید یک حیوان کامل استفاده می‌شود و دارای DNA هسته‌ای مشابه با حیوان فعلی یا قبلی است. اولین حیوانات همسانه‌سازی‌شده قورباغه‌ها بودند. دالی (Dolly)، که یک گوسفند معروف است، نمونه‌ی دیگری از همسانه‌سازی تولیدمثلی است. با این حال، میزان موفقیت همسانه‌سازی حیوانات بسیار پایین بوده است. در سال ۲۰۰۵، محققان کره جنوبی ادعا کردند که با همسانه‌سازی مواد ژنتیکی از بیماران، خط سلول‌های بنیادی جنینی انسان را تولید کرده‌اند. اما بعداً گزارش شد که این داده‌ها جعل شده است.

اطلاعات ژنتیکی

Photo by Markus Spiske from Pexels

کاربرد علم داده در زمینه‌ی ژنومیک چیست؟

با استفاده از کاوش عمیق‌تر در ژنوم و تجزیه و تحلیل و تفسیر داده‌های ژنومی جمع‌آوری‌شده به درک بهتر سلامت و بیماری انسان کمک می‌کند. اما در این بین سؤالاتی درمورد حریم خصوصی و اخلاقیات نیز مطرح خواهد شد.

  • علم داده‌ ژنومیک زمینه‌ای از مطالعات علمی است که محققان را قادر می‌سازد تا از روش‌های محاسباتی و آماری قدرتمند برای رمزگشایی اطلاعات عملکردی پنهان در توالی‌های DNA استفاده کنند.
  • برآوردها پیش‌بینی می‌کنند که تحقیقات در زمینه‌ی علم ژنومیک در دهه آینده بین ۲ تا ۴۰ اگزابایت داده تولید خواهد کرد.
  • توانایی ما در تعیین توالی DNA بسیار بیشتر از توانایی‌هایمان در رمزگشایی اطلاعات موجود در آن است، بنابراین علم داده ژنومیک زمینه تحقیقاتی پرجنب‌و‌جوشی برای سال‌های آینده خواهد بود.
  • اجزای علم داده ژنومیک مجموعه‌ای از مسئولیت‌های اخلاقی را نیز به همراه دارد، زیرا داده‌های توالی هر فرد با مسائل مربوط به حریم خصوصی و هویت آن فرد نیز مرتبط است.

با رشد سریع پروژه‌های تحقیقاتی زیست‌پزشکی میزان داده‌های ژنومیکی تولیدشده نیز در حال افزایش است، به‌طوری که در حال حاضر هر سال تقریباً ۲ تا ۴۰ میلیارد گیگابایت داده تولید می‌شود. محققان در تلاش هستند تا اطلاعات ارزشمندی را از چنین مجموعه داده‌های پیچیده و بزرگی استخراج کنند تا بتوانند سلامت و بیماری انسان را بهتر درک کنند.

علم داده ژنومیک چیست؟

علم داده‌ ژنومیک زمینه‌ای از مطالعات است که محققان را قادر می‌سازد تا از روش‌های محاسباتی و آماری قدرتمند برای رمزگشایی اطلاعات عملکردی پنهان در توالی DNA استفاده کنند. این ابزارهای علم داده که در زمینه پزشکی ژنومیک به کار می‌روند، به محققان و پزشکان کمک می‌کنند تا چگونگی تأثیر تفاوت در DNA بر سلامت و بیماری انسان را کشف کنند.

علم داده ژنومیک به‌عنوان یک زمینه تحقیقاتی در دهه ۱۹۹۰ ظهور کرد تا دو فعالیت آزمایشگاهی را گرد هم آورد:

  • آزمایش: تولید اطلاعات ژنومیکی از مطالعه ژنوم موجودات زنده.
  • تجزیه و تحلیل داده‌ها: استفاده از ابزارهای آماری و محاسباتی برای تجزیه و تحلیل و مصورسازی داده‌های ژنومیکی که شامل پردازش و ذخیره داده‌ها و استفاده از الگوریتم‌ها و نرم‌افزارها برای ایجاد پیش‌بینی‌هایی بر اساس داده‌های ژنومیکی موجود است.

هر دو فعالیت به محققان کمک می‌کند تا از مقادیر وسیعی از داده‌های ژنومیکی اطلاعات مناسبی کسب کنند.

چرا ژنومیک داده های زیادی تولید می‌کند؟

ژنومیک انسان در اوایل دهه ۲۰۰۰ مطرح شد، زمانی‌که پروژه ژنوم انسانی با موفقیت اولین توالی ژنوم انسان را ایجاد کرد. هر یک از تریلیون‌ها سلول در بدن انسان حاوی یک کپی کامل از ژنوم است، یعنی نقشه DNA ما. اکثر سلول‌ها در واقع دو نسخه از ژنوم دارند که روی هم حدود ۶ میلیارد حرف DNA را منعکس می‌کنند.

اکنون محققان، داده‌های ژنومیکی بیشتری نسبت به قبل تولید می‌کنند تا بفهمند ژنوم چگونه بر سلامت و بیماری انسان تأثیر می‌گذارد. این داده‌ها از میلیون‌ها نفر در جمعیت‌های مختلف در سراسر جهان به دست آمده است. اطلاعات مربوط به یک توالی ژنوم انسانی به‌تنهایی ۲۰۰ گیگابایت را اشغال می‌کند.

تخمین زده می‌شود که برای ذخیره داده‌های توالی ژنومی تولیدشده در سراسر جهان تا سال ۲۰۲۵ به ۴۰ اگزابایت فضا نیاز داشته باشیم. برای مقایسه خوب است بدانید که پنج اگزابایت می‌تواند تمام کلماتی را که انسان‌ها گفته‌اند را ذخیره کند.

به دلیل حجم قابل توجهی از داده‌های پیچیده مرتبط با ژنوم انسان، ژنومیک اکنون به عنوان یک رشته “کلان داده (big data)” در نظر گرفته می‌شود.

دانشمندان، داده های ژنومیکی را چگونه مطالعه می‌کنند؟

محققان برای یافتن و تفسیر اطلاعات بیولوژیکی پنهان در DNA هر فرد و همچنین مدیریت حجم زیادی از داده‌های تولیدشده در پروژه‌های تحقیقاتی ژنومیک به ابزارهای محاسباتی و تحلیلی خاصی نیاز دارند.

محققان از ابزارهای نرم‌افزاری خاصی به نام aligners برای تعیین محل قرارگیری تکه‌های تکی‌توالی DNA در هر قسمت از یک توالی ژنوم مرجع استفاده می‌کنند.

ژنومیک چیست

Photo by Christina Morillo from Pexels

در مرحله بعد که “variant callers” نامیده می‌شود مکان هایی که یک توالی ژنوم انسانی مشخص با سایر توالی‌های ژنوم انسانی متفاوت است را شناسایی می کنند. این تفاوت‌های ژنومی در اندازه‌های مختلفی هستند. این تفاوت ممکن است به کوچکی یک حرف DNA (به نام پلی مورفیسم تک‌نوکلئوتیدی)، حروف طولانی (به نام انواع ساختاری) مانند Insertions and Deletions، یا ناهنجاری‌های کروموزومی خیلی بزرگتر باشد.

این تفاوت‌های ژنومی ممکن است هیچ خطری برای سلامتی فرد نداشته باشند، یا می‌توانند مستقیماً باعث اختلالات نادر ارثی، سرطان یا دیگر بیماری‌های شایع‌تر شوند.

 محققان چنین حجم بالایی از داده های ژنومی را چگونه مدیریت و ذخیره می کنند؟

متخصصان فن‌آوری کامپیوتر و ژنومیک با استفاده از سیستم‌ها و نرم افزارهای مختلف کامپیوتری، داده‌های ژنومی را مدیریت و ذخیره می‌کنند. مراکز تحلیل و هماهنگی داده‌ها که در حال افزایش هستند بخشی از این شبکه‌های تحقیقاتی هستند و این خدمات را ارائه می‌دهند.

تولید داده‌های ژنومی نیاز به حمایت مالی زیادی از طرف موسسات دارد مانند مؤسسه ملی تحقیقات ژنوم انسانی (NHGRI: مخفف National Human Genome Research Institute) که هر ساله بیش از ۱۲۵ میلیون دلار برای حمایت از تلاش‌های مختلف علم داده‌های ژنومی در نظر می‌گیرد.

داده‌های تولیدشده اغلب به‌صورت گسترده در دسترس جامعه علمی قرار می گیرند تا تجزیه و تحلیل بیشتر داده‌ها را تسهیل کنند. آن‌ها انواع مختلفی از اطلاعات درمورد ژنوم انسان را سازماندهی می‌کنند و ارائه می‌دهند، مانند مکان ژن‌ها و گونه‌های مختلف در DNA.

بسیاری از پلتفرم‌های ابری (cloud platforms) خصوصی و تجاری با همکاری نهادهای دولتی و عمومی، مانند مؤسسه ملی بهداشت (NIH) از طریق گروهی به نام  STRIDES هم‌کاری می‌کنند. این طرح‌ها زیرساخت‌های ذخیره‌سازی و محاسباتی و حفاظت‌های امنیتی و حریم خصوصی لازم برای داده‌های ژنومی را فراهم می‌کنند.

پیامدهای اخلاقی، قانونی و اجتماعی برای به اشتراک گذاری داده های ژنومی چیست؟

انجام تحقیقات ژنومیک مجموعه‌ای از مسئولیت‌های اخلاقی را نیز به همراه دارد، زیرا اطلاعات مربوط به توالی ژنوم یک فرد با مسائل پیچیده مربوط به حریم خصوصی و هویت مرتبط است.

  • رضایت آگاهانه: محققان معمولاً از افرادی که ژنوم آن‌ها توالی‌یابی شده است، رضایت دریافت می‌کنند. اما آن‌ها باید در فرآیند کسب رضایت، اطلاعات روشنی در مورد نحوه استفاده و به اشتراک‌گذاری داده‌های توالی ژنوم ارائه دهند.
  • حریم خصوصی: ابزارهای محاسباتی قدرتمند می‌توانند داده‌های توالی ژنوم‌های شناسایی‌شده را بگیرند و تحت شرایط خاص، آن‌ها را به فردی که DNA او توالی‌یابی شده است، متصل کنند. بازرسان می‌توانند از چنین ابزارهایی برای اهداف مفیدی مانند شناسایی مجرمانی که DNA را در صحنه جرم به جا گذاشته‌اند، استفاده کنند. اما مزایای اجتماعی استفاده از داده‌های ژنومی به این روش باید بر خطرات احتمالی آن بیشتر باشد.
  • هوش مصنوعی (AI): ابزارهای هوش مصنوعی به‌طور فزاینده‌ای به محققان کمک می‌کند تا تعداد زیادی از داده‌های توالی ژنوم را پردازش کرده تا الگوهای پنهان در DNA را کشف کنند. با این حال، از آنجایی که الگوریتم‌های هوش مصنوعی اغلب فاقد شفافیت هستند، زمانی که چنین الگوریتم‌هایی روی داده‌های DNA اعمال می‌شوند، سوگیری‌ها ممکن است شناسایی‌نشده باشند. این حوزه از علم داده‌ ژنومی به تحقیقات اخلاقی گسترده‌ای نیاز دارد تا تفاوت‌های منحصربه‌فرد بین روش‌های فعلی در علم داده‌های ژنومی (که برای تفسیر نتایج به هوش انسانی تکیه می‌کنند) و روش‌های جدیدتر هوش مصنوعی را بررسی کند. اگرچه روش‌های هوش مصنوعی مزایای بسیار امیدوارکننده‌ای را ارائه می‌دهند، اما نسبت به انسان‌ها به روش‌های کاملاً متفاوتی نتیجه‌گیری می‌کنند، و از این رو باید تحت نظارت دقیق اخلاقی قرار گیرند.

توالی یابی ژنتیک

Photo by Vitaly Vlasov from Pexels

با تمام این ملاحظات، دانشمندان داده و محققان ژنومیک باید درمورد پیامدهای مطالعات خود آموزش ببینند و از نزدیک با محققان حوزه‌ی اخلاق همکاری کنند.

محققان چگونه داده های ژنومی انسان را به اشتراک می گذارند؟

انتظار می‌رود که محققان داده‌های ژنومی انسان را بر اساس رضایت شرکت‌کنندگان در تحقیق به اشتراک بگذارند. داده‌های ژنومی معمولاً از طریق منابع داده با جامعه علمی به اشتراک گذاشته می‌شوند که می‌توان به سه روش به آن‌ها دسترسی داشت:

انواع دسترسی به داده‌های ژنومی:

  • دسترسی آزاد یا دسترسی نامحدود گسترده‌ترین شکل اشتراک داده است. داده‌ها برای هر هدف پژوهشی در دسترس عموم است.
  • دسترسی ثبت‌شده بین دسترسی باز و دسترسی کنترل شده قرار می‌گیرد. در این حالت محققان می‌توانند داده‌ها را برای هر هدفی در دسترس داشته باشند به شرطی که اطلاعات خود را ثبت کنند و کار آنها با داده‌ها هم ممکن است نیاز به نظارت داشته باشد.
  •  دسترسی کنترل‌شده: در این حالت اشتراک‌گذاری داده‌های مستلزم آن است که محققان هدف تحقیق خود را توصیف کنند تا یک کمیته دسترسی ویژه به داده‌ها، بتواند سازگاری هدف تحقیق را با رضایت شرکت‌کنندگان ارزیابی کند. محقق تنها پس از دریافت تایید کمیته می‌تواند به داده‌ها دسترسی داشته باشد.

موضوعات جدید و در حال ظهور در حوزه ی علم داده ژنومیک چیست؟

ژنوم انسان حاوی انواع ژنومی بسیاری است (حروف DNA که در مکان‌های خاص در افراد متفاوت است). سیستم‌های مراقبت‌های بهداشتی و محققان در حال ساخت ابزارهایی هستند که این تفاوت‌های DNA را شناسایی کرده و آن‌ها را به اطلاعات مرتبط پزشکی، مانند خطر ابتلا به بیماری یا نشانه‌ای برای یک داروی خاص مرتبط می‌سازد.

محققان همچنین با استفاده از اطلاعات ژنومی از سیستم‌های هوش مصنوعی برای تفسیر داده‌های ژنومی برای اهداف بالینی مانند تشخیص بیماری‌ها در مراحل اولیه یا پیش‌بینی خطر بیماری‌های مختلف استفاده می‌کنند.

در دهه گذشته، محاسبات ابری (Cloud computing) برای ذخیره‌سازی و تجزیه و تحلیل داده‌های ژنومی ضروری شده است. رایانش ابری نیاز به تکرار مجموعه داده‌های بزرگ را کاهش و امنیت را افزایش می‌دهد و امکان دسترسی بیشتر محققان به داده‌های ژنومی را فراهم می‌کند. دانشمندان داده در حال ایجاد ابزارهایی برای آسان‌تر کردن آپلود داده‌ها و تضمین حفظ حریم خصوصی هستند.


ترجمه اختصاصی توسط مجله قرمز

منابع:

National Human Genome Research Institute, Genetics vs. Genomics Fact Sheet, Last updated: September 7, 2018 

National Human Genome Research Institute, Genomic Data Science, Last updated: April 5, 2022