شبکه هم‌بیانی ژن‌ها

شبکه هم‌بیانی ژن‌ها (به انگلیسی: Gene Co-Expression Network) یک گراف بدون جهت است. در این گراف هر رأس معادل با یک ژن است. همچنین بین دو راس یال وجود دارد، اگر و تنها اگر رابطه هم‌بیانی معناداری میان ژن‌های متناظر آن دو رأس موجود باشد. در این‌جا منظور از هم‌بیانی این است که الگوی بیان دو ژن، به معنای کم یا زیاد شدن بیان آن‌ها یکسان باشد. شبکه‌های هم‌بیانی ژن‌ها به کمک مجموعه داده‌ای از بیان تعدادی ژن در نمونه‌های مختلف بدست می‌آید. از آن‌جا که شبکه هم‌بیانی ژن‌ها یک گراف بدون جهت است، یک روش مناسب برای نمایش آن ماتریس همسایگی است. در این روش اگر هم‌بیانی دو ژن از آستانه‌ای مشخص بالاتر باشد بین آن‌ها یال متصور می‌شویم و درایه‌های ماتریس همسایگی صفر یا یک هستند.[۱]

شبکه هم‌بیانی ۷۲۲۱ که از ۱۸ نمونه گرفته شده‌است
شبکه هم‌بیانی ژن برای ۷۲۲۱ ژن. اطلاعات بیان ژن‌ها از ۱۸ مبتلا به سرطان معده گرفته شده‌است.

همچنین می‌توان مدلی پیچیده‌تر برای شبکه هم‌بیانی ژن‌ها متصور شد که در آن یال‌ها وزنی در بازه داشته باشند. در این روش به اصطلاح از آستانه‌ای نرم استفاده می‌شود. در مقابل این روش به روش قبلی که یال‌ها وزن نداشتند، استفاده از آستانه سخت گفته می‌شود. در روش آستانه سخت ممکن است یک مقدار اختلاف کمی با آستانه داشته باشد و از آن کمتر باشد، در این صورت یال مربوط به این مقدار ترسیم نمی‌شود که از معایب این روش محسوب می‌شود. همچنین از نظر زیستی معنی‌دارتر است که رابطه هم‌بیانی دو ژن را با یک‌وزن مشخص کنیم. البته باید توجه داشت در مقابل دقت بیشتری که در شبکه‌های وزن‌دار بدست می‌آید، تحلیل گراف حاصل سخت‌تر می‌شود.[۲]

شبکه‌های هم‌بیانی ژن‌ها کاربردهای متعددی دارند. برای نمونه این شبکه‌ها می‌توانند ابزاری مناسب در شناختن ژن‌هایی باشند که کارکرد زیستی آنان چندان مشخص شده نیست. همچنین این شبکه‌ها می‌توانند در تحلیل ارتباط مکانیزم‌های مولکولی و فرایندهای زیستی مفید واقع شوند.[۱][۳]

در حال حاضر شبکه‌های بسیاری توسط داده‌های حاصل از ریزآرایه دی‌ان‌ای تولید شده‌اند.[۳]

ساختن شبکه هم‌بیانی ژن‌ها ویرایش

ساخت شبکه‌های هم‌بیانی ژن‌ها به کمک دادهٔ بیان مجموعه‌ای از ژن‌ها در تعدادی نمونه انجام می‌شود. برای این کار ابتدا بیان مجموعه‌ای از ژن‌ها را در نمونه‌های مختلف اندازه‌گیری می‌شود. اگر داده نیاز به هرگونه نرمال‌سازی[۴] داشته باشد، در این مرحله انجام می‌شود. اطلاعات بیان ژن در نمونه‌های مختلف را می‌توان در یک ماتریس که ستون‌های آن متناظر با نمونه‌ها و سطرهای آن متناظر با ژن‌هاست، نمایش داد. سپس به کمک دادهٔ بدست آمده، امتیازی تحت عنوان امتیاز شباهت میان هر دو ژن محاسبه می‌شود. این امتیازها را می‌توان در یک ماتریس مربعی، که سطرها و ستون‌های آن متناظر با ژن‌ها هستند، ذخیره کرد. سپس برای هر دو ژنی که امتیاز شباهت آن‌ها از یک آستانه مشخص بیشتر بود، یک یال در گراف متناظر قرار داده می‌شود. این کار را می‌توان با اعمال یک تبدیل ساده بر روی ماتریس شباهت ژن‌ها انجام داد. برای بدست آوردن ماتریس همسایگی گراف کافی است در ماتریس شباهت ژن‌ها، درایه‌های بزرگ‌تر مساوی از آستانه را به یک و بقیه درایه‌ها به صفر تبدیل شوند. برای ساختن شبکه هم‌بیانی ژن‌ها باید روش محاسبه امتیاز شباهت و محاسبه آستانه مشخص شوند.

 
در این تصویر مراحل مختلف ساخت شبکه دیده می‌شود. در این مثال از شش ژن و سه نمونه استفاده شده‌است. ابتدا از ماتریس دادهٔ بیان ژن‌ها ماتریس امتیاز را بدست می‌آوریم. سپس با اعمال آستانه‌ای سخت به ماتریس همسایگی و شبکه هم‌بیانی می‌رسیم.

محاسبه امتیاز شباهت ویرایش

میزان بیان یک ژن در نمونه‌های مختلف را می‌توان به صورت یک بردار نمایش داد. پس برای محاسبه امتیاز شباهت دو ژن، باید امتیازی را بین دو بردار بیان ژن محاسبه کنیم. برای محاسبه این امتیاز می‌توان از روش‌هایی مانند ضریب همبستگی پیرسون، ضریب همبستگی رتبه‌ای اسپیرمن و اطلاعات متقابل استفاده کرد که امتیاز حاصل از تمام این روش‌ها در بازه   یا   قرار دارد.[۴] در برخی موارد نیز امتیازهایی محاسبه می‌شوند که این ویژگی را ندارند، یک نمونه از چنین امتیازهایی فاصله اقلیدسی است.[۴] در برخی از موارد نیز از روش‌هایی بر مبنای همبستگی جزئی مانند مدل‌های گاوسی گرافیکی استفاده می‌شود.[۱]

محاسبه آستانه ویرایش

یکی از روش‌های ساده محاسبه آستانه ثابت گرفتن اندازه شبکه (تعداد یال‌های گراف متناظر) است. در این روش تعداد یال‌ها معلوم است و امتیاز تمام جفت ژن‌ها نیز معلوم است. پس آستانه به سادگی مشخص می‌شود. در روش دیگر به جای تعیین آستانه برای امتیاز شباهت، آستانه‌ای برای سطح معنادار بودن امتیاز تعیین می‌شود. در این روش‌ها ابتدا برای هر کدام از امتیازهای شباهت یک پی-مقدار محاسبه می‌شود. سپس با توجه به پی-مقدار و سطح معنادار بودن تعیین شده یال‌ها را رسم می‌کنند. برای محاسبه پی-مقدار معمولاً از آزمون جایگشتی یا آزمون زد استفاده می‌شود.[۲]

استفاده از آستانهٔ نرم ویرایش

در این روش هم ابتدا نیاز داریم، ماتریس امتیاز شباهت‌ها را محاسبه کنیم. در این قسمت فرض می‌کنیم که امتیاز شباهت در بازه‌ای مانند   یا   قرار دارد. برای نمونه می‌توانیم برای محاسبه امتیاز از ضریب همبستگی پیرسون استفاده کنیم. امتیاز شباهت و وزن یال میان ژن  ام و ژن  ام را به ترتیب با   و  نمایش می‌دهیم. برای بدست آوردن وزن یال‌ها دو نوع تابع پیشنهاد شده‌است.[۲]

استفاده از تابع سیگموئید ویرایش

در این روش از تابع سیگموئید به همراه دو پارامتر   و   استفاده می‌شود. در ابتدا مقدار دو پارامتر   و   انتخاب می‌شود. سپس برای محاسبه وزن هر یال از رابطهٔ   استفاده می‌شود. در این حالت به مقدار   آستانه (نرم) گفته می‌شود. دقت کنیم که خروجی این تابع در بازهٔ   است که برای وزن‌های گراف مدنظر داشتیم.[۲]

استفاده از تابع توانی ویرایش

در این روش یک پارامتر   در نظر گرفته می‌شود و وزن هر یال مطابق رابطهٔ   بدست می‌آید. در این رابطه نیز وزن یال‌ها در بازهٔ مطلوب   قرار می‌گیرد.[۲][۵]

جستارهای وابسته ویرایش

منابع ویرایش

  1. ۱٫۰ ۱٫۱ ۱٫۲ Tieri P, Farina L, Petti M, Astolfi L, Paci P, Castiglione F (2018). "Network Inference and Reconstruction in Bioinformatics". Encyclopedia of Bioinformatics and Computational Biology. 2: 805–813.
  2. ۲٫۰ ۲٫۱ ۲٫۲ ۲٫۳ ۲٫۴ Zhang, Bin; Horvath, Steve (2005). "A general framework for weighted gene co-expression network analysis". Statistical Applications in Genetics and Molecular Biology. 4: Article17. doi:10.2202/1544-6115.1128. ISSN 1544-6115. PMID 16646834.
  3. ۳٫۰ ۳٫۱ Ruan, Jianhua; Dean, Angela K.; Zhang, Weixiong (2010-02-02). "A general co-expression network-based approach to gene expression analysis: comparison and applications". BMC Systems Biology. 4 (1): 8. doi:10.1186/1752-0509-4-8. ISSN 1752-0509. PMC 2829495. PMID 20122284.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  4. ۴٫۰ ۴٫۱ ۴٫۲ Somogyi, Roland; Liang, Shoudan; D’haeseleer, Patrik (2000-08-01). "Genetic network inference: from co-expression clustering to reverse engineering". Bioinformatics (به انگلیسی). 16 (8): 707–726. doi:10.1093/bioinformatics/16.8.707. ISSN 1367-4803.
  5. Dong, Jun; Horvath, Steve (2008-08-15). "Geometric Interpretation of Gene Coexpression Network Analysis". PLOS Computational Biology (به انگلیسی). 4 (8): e1000117. doi:10.1371/journal.pcbi.1000117. ISSN 1553-7358. PMC 2446438. PMID 18704157.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)