الگوریتم کاهش ابعاد t-sne
t-sne یک روش یادگیری خودران (خودسازمانده) غیر خطی است که برای اکتشاف و بصریسازی دادهها مورد استفاده قرار میگیرد. به بیان سادهتر، t-SNE به کاربر درکی از اینکه دادهها چگونه در فضای ابعاد بالا سازماندهی شدهاند ارائه میکند که این کار را با دادن موقعیت مکانی به هر نقطه داده در یک نقشه دو یا سه بعدی است به بیانی دیگر، هر شی با ابعاد بالا را با یک نقطه دو یا سه بعدی مدل می کند، به گونهای که اجسام مشابه توسط نقاط نزدیک و اجسام غیر مشابه با نقاط دور با احتمال زیاد مدل می شوند.
تحلیل مؤلفههای اصلی یک روش کاهش ابعاد خطی است که در تلاش برای بیشینه کردن واریانس و حفظ فاصلههای زیاد دوتاییها از یکدیگر است. به عبارت دیگر، چیزهایی که با یکدیگر متفاوت هستند به صورت دور از هم به پایان میرسند. این امر میتواند منجر به این شود که در هنگام کار با ساختارهای غیرخطی خمینه شود. ساختار خمینه میتواند به صورت یک شکل جغرافیایی مثلا استوانه، کره، منحنی و دیگر موارد باشد.
نظر به اینکه تحلیل مؤلفههای اصلی به حفظ فاصلههای دوتاییهای بزرگ برای بیشینه کردن واریانس میپردازد، t-SNE با حفظ فاصلههای کوچک دوتاییها یا شباهت محلی از تحلیل مؤلفههای اصلی متمایز میشود.
نحوه کار الگوریتم t-SNE
ویرایشالگوریتم t-sne شامل دو مرحله به شرح زیر است: مرحله اول بدین صورت است که، یک توزیع احتمال بر روی نقاط در ابعاد بالاتر ایجاد میکند به طوری که به اشیاء مشابه احتمال بالاتر و اشیا غیر مشابه احتمال کمتر اختصاص داده می شود.
مرحله دوم بدین صورت است که، همان توزیع احتمال را در ابعاد پایینتر به طور مکرر تکرار میکند تا زمانی که واگرایی کولبک-لیبلر به حداقل برسد. به بیانی دیگر، واگرایی کولبک-لیبلر معیاری برای اندازهگیری تفاوت بین توزیعهای احتمال مرحله اول و دوم است.
یک مجموعه n عضوی اشیا با ابعاد بالا به صورت در نظر بگیریم ابتدا احتمال که بیانگر اشیا و است به صورت زیر محاسبه میکنیم:
برای داریم
این احتمالات متقارن هستند. با این احتمالات متقارن، توزیع P را تشکیل می دهیم:
همانطور که در بخش قبل گفته شد هدف t-SNE این است که نقاط با ابعاد d به صورت که تبدیل یافته از ابعاد بالا به پایین است را یاد بگیرد. مانند قبل برای توزیع Q داریم:
در اینجا، "رابطه-همسایگی" را با توزیع تی-استودنت مدل میکنیم. این جایی است که t در t-SNE از آنجا میآید.
حال هدف ما یافتن هایی از طریق بهینه سازی است به طوری که P و Q تا حد امکان به هم نزدیک باشند، بنابراین از واگرایی کولبک-لیبلر استفاده میکنیم و درایم:
حال با از واگرایی کولبک-لیبلر نسبت به گرادیان میگیریم تا به بهینه ترین جواب برسیم، بنابراین داریم:
algorithm t-SNE is input: Data: X = [x1, ..., xN], xi in Rn, Objective params: p (perplexity), Optimization params: T(num of iterations), η (learning rate), α(momentum) output: Y = [y1, ..., yN], yi in Rm, m << n {pij} =pairwiseAffinites 0, p, X initialize Y = [y1, ..., yN] from N(0, 10-4 I) for i = 1 to T do compute low dimensional affinities qij compute ∂C / ∂yi yit = yit-1 + η (∂C / ∂yi)+ α(t)(yit-1 - yit-2)
کاربردهای t-SNE
ویرایشکاربردهای t-SNE در زمینههایی به شرح زیر است:
- پژوهشهای اقلیمی
- امنیت رایانهای [۴]
- بیوانفورماتیک [۵]
- پژوهشهای سرطان
- یادگیری یا ارزیابی خوشهبندی، این کاربرد بدین گونه است که اغلب اوقات تعداد خوشهها مقدم بر مدلسازی انتخاب یا پس از نتایج تکرار میشوند. t-SNE اغلب اوقات میتواند جداسازی شفافی در دادهها ارائه دهد. از این امر میتوان مقدم بر استفاده از مدل خوشهبندی به منظور انتخاب تعداد خوشهها یا بعدا برای ارزیابی اینکه خوشه ها به درستی دادهها را نگه میدارند یا خیر بهره برد. t-SNE یک رویکرد خوشهبندی نیست زیرا ورودیها را مانند تحلیل مؤلفههای اصلی حفظ نمیکند و ممکن است مقادیر بین اجراها تغییر کنند، بنابراین از این روش صرفا برای اکتشاف استفاده میشود.
منابع
ویرایش- ↑ Pareek, Jyoti & Jacob, Joel. (2020). Data Compression and Visualization Using PCA and T-SNE. 10.1007/978-981-15-5421-6_34.
- ↑ Maaten, L.V., & Hinton, G.E. (2008). Visualizing Data using t-SNE. Journal of Machine Learning Research, 9, 2579-2605.
- ↑ Saha, D. K., Calhoun, V. D., Yuhui, D. U., Zening, F. U., Panta, S. R., & Plis, S. M. (2019). DSNE: A visualization approach for use with decentralized data. Unknown Journal. https://doi.org/10.1101/826974
- ↑ Hamid, Yasir & Muthukumarasamy, Sugumaran. (2019). A t-SNE based non linear dimension reduction for network intrusion detection. International Journal of Information Technology. 12. 10.1007/s41870-019-00323-9.
- ↑ 65. Li, W.; Cerise, J.E.; Yang, Y.; Han, H. Application of T-SNE to Human Genetic Data. J. Bioinform. Comput. Biol. 2017, 15, 1750017.