یادگیری عمیق: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
افزودن بخش «کاربردها» و اظافه کردن سه زیر قسمت |
افزودن موارد «تشخیص الکترومیوگرافی» و «بینایی رایانه» به بخش «کاربردها» + چند ویرایش جزئی |
||
خط ۱۵:
یک نمونه آموزشی (برای نمونه: تصویر یک گربه) میتواند به صورتهای گوناگون بسان یک بردار ریاضی پر شده از مقدار به ازای هر پیکسل و در دید کلیتر به شکل یک مجموعه از زیرشکلهای کوچکتر (نظیر اعضای صورت گربه) مدلسازی شود. برخی از این روشهای مدلسازی سبب ساده شدن فرایند یادگیری ماشین (برای نمونه: تشخیص تصویر گربه) میشوند.
در یادگیری ژرف امید به جایگزینی استخراج این ویژگیهای تصویر به دست بشر (مانند اعضای گربه) با روشهای
بسته به فرضهای گوناگون در مورد نحوهٔ اتصال این یاختههای عصبی، مدلها و ساختارهای مختلفی در این حوزه پیشنهاد و بررسی شدهاند، هرچند که این مدلها به صورت طبیعی در مغز انسان وجود ندارد و مغز انسان پیچیدگیهای بیشتری را دارا است. این مدلها نظیر [[شبکه عصبی عمیق]]، [[شبکه عصبی پیچیده]]، [[شبکه باور عمیق]] پیشرفتهای خوبی را در حوزههای [[پردازش زبانهای طبیعی]]، [[پردازش تصویر]] ایجاد کردهاند.
خط ۳۲:
== کاربردها ==
==== بینایی رایانه ====
{{اصلی|بینایی رایانهای}}
یکی از نخستین زمینههای بسیار موفق برای یادگیری عمیق که پتانسیل بالقوهی این روش در حل مسائل را نشان داد، در حوزهی بازشناسی تصویر رخ داد.
[[پرونده:Computer vision sample in Simón Bolivar Avenue, Quito.jpg|جایگزین=صحنهای از یک خیابان نسبتاً شلوغ با تعدادی اتوموبیل سواری و موتور سیکلت در آن که هر یک توسط یک الگوریتم بینایی ماشین رهگیری شده، مستطیلی به دورش رسم شده و برچسبی به بالای مستطیل زده شده است.|بندانگشتی|رهگیری خودکار حرکت وسایل نقلیه که از وظایف مهم یک [[اتومبیل خودران|خودروی خودران]] نیز محسوب میشود.]]
از سال ۲۰۱۰ و در پروژهای موسوم به [[ایمیجنت]] مسابقهای سالانه برگزار میشود که شرکتکنندگان با ارائهی الگوریتمهای کامپیوتری گوناگون، تلاش به بازشناسی تصاویر دیجیتالی در مقیاس کلان کرده و بر سر دستیابی به دقّتهای بالاتر با یکدیگر رقابت میکنند. حال در سال ۲۰۱۲، یک [[شبکه عصبی پیچشی|شبکهی عصبی پیچشی]] به نام [[الکسنت]] در این رقابت به کار رفت و با کسب نتایجی بسیار چشمگیر، توجههای گستردهای را به سوی روش یادگیری عمیق جلب کرد؛ به شکلی که به باور برخی، در این سال «انقلاب یادگیری عمیق» رخ داد. لازم به ذکر است که دقت الکسنت در تشخیص تصاویر [[پایگاه داده]]<nowiki/>ی ایمیجنت از دقت انسان نیز فراتر بود (هرچند البته حتی پیش از ارائهی الکسنت نیز الگوریتمهای دیگری به عملکرد فراانسانی دست پیدا کرده بودند).<ref>{{Cite journal|last=Alom|first=Md Zahangir|last2=Taha|first2=Tarek M.|last3=Yakopcic|first3=Christopher|last4=Westberg|first4=Stefan|last5=Sidike|first5=Paheding|last6=Nasrin|first6=Mst Shamima|last7=Van Esesn|first7=Brian C.|last8=Awwal|first8=Abdul A. S.|last9=Asari|first9=Vijayan K.|date=2018-09-12|title=The History Began from AlexNet: A Comprehensive Survey on Deep Learning Approaches|url=http://arxiv.org/abs/1803.01164|journal=arXiv:1803.01164 [cs]}}</ref><ref>{{یادکرد وب|عنوان=ImageNet Large Scale Visual Recognition Competition 2012 (ILSVRC2012)|نشانی=http://www.image-net.org/challenges/LSVRC/2012/results.html|وبگاه=www.image-net.org|بازبینی=2020-11-03}}</ref>
امروزه نیز شبکههای عصبی در بینایی رایانه دارای نقشی کلیدی بوده و برای اهداف گوناگونی چون بازشناسی تصویر، تشخیص چهره، رهگیری اجسام، حذف نویز، رنگیکردن تصاویر سیاه و سفید، ترمیم تصاویر آسیبدیده، [[طبقهبندی آماری|ردهبندی]] تصاویر پزشکی و... به کار میرود.<ref>{{یادکرد وب|عنوان=Deep Learning for Computer Vision: A Brief Review|نشانی=https://www.hindawi.com/journals/cin/2018/7068349/|وبگاه=Computational Intelligence and Neuroscience|تاریخ=2018-02-01|بازبینی=2020-11-03|کد زبان=en|نام=Athanasios|نام خانوادگی=Voulodimos|نام۲=Nikolaos|نام خانوادگی۲=Doulamis|نام۳=Anastasios|نام خانوادگی۳=Doulamis|نام۴=Eftychios|نام خانوادگی۴=Protopapadakis}}</ref>
==== بازشناسی خودکار گفتار ====
{{اصلی|بازشناسی گفتار}}
از دیگر زمینههای موفق برای یادگیری عمیق، تشخیص و بازشناسی خودکار گفتار است که معمولاً توسط مدلهای مبتنی بر [[شبکه عصبی بازگشتی]] و [[شبکه عصبی پیچشی]] انجام میگیرد.<ref>{{Cite journal|last=Kim|first=John|last2=Saurous|first2=Rif A.|date=2018-09-02|title=Emotion Recognition from Human Speech Using Temporal Information and Deep Learning|url=http://dx.doi.org/10.21437/interspeech.2018-1132|journal=Interspeech 2018|location=ISCA|publisher=ISCA|doi=10.21437/interspeech.2018-1132}}</ref>
==== پردازش زبانهای طبیعی ====
{{نوشتار اصلی|پردازش زبانهای طبیعی}}
یادگیری عمیق اثر بزرگی در پیشرفت شاخهی پردازش زبانهای طبیعی ایجاد کرده و با ایجاد یک چهارچوب مدلسازی قدرتمند، به نتایج چشمگیری دست یافته است.<ref>{{Cite journal|date=2018|editor-last=Deng|editor-first=Li|editor2-last=Liu|editor2-first=Yang|title=Deep Learning in Natural Language Processing|url=http://dx.doi.org/10.1007/978-981-10-5209-5|doi=10.1007/978-981-10-5209-5}}</ref> به عنوان نمونه، مدل زبانی [[جیپیتی-۳]] از [[اوپن ایآی]] با بهرهگیری روشهای یادگیری عمیق قادر به تولید متونی مشابه متون نوشتهشده توسط انسان است.<ref>{{یادکرد وب|عنوان=OpenAI API|نشانی=https://openai.com/blog/openai-api/|وبگاه=OpenAI|تاریخ=2020-06-11|بازبینی=2020-11-03|کد زبان=en}}</ref>
==== تشخیص '''الکترومیوگرافی''' ====
[[سیگنال (مهندسی برق)|سیگنال]]<nowiki/>های [[نوار عصب و عضله|الکترومیوگرافی]] میتوانند به عنوان رابطی میان انسان و ماشین عمل کرده و با تحلیل آنها از مقصود کاربر جهت کنترل تجهیزات گوناگون بهره برد. به عنوان نمونه، افراد دچار نقص عضو میتوانند اعضایی مصنوعی را جایگزین عضو قطعشدهی خود کرده و آنها را به شیوهی مؤثری کنترل کنند. و یا با همین روش میتوان اعضایی کمکی و تقویتکننده همچون اسکلت خارجی را کنترل کرد. برای تحلیل این سیگنالهای خام و ارائهی خروجی مناسب برای کنترل دستگاه، بهرهگیری از روش یادگیری عمیق میتواند بسیار کاربردی باشد.<ref>{{Cite journal|last=Jafarzadeh|first=M.|last2=Hussey|first2=D. C.|last3=Tadesse|first3=Y.|date=2019-09|title=Deep learning approach to control of prosthetic hands with electromyography signals|url=https://ieeexplore.ieee.org/document/8955725/|journal=2019 IEEE International Symposium on Measurement and Control in Robotics (ISMCR)|pages=A1–4–1-A1-4-11|doi=10.1109/ISMCR47492.2019.8955725}}</ref>
==== سرمایهگذاری ====
== جستارهای وابسته ==
|