ریچارد اس. ساتون

ریچارد اس. ساتون FRS یک دانشمند کامپیوتر کانادایی است. در حال حاضر، او یک محقق برجسته در دیپ‌مایند و استاد علوم محاسباتی در دانشگاه آلبرتا است. ساتون به عنوان یکی از بنیانگذاران یادگیری تقویتی در نظر گرفته می‌شود،^[۱] که نقش قابل توجه در این زمینه، از جمله یادگیری تفاوت زمانی و روش‌های گرادیان (شیب) خط مشی دارد.

زندگی و تحصیل

ریچارد ساتون در اوهایو به دنیا آمد و در اوک بروک، ایلینوی، حومه شیکاگو بزرگ شد.

ساتون لیسانس روانشناسی خود را در سال ۱۹۷۸ از دانشگاه استنفورد دریافت کرد و سپس مدرک کارشناسی ارشد (۱۹۸۰) و دکتری (۱۹۸۴) در علوم کامپیوتر از دانشگاه ماساچوست آمهرست زیر نظر اندرو بارتو را دریافت کرد. پایان‌نامه دکتری او با عنوان تخصیص اعتبار زمانی در یادگیری تقویتی، معماری‌های بازیگر-منتقد و تخصیص اعتبار زمانی را معرفی کرد.^[۲]

حرفه

در سال ۱۹۸۴، ساتون یک محقق فوق دکترا در دانشگاه ماساچوست بود.

از سال ۱۹۸۵ تا ۱۹۹۴، او یکی از اعضای اصلی کارکنان فنی در آزمایشگاه کامپیوتر و سیستم‌های هوشمند در GTE در والتهام، ماساچوست بود که مقاله یادگیری برای تخمین توسط روش‌های تفاوت زمانی را نوشت. در سال ۱۹۹۵ به عنوان دانشمند ارشد پژوهشی به دانشگاه ماساچوست بازگشت.

از سال ۱۹۹۸ تا ۲۰۰۲، ساتون در آزمایشگاه AT&T Shannon در فلورهام پارک، نیوجرسی به عنوان کارمند فنی اصلی در بخش هوش مصنوعی کار کرد.

از سال ۲۰۰۳، او استاد علوم محاسباتی در دانشگاه آلبرتا بوده‌است. او تا سال ۲۰۱۸ هدایت آزمایشگاه هوش مصنوعی و یادگیری تقویتی مؤسسه را بر عهده داشت.

ساتون با حفظ سمت استادی خود، در ژوئن ۲۰۱۷ به عنوان یک دانشمند پژوهشی برجسته و یکی از بنیانگذاران دفتر جدید آن در ادمونتون به Deepmind پیوست.^[۲]^[۳]

ساتون در سال ۲۰۱۵ شهروند کانادا شد و در سال ۲۰۱۷ تابعیت ایالات متحده را ترک کرد.

انتشارات برگزیده

ساتون، RS، بارتو، AG, یادگیری تقویتی: مقدمه. مطبوعات MIT، ۱۹۹۸. همچنین به ژاپنی و روسی ترجمه شده‌است. ویرایش دوم MIT Press 2018.
Miller, WT, Sutton, RS, Werbos, PJ (Eds. , شبکه‌های عصبی برای کنترل . انتشارات MIT، ۱۹۹۱.
ساتون، RS (ویرایش)، یادگیری تقویتی. تجدید چاپ شماره ویژه مجله یادگیری ماشین. انتشارات آکادمیک کلوور، ۱۹۹۲

ساتون از سال ۲۰۰۱ عضو انجمن پیشرفت هوش مصنوعی^[۴] است. در سال ۲۰۰۳ او جایزه ویژه را از انجمن بین‌المللی شبکه عصبی^[۵] و در سال ۲۰۱۳، جایزه دستاورد برجسته در تحقیقات را از دانشگاه ماساچوست آمهرست دریافت کرد.^[۶]

در سال ۲۰۲۱، ساتون به عنوان عضو انجمن سلطنتی انتخاب شد.^[۷]

منابع

↑ "Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning". 2018-01-11. Archived from the original on 2018-01-11. Retrieved 2018-12-17.
↑ ^۲٫۰ ^۲٫۱ "Brief Biography for Richard Sutton". incompleteideas.net. Retrieved 2018-12-17.
↑ "DeepMind expands to Canada with new research office in Edmonton, Alberta". DeepMind. Archived from the original on 30 May 2019. Retrieved 2018-12-17.
↑ "Elected AAAI Fellows". www.aaai.org. Retrieved 2018-12-17.
↑ "INNS Award Recipients". www.inns.org. Retrieved 2018-12-17.
↑ "Outstanding Achievement and Advocacy Award Recipients". College of Information and Computer Sciences, University of Massachusetts Amherst (به انگلیسی). 2010-10-05. Retrieved 2018-12-17.
↑ "Royal Society elects outstanding new Fellows and Foreign Members". royalsociety.org. Retrieved 2021-06-08.

پیوند به بیرون

صفحه اصلی ریچارد ساتون

[:0-1] "Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning". 2018-01-11. Archived from the original on 2018-01-11. Retrieved 2018-12-17.

[:2-2] ۲٫۰ ^۲٫۱ "Brief Biography for Richard Sutton". incompleteideas.net. Retrieved 2018-12-17.

[:1-3] "DeepMind expands to Canada with new research office in Edmonton, Alberta". DeepMind. Archived from the original on 30 May 2019. Retrieved 2018-12-17.

[:3-4] "Elected AAAI Fellows". www.aaai.org. Retrieved 2018-12-17.

[5] "INNS Award Recipients". www.inns.org. Retrieved 2018-12-17.

[6] "Outstanding Achievement and Advocacy Award Recipients". College of Information and Computer Sciences, University of Massachusetts Amherst (به انگلیسی). 2010-10-05. Retrieved 2018-12-17.

[7] "Royal Society elects outstanding new Fellows and Foreign Members". royalsociety.org. Retrieved 2021-06-08.

[۱]

[۲]

[۳]

[۴]

[۵]

[۶]

[۷]