بینایی رایانه‌ای: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
Mercyse (بحث | مشارکت‌ها)
جز ویرایش جزئی بصری
اصلاح پیوند(ها) به صفحهٔ ابهام‌زدایی (مدل) با استفاده از AWB
خط ۱:
'''بینایی کامپیوتر''' {{به انگلیسی|Computer vision}} یا '''بینایی ماشین''' {{به انگلیسی|Machine vision}} یکی از شاخه‌های علوم کامپیوتر است که شامل روش‌های مربوط به دستیابی تصاویر، پردازش، آنالیز و درک محتوای آن‌ها است. معمولاً این پردازش‌ها تصاویر تولید شده در دنیای واقعی را به عنوان ورودی دریافت و [[داده‌ها|داده‌هایی]] عددی یا سمبلیک را به عنوان خروجی تولید می‌کنند، مانند در شکل‌هایی از تصمیم‌گیری.<ref name="Klette-2014">
{{cite book|author=Reinhard Klette|title=Concise Computer Vision|publisher=Springer|year=2014|isbn=978-1-4471-6320-6}}</ref><ref name="Shapiro-Stockman-2001">
{{cite book|author=Linda G. Shapiro and George C. Stockman|title=Computer Vision|publisher=Prentice Hall|year=2001|isbn=0-13-030796-3}}</ref><ref name="Morris-2004">{{cite book|author=Tim Morris|title=Computer Vision and Image Processing|publisher=Palgrave Macmillan|year=2004|isbn=0-333-99451-5}}</ref><ref name="Jahne-Haussecker-2000">{{cite book| author=Bernd Jähne and Horst Haußecker|title=Computer Vision and Applications, A Guide for Students and Practitioners|publisher=Academic Press|year=2000|isbn=0-13-085198-1}}</ref> یکی رویه‌های توسعهٔ این شاخه بر اساس شبیه‌سازی توانایی بینایی انسان در رایانه است.[[پرونده:NASA Mars Rover.jpg|thumb|244x244px|تصویر هنری از مریخ نورد NASA بر روی سطح سیاره مریخ . مثالی از خودروهای زمینی بدون سرنشین ]]
 
بینایی رایانه‌ای به مسائل مختلفی از جمله استخراج داده از عکس، فیلم، مجموعه چند عکس از زوایای مختلف و پردازش تصاویر پزشکی می‌پردازد. معمولاً ترکیبی از روش‌های مربوط به [[پردازش تصاویر]]<ref>Image processing</ref> و ابزارهای [[یادگیری ماشینی]]<ref>Machine learning</ref> و [[آمار]] برای حل مسایل مختلف در این شاخه استفاده می‌گردد.
خط ۵۷:
* بدست آوردن [[خطوط تراز]] و احتمالاً گذر از صفرهای [[خمش]].
=== ثبت ===
هدف گام ثبت برقراری تناظر میان ویژگی‌های مجموعه برداشت شده و ویژگی‌های اجسام شناخته‌شده در یک [[پایگاه داده‌ها|پایگاه داده‌های]] [[مدل (ریاضی)|مدل]] و/یا ویژگی‌های تصویر قبلی است. در گام ثبت باید به یک [[فرضیه]] نهایی رسید. چند روش این کار عبارت‌اند از:
*[[تخمین کمترین مربعات]].
* [[تبدیل هاگ]] در انواع گوناگون.
خط ۷۰:
 
حل مسئله تفسیر نور به ایده ها از جهان , درک بصری ویژگی ها و اشیا ، عملی خیلی پیچیده و به مراتب فراتر از توانایی های قدرتمند ترین ابرکامپیوتر های جهان است. بینایی نیازمند جدا کردن پیش ضمینه از پس ضمینه هست. تشخیص اشیا قرار گرفته در طیف گسترده ای از جهت ها , تفسیر نشانه های فضایی با دقت بالا . مکانیزم های نورونی در شبکه های عصبی ادراک بصری نگاه کلی از چگونگی محاسبه مغز در وضعیت های پیچیده برای تفسیر بینایی را به ما می دهد
ادراک بینایی زمانی اغاز می شوند که چشم نور را بر روی شبکیه چشم یا ( retina ) متمرکز می کند , که در آن جا توسط یک لایه از سلول های گیرنده نوری جذب می شود. این سلول ها نور را به سیگنال های الکتروشیمیایی تبدیل می کنند و به دو نوع، میله و مخروط تقسیم می شوند ( بر اساس شکل هایشان ) . سلولهای میله ای مسئول دید ما در شب هستند و به نور کم پاسخ خیلی خوبی می دهند. سلول های میله ای ( Rod cells ) عمدتا در مناطق پیرامونی از شبکیه چشم ( حول یا اطراف شبکیه ) یافت می شوند و بنابراین اکثر مردم این موضوع رو فهمیدن که اگر آنها نگاه خود را در شب متمرکز کنند می توانند منطقه مورد تمرکز رو بهتر ببینند. [[پرونده:Ventral-dorsal streams.svg|right|thumb|343x343px|[[:en:Dorsal_streamDorsal stream|جریان dorsal]] بصری ( سبز رنگ در تصویر ) و [[:en:Ventral_streamVentral stream|جریان ventral]] ( بنفش ) در تصویر مشخص شده. قسمت های بسیار زیادی از [[قشر مغز|cerebral cortex]] در پروسه بینایی نقش دارند.]]
 
سلولهای مخروطی ( Cone cells ) در یک منطقه مرکزی شبکیه متمرکز به نام گودال متمرکز شده اند که فرورفتگی ( یا fovea ) هم نام دارد. انها مسئول وظایف سنگین و دقیقی مثل خواندن هستند. سلول های Cone و بسته به اینکه به نور آبی , قرمز , سبز چگونه واکنش می دهند به سه دسته تقسیم می شوند، و در مجموع این سه نوع از Cone ما را قادر به درک رنگ ها می کنند. سیگنال ها از سلول های گیرنده نوری ( photoreceptor cells ) از طریق شبکه ای از interneurons ها در لایه دوم شبکیه چشم به سلول های ganglion در لایه سوم منتقل می شوند. نورون های در این دو لایه از شبکیه زمینه پذیرای پیچیده ای که آنها را قادر به تشخیص تضاد های تغییراتی در یک تصویر می کند را ارائه می دهند : این تغییرات ممکن است لبه ها و یا سایه ها را نشان دهد. سلول های Ganglion این اطلاعات را به همراه دیگر اطلاعات در مورد رنگ جمع آوری می کنند و خروجی خود را به مغز از طریق عصب بینایی ارسال می کنند. عصب یا Nerve بینایی در درجه اول اطلاعات را از طریق thalamus به قشاء مغزی ( cerebral cortex ) ارسال می کند. پس از ارسال اطلاعات در قسمت cerebral cortex ادراک بصری انسان به وقوع می پیوندد. اما در عین حال این عصب (Nerve) حامل اطلاعات مورد نیاز برای مکانیک دید نیز هست که به دو قسمت از ساقه مغز (brainstem) این اطلاعات را منتقل می کند . اولین قسمت از brainstem گروهی از سلول های هسته هستند که pretectum نام دارند که کنترل غیر ارادی اندازه مردمک در پاسخ به شدت نور را بر عهده دارند. اطلاعات مربوط به اهداف متحرک و اطلاعات ساکن اسکن شده توسط چشم نیز به قسمت دوم در brainstem منتقل می شود , یک هسته که با نام superior colliculus شناخته می شود مسئول حرکات چشم در پرش های کوتاه هست. بخش دیگر از این دو قسمت saccades هست که به مغز اجازه درک یک اسکن هموار را با کمک چسباندن سری از تصاویر نسبتا ثابت می دهد. Saccadic eye movement مشکل تاری شدید رو که می تونه برای تصویر پیش بیاد را حل می کند. اگر چشم می تواند به صورت هموار در سراسر چشم انداز بصری حرکت کند؛ saccades ها در بعضی از وضعیت ها تجربه بصری رو ممکن و آسان می کنند مانند مشاهده چشم فرد دیگری برای شما, در حالی که اون فرد در تلاش برای نگاه کردن سرتاسر اتاق هست.[[پرونده:Thalamus small.gif|thumb|محل دقیق قسمت [[:en:Thalamus|thalamus]] ( تالاموس ) در عمق مغز در تصویر سه بعدی ]]
خط ۸۰:
 
جالب توجه است که این الگوی شطرنجی, سازمان ستونی V1 در هنگام تولد بسیار مبهم است. قشر بینایی یک نوزاد تازه متولد شده رشد بیش از حد (hypertrophy) , یا اتصالات اتفاقی دارد که باید به دقت و بر اساس تجربه بصری در بلند مدت هرس شوند ، و در نهایت به ستون های جداگانه تعریف شده تبدیل شوند. که این در واقع یک کاهش در تعداد اتصالات و نه افزایش اتصالات خواهد بود , که در نهایت توانایی نوزاد برای دیدن جزئیات ریز و به رسمیت شناختن اشکال و الگوها را بهبود می بخشد.
[[پرونده:Visualcortex.gif|thumb|121x121px|<span lang="ach" dir="ltr">[[:en:Visual_cortexVisual cortex|primary visual cortex (V1)]]</span>]]
این نوع از پالایش وابسته , به فعالیت به V1 محدود نمی شود. و در بسیاری از مناطق سراسر قشر مغز ( cerebral cortex ) رخ می دهد. در همان زمان که توانایی تبعیض خطوط و لبه در قشر بینایی اولیه بهبود می یابد ، سلول ها را در قشر بینایی ثانویه ( secondary visual cortex V2 ) , توانایی خود را برای تفسیر رنگ پالایش می کنند. V2 تا حد زیادی مسئول پدیده ثبات رنگ است. و این حقیقت را توضیح می دهد که واقعیت یک گل سرخ تحت تاثیر بسیاری از رنگ های مختلف نور توسط ما هنوز هم به رنگ سرخ به نظر می رسد. این طور گمان می شه که ثبات رنگ وقتی رخ می دهد که V2 می تواند یک شئی و نور محیط را مقایسه کند و می تواند براورد رنگ روشنایی را کاهش دهد. با اینحال این پروسه با توجه به اینکه بیننده انتظار دارد اون شی به چه رنگی باشد به شدت تحت تاثیر قرار می گیرد.
 
خط ۸۶:
 
جزئیات بیشتر درباره هر قسمت از قشر بینایی ː
* [[:en:Visual_cortexVisual cortex|Visual cortex]]
* [[:en:Visual_perceptionVisual perception|Visual perception]]
 
== جستارهای وابسته ==
خط ۱۳۷:
* کاربرد های نظامی
** تشخیص و شناسایی چهره افراد در فرودگاها و مراکز حساس دیگر
** وسایل حرکتی بدون سرنشین _ مستقل ( [[:en:Uncrewed_vehicleUncrewed vehicle|Uncrewed vehicle]] )
**# خودرو های زمینی بدون سرنشین نظامی چند منظوره با قابلیت های استفاده موتوریزه و انتقال نیرو ها و تجهیزات . . . ( [[:en:Unmanned_ground_vehicleUnmanned ground vehicle|Unmanned ground vehicle]] )
**# زیردریایی بدون سرنشین ː زیردریایی شرکت بوئینگ ( [http://www.gizmag.com/boeing-echo-voyager/42272/ Boeing submarine] ) که قابلیت ماه ها ماندن در زیر دریا و بررسی و ارسال اطلاعات به طور کاملا مستقل را قادر می باشند [http://www.khabaronline.ir/(X(1)S(jaafksyg5wlqqlpeaickicrd))/detail/518679/science/technology]
**# ناو های بدون سرنشین ː ناو های ضد زیردریایی [[:en:ACTUV|ACTUV]] ساخت [[دارپا|DARPA]] (سازمان پروژه‌های تحقیقاتی پیشرفتهٔ دفاعی )[http://www.khabaronline.ir/(X(1)S(jaafksyg5wlqqlpeaickicrd))/detail/509720/science/technology]
**# هواپیما های بدون سرنشین و پهپاد ها با کنترل مستقل ( [[:en:Unmanned_aerial_vehicleUnmanned aerial vehicle|Unmanned aerial vehicle]] )
**# فضاپیمای بدون سرنشین ( [[:en:Unmanned_spacecraftUnmanned spacecraft|Unmanned spacecraft]] )
**# ربات های [[ربات انسان‌نما|Humanoid]]  ( پروژه [[:en:Atlas_Atlas (robot)|Atlas robot]] )
**# [[:en:Nanorobotics|Nanobots]]
 
خط ۱۶۳:
{{علوم رایانه}}
 
{{DEFAULTSORT:بینایی کامپیوتر}}
[[رده:بینایی رایانه‌ای|بینایی کامپیوتر]]
[[رده:پردازش تصویر]]
سطر ۱۶۹ ⟵ ۱۷۰:
[[رده:شبکه عصبی]]
[[رده:یادگیری ماشینی]]
{{DEFAULTSORT:بینایی کامپیوتر}}