بینایی رایانه‌ای: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
Mercyse (بحث | مشارکت‌ها)
جز ویرایش بسیار جزئی و تکمیل کردن بخش کاربرد های بینایی کامپیوتر
رفع اشکالات نوشتاری و مفهومی جملات
خط ۵۳:
هدف از [[استخراج ویژگی]] کاهش دادن بیش تر داده‌ها به مجموعه‌ای از [[ویژگی (بینایی ماشینی)|ویژگی‌هاست]]، که باید به اغتشاشاتی چون [[شرایط نورپردازی]]، [[موقعیت دوربین]]، [[نویز]] و [[اعوجاج]] ایمن باشند. نمونه‌هایی از استخراج ویژگی عبارت‌اند از:
* انجام [[آشکارسازی لبه]].
* استخراج ویژگی‌های [[گوشه|گوشهایگوشه ای]].
* استخراج [http://www.ri.cmu.edu/projects/project_94.html تصاویر چرخش] از نقشه‌های ژرفا.
* بدست آوردن [[خطوط تراز]] و احتمالاً گذر از صفرهای [[خمش]].
خط ۶۹:
لینک منبع : [http://www.brainhq.com/brain-resources/brain-facts-myths/how-vision-works how brain interprets vision ؟]
 
حل مسئله تفسیر نور به ایده ها از جهان , درک بصری ویژگی ها و اشیا ، عملی خیلی پیچیده و به مراتب فراتر از توانایی های قدرتمند ترین ابرکامپیوتر های جهان است. بینایی نیازمند جدا کردن پیش ضمینهزمینه از پس ضمینهزمینه هست. تشخیص اشیا قرار گرفته در طیف گسترده ای از جهت ها , تفسیر نشانه های فضایی با دقت بالا . مکانیزم های نورونی در شبکه های عصبی ادراک بصری نگاه کلی از چگونگی محاسبه مغز در وضعیت های پیچیده برای تفسیر بینایی را به ما می دهد.
ادراک بینایی زمانی اغازآغاز می شوند که چشم نور را بر روی شبکیه چشم یا ( retina ) متمرکز می کند , که در آن جا توسط یک لایه از سلول های گیرنده نوری جذب می شود. این سلول ها نور را به سیگنال های الکتروشیمیایی تبدیل می کنند و به دو نوع، میله ای و مخروطمخروطی تقسیم می شوند ( بر اساس شکل هایشان ) . سلولهای میله ای مسئول دید ما در شب هستند و به نور کم پاسخ خیلی خوبی می دهند. سلول های میله ای ( Rod cells ) عمدتا در مناطق پیرامونی از شبکیه چشم ( حول یا اطراف شبکیه ) یافت می شوند و بنابراین اکثر مردم این موضوع رورا فهمیدنفهمیده کهاندکه اگر آنها نگاه خود را در شب متمرکز کنند می توانند منطقه مورد تمرکز رورا بهتر ببینند. [[پرونده:Ventral-dorsal streams.svg|right|thumb|343x343px|[[:en:Dorsal stream|جریان dorsal]] بصری ( سبز رنگ در تصویر ) و [[:en:Ventral stream|جریان ventral]] ( بنفش ) در تصویر مشخص شده. قسمت های بسیار زیادی از [[قشر مغز|cerebral cortex]] در پروسه بینایی نقش دارند.]]
 
سلولهای مخروطی ( Cone cells ) در یک منطقه مرکزی شبکیه متمرکز به نام گودال متمرکز شده اند که فرورفتگی ( یا fovea ) هم نام دارد. انها مسئول وظایف سنگین و دقیقی مثل خواندن هستند. سلول های Cone و بسته به اینکه به نور آبی , قرمز , سبز چگونه واکنش می دهند به سه دسته تقسیم می شوند، و در مجموع این سه نوع از Cone ما را قادر به درک رنگ ها می کنند. سیگنال ها از سلول های گیرنده نوری ( photoreceptor cells ) از طریق شبکه ای از interneurons ها در لایه دوم شبکیه چشم به سلول های ganglion در لایه سوم منتقل می شوند. نورون های موجود در این دو لایه از شبکیه زمینه پذیرای پیچیده ای که آنها را قادر به تشخیص تضاد های تغییراتی در یک تصویر می کند را ارائه می دهند : این تغییرات ممکن است لبه ها و یا سایه ها را نشان دهددهند. سلول های Ganglion این اطلاعات را به همراه دیگر اطلاعات در مورد رنگ جمع آوری می کنند و خروجی خود را به مغز از طریق عصب بینایی ارسال می کنند. عصب یا Nerve بینایی در درجه اول اطلاعات را از طریق thalamus به قشاء مغزی ( cerebral cortex ) ارسال می کند. پس از ارسال اطلاعات در قسمت cerebral cortex ادراک بصری انسان به وقوع می پیوندد. اما در عین حال این عصب (Nerve) حامل اطلاعات مورد نیاز برای مکانیک دید نیز هست که به دو قسمت از ساقه مغز (brainstem) این اطلاعات را منتقل می کند . اولین قسمت از brainstem گروهی از سلول های هسته هستند که pretectum نام دارند که کنترل غیر ارادی اندازه مردمک در پاسخ به شدت نور را بر عهده دارند. اطلاعات مربوط به اهداف متحرک و اطلاعات ساکن اسکن شده توسط چشم نیز به قسمت دوم در brainstem منتقل می شود , یک هسته که با نام superior colliculus شناخته می شود مسئول حرکات چشم در پرش های کوتاه هست. بخش دیگر از این دو قسمت saccades هست که به مغز اجازه درک یک اسکن هموار را با کمک چسباندن یک سری از تصاویر نسبتا ثابت می دهد. Saccadic eye movement مشکل تاری شدید رو- که می تونهتواند برای تصویر پیش بیادبیاید - را حل می کند. اگر چشم می تواند به صورت همواریکنواخت در سراسر چشم انداز بصری حرکت کند؛ saccades ها در بعضی از وضعیت ها تجربه بصری رورا ممکن و آسان می کنند مانند مشاهده چشم فرد دیگری برای شما, در حالی که اونآن فرد در تلاش برای نگاه کردن سرتاسر اتاق هست.[[پرونده:Thalamus small.gif|thumb|محل دقیق قسمت [[:en:Thalamus|thalamus]] ( تالاموس ) در عمق مغز در تصویر سه بعدی ]]
بسیاری از تصاویر از شبکیه چشم ( retina ) از طریق عصب بینایی به بخشی از thalamus که به نام ( lateral geniculate nucleus ) شناخته شده است و در اختصار (LGN) هم کفته می شود منتقل می شوند , thalamus در عمق مرکز مغز قرار گرفته. LGN ورودی شبکیهاشبکیه ( retinal ) را به جریان های موازی ای مورد جدا سازی قرار می دهد, که یکی حاوی رنگ و ساختار ثابت و دیگری حاوی تضاد ها (contrast) و حرکات هست. سلول هایی که پردازش رنگ و ساختار را انجام می دهند چهار لایه بالایی از شش لایه LGN را تشکیل می دهند. اوناین چهار لایه به علت کوچکی سلول ها , parvocellular نامیده می شوند. سلول هایی که پردازش حرکات و تضاد های تصویر رورا انجام می دهند دو لایه پایینی LGN رو تشکیل می دهند و به علت بزرگی سلول های اوناین قسمتقسمت، لایه magnocellular نامیده می شوند .
 
سلول های لایه های magnocellular و parvocellular همه راه ها رورا به بخش های پشت مغز و به سمت قشر بینایی اولیه ( Visual cortex _ V1 ) طرح ریزی می کندکنند. سلول ها در V1 در چندین راهمسیر مرتب شده اند که این مسئله اجازه می دهد سیستم بینایی محل اشیاء را در فضا محاسبه کند. در ابتدا سلول های V1 به صورت retinotopically یا موضعی سازمان یافته اند , که به معنای این است که نقطه به نقطه روی نقشه بین شبکیه و قشر بینایی اولیه وجود دارد و مناطق همجوار در شبکیه چشم با مناطق همجوار در V1 مطابقت دارد. که این به V1 اجازه می دهد که موقعیت اشیا رورا در دو بعد از جهان بصری که افقی و عمودی یا همون(مختصات ( x , y ) هست) تعیین کند. بعد سوم و عمق نیز با مقایسه سیگنال های دو چشم توسط V1 نقشه برداری و تعیین می شود. این سیگنال ها در پشته سلولها که ستون ocular dominance نامیده می شوند پردازش می شوند , که یک الگوی شطرنجی اتصالات متناوب بین سمت چپ و چشم راست است. اختالفیاختلافی جزئی در موقعیت یک شی نسبت به هر چشم وجود دارد که اجازه می دهد تا به عمق توسط مثلث محاسبه شود.
 
در نهایت، V1 به ستون های جهت گیری سازمان یافته است، پشته از سلول ها که به شدت توسط خطوط یک جهت گیری داده شده , فعال می شوند. ستون های جهت برایامکان تشخیص لبه های اشیاء در جهان بصری ,را V1برایV1 را قادرفراهم می سازند، و به طوری که آنها کار پیچیده ای از تشخیص بصری را شروع می کنند. سازمان ستونی از قشر بینایی اولیه برای اولین بار توسط David Hubel و Torsten Wiesel توصیف شده است، که در نتیجه بخاطر این موضوع جایزه نوبل 1981 را بردنددریافت کرده اند.
 
جالب توجه است که این الگوی شطرنجی, سازمان ستونی V1 در هنگام تولد بسیار مبهم است. قشر بینایی یک نوزاد تازه متولد شده رشد بیش از حد (hypertrophy) , یا اتصالات اتفاقی دارد که باید به دقت و بر اساس تجربه بصری در بلند مدت هرس شوند ، و در نهایت به ستون های جداگانه تعریف شده تبدیل شوند.- که این در واقع یک کاهش در تعداد اتصالات و نه افزایش اتصالات خواهد بود , -که در نهایت توانایی نوزاد برای دیدن جزئیات ریز و به رسمیت شناختن اشکال و الگوها را بهبود می بخشد.
[[پرونده:Visualcortex.gif|thumb|121x121px|<span lang="ach" dir="ltr">[[:en:Visual cortex|primary visual cortex (V1)]]</span>]]
این نوع از پالایش وابسته , به فعالیت به V1 محدود نمی شود. و در بسیاری از مناطق سراسر قشر مغز ( cerebral cortex ) رخ می دهد. در همان زمان که توانایی تبعیض خطوط و لبه در قشر بینایی اولیه بهبود می یابد ، سلول ها را در قشر بینایی ثانویه ( secondary visual cortex V2 ) , توانایی خود را برای تفسیر رنگ پالایش می کنند. V2 تا حد زیادی مسئول پدیده ثبات رنگ است. و این حقیقت را توضیح می دهد که واقعیت یک گل سرخ تحت تاثیر بسیاری از رنگ های مختلف نور توسط ما هنوز هم به رنگ سرخ به نظر می رسد. این طور گمان می شهشود که ثبات رنگ وقتی رخ می دهد که V2 می تواند یک شئیشیء و نور محیط را مقایسه کند و می تواند براورد رنگ روشنایی را کاهش دهد. با اینحال این پروسه با توجه به اینکه بیننده انتظار دارد اونکه شیشیء بخصوص به چه رنگی باشدداشته باشد، به شدت تحت تاثیر قرار می گیرد.
 
در حقیقت، تقریباتقریباً تمام ویژگی های مرتبه بالاتر از بینایی و منظره توسط انتظارات بر اساس تجربه گذشته تحت تاثیر قرار می گیرد. این ویژگی به گسترش رنگ و درک فرم موجود در V3 و V4، به چهره و تشخیص شیشیء در لوب temporal ( جایی که تصویر ذهنی سه بعدی از انچه که می بینیم در نهایت تشکیل می شود ) و به حرکت و آگاهی از فضای موجود در لوب parietal می انجامد. اگر چههرچند چنین روش و تأثیراتی گاها اجازه می دهد مغز تحت تاثیر تصورات نادرست فریب بخورد ، برای مثال در مواقع خطای دید در برخی از تصاویر , باولی اینحال اناین روش پردازش همینطور به ما توانایی دیدن و پاسخ سریع به جهان بصری را داده است. از تشخیص روشنایی و تاریکی در شبکیه چشم ( retina ) تا خطوط انتزاعی در V1 تا تفسیر اشیا و روابط فضاییشان در ناحیه های بصری بالاتر، هر وظیفه ای در ادراک بصری کارایی و قدرت سیستم بینایی انسان را نشان می دهد.
 
جزئیات بیشتر درباره هر قسمت از قشر بینایی ː