بینایی رایانه‌ای: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
Mercyse (بحث | مشارکت‌ها)
بدون خلاصۀ ویرایش
Mercyse (بحث | مشارکت‌ها)
جزبدون خلاصۀ ویرایش
خط ۷۳:
ادراک بینایی زمانی اغاز می شوند که چشم نور را بر روی شبکیه چشم یا ( retina ) متمرکز می کند , که در آن جا توسط یک لایه از سلول های گیرنده نوری جذب می شود. این سلول ها نور را به سیگنال های الکتروشیمیایی تبدیل می کنند و به دو نوع، میله و مخروط تقسیم می شوند ( بر اساس شکل هایشان ) . سلولهای میله ای مسئول دید ما در شب هستند و به نور کم پاسخ خیلی خوبی می دهند. سلول های میله ای ( Rod cells ) عمدتا در مناطق پیرامونی از شبکیه چشم ( حول یا اطراف شبکیه ) یافت می شوند و بنابراین اکثر مردم این موضوع رو فهمیدن که اگر آنها نگاه خود را در شب متمرکز کنند می توانند منطقه مورد تمرکز رو بهتر ببینند. [[پرونده:Ventral-dorsal streams.svg|right|thumb|343x343px|[[:en:Dorsal_stream|جریان dorsal]] بصری ( سبز رنگ در تصویر ) و [[:en:Ventral_stream|جریان ventral]] ( بنفش ) در تصویر مشخص شده. قسمت های بسیار زیادی از [[قشر مغز|cerebral cortex]] در پروسه بینایی نقش دارند [https://en.wikipedia.org/wiki/Visual_perception]]]
 
سلولهای مخروطی ( Cone cells ) در یک منطقه مرکزی شبکیه متمرکز به نام گودال متمرکز شده اند که فرورفتگی یا  fovea هم نام دارد. انها مسئول وظایف سنگین و دقیقی مثل خواندن هستند. سلول های Cone به سه دسته تقسیم می شوند و بسته به اینکه به نور آبی , قرمز , سبز چگونه پاسخ می دهند به سه دسته تقسیم می شوند ، در مجموع این سه نوع از Cone ما را قادر به درک رنگ ها می کنند. سیگنال ها از سلول های گیرنده نوری ( photoreceptor cells ) از طریق شبکه ای از interneurons ها در لایه دوم شبکیه چشم به سلول های ganglion در لایه سوم منتقل می شوند. نورون های در این دو لایه از شبکیه زمینه پذیرای پیچیده ای که آنها را قادر به تشخیص تضاد های تغییراتی در یک تصویر می کند را ارائه می دهند : این تغییرات ممکن است لبه ها و یا سایه ها را نشان دهد. سلول های Ganglion این اطلاعات را به همراه دیگر اطلاعات در مورد رنگ جمع آوری می کنند و خروجی خود را به مغز از طریق عصب بینایی ارسال می کنند. عصب یا Nerve بینایی در درجه اول اطلاعات را از طریق thalamus به قشاء مغزی ( cerebral cortex ) ارسال می کند ((  cerebral cortex مغز حدود 19% نورون های کل مغز رو تشکیل می دهد و بیشترین تعداد نورون ها را بعد از " بخش '''cerebellum''' یا مخچه که 80% از کل نورون های مغز رو در اختیار داره و وظیفه حرکت و هماهنگی حرکات بدن رو بر عهده داره " را دارا می باشد )) که بعد از ارسال اطلاعات در قسمت cerebral cortex ادراک بصری انسان به وقوع می پیوندد . اما در عین حال این عصب یا Nerve حامل اطلاعات مورد نیاز برای مکانیک دید نیز هست که به دو قسمت از ساقه مغز (brainstem ) این اطلاعات را منتقل می کند . اولین قسمت از brainstem گروهی از سلول های هسته هستند که pretectum نام دارند که کنترل غیر ارادی اندازه مردمک در پاسخ به شدت نور را بر عهده دارند. اطلاعات مربوط به اهداف متحرک و اطلاعات ساکن اسکن شده توسط چشم نیز به قسمت دوم در brainstem منتقل می شود , یک هسته که با نام superior colliculus شناخته می شود مسئول حرکات چشم در پرش های کوتاه هست. بخش دیگر از این دو قسمت saccades هست که به مغز اجازه درک یک اسکن هموار را با کمک چسباندن سری از تصاویر نسبتا ثابت رو می دهد. Saccadic eye movement مشکل تاری شدید رو که می تونه برای تصویر پیش بیاد را حل می کند. اگر چشم می تواند به صورت هموار در سراسر چشم انداز بصری حرکت کند؛ saccades ها در بعضی از وضعیت ها تجربه بصری رو ممکن و آسان می کنند مانند مشاهده چشم فرد دیگری برای شما, در حالی که اون فرد در تلاش برای نگاه کردن سرتاسر اتاق هست.[[پرونده:Thalamus small.gif|thumb|محل دقیق قسمت [[:en:Thalamus|thalamus]] ( تالاموس ) در عمق مغز در تصویر سه بعدی ]]
بسیاری از تصاویر از شبکیه چشم ( retina ) از طریق عصب بینایی به بخشی از thalamus که به نام ( lateral geniculate nucleus ) شناخته شده است و در اختصار (LGN) هم کفته می شود منتقل می شوند , thalamus در عمق مرکز مغز قرار گرفته. LGN ورودی شبکیها (  retinal ) را به جریان های موازی مورد جدا سازی قرار می دهد , که یکی حاوی رنگ و ساختار ثابت و دیگری حاوی contrast (تضاد ها ) و حرکات هست. سلول هایی که پردازش رنگ و ساختار را انجام می دهند چهار لایه بالایی از شش لایه LGN را تشکیل می دهند. اون چهار لایه به علت کوچکی سلول ها , parvocellular نامیده می شوند. سلول هایی که پردازش حرکات و تضاد های تصویر رو انجام می دهند دو لایه پایینی LGN رو تشکیل می دهند و به علت بزرگی سلول های اون قسمت لایه magnocellular نامیده می شوند .
 
خط ۸۵:
 
در حقیقت، تقریبا تمام ویژگی های مرتبه بالاتر از بینایی و منظره توسط انتظارات بر اساس تجربه گذشته تحت تاثیر قرار می گیرد. این ویژگی به گسترش رنگ و درک فرم موجود در V3 و V4، به چهره و تشخیص شی در لوب temporal ( جایی که تصویر ذهنی سه بعدی از اونچه که می بینیم در نهایت تشکیل می شه ) و به حرکت و آگاهی از فضای موجود در لوب parietal می انجامد. اگر چه چنین روش و تأثیراتی گاها اجازه می دهد مغز تحت تاثیر تصورات نادرست فریب بخورد ، برای مثال در خطای دید در تصاویر خاص , با اینحال اون روش همینطور به ما توانایی دیدن و پاسخ سریع به جهان بصری را داده است. از تشخیص روشنایی و تاریکی در شبکیه چشم ( retina ) تا خطوط انتزاعی در V1 تا تفسیر اشیا و روابط فضاییشان در ناحیه های بصری بالاتر، هر وظیفه ای در ادراک بصری کارایی و قدرت سیستم بینایی انسان را نشان می دهد.
[[پرونده:Human-vision-cell.jpg|thumb|392x392px|سلول های Cone در مرکز و Rod  ها در اطراف شبکیه چشم ]]
 
== جستارهای وابسته ==
[[پرونده:1414 Rods and Cones.jpg|thumb|485x485px|''[[:en:Photoreceptor_cell|Photoreceptor Cell]]'' سلول ''های'' گیرنده های نوری]]
* [[هوش مصنوعی]]
* [[یادگیری ماشینی|یادگیری ماشین]]