جدول مساحت تجمعی

جدول مساحت تجمعی یک ساختمان ذخیرهٔ داده و الگوریتمی برای تولید سریع و کارآمد مجموع مقادیر در مساحت زیرمستطیل‌هایی از یک جدول است. در حوزه پردازش تصویر ، به عنوان یک تصویر انتگرالی نیز شناخته می شود. این الگوریتم ابتدا در سال ۱۹۸۴ توسط فرانک پینتر در گرافیک کامپیوتری برای استفاده با Mipmap ها معرفی شد. در شاخه بینایی کامپیوتر توسط لوئیس[۱] وارد شد و سپس با نام تصویر انتگرالی با کاربرد بجایی در چارچوب تشخیص اشیا ویولا-جونز در سال ۲۰۰۱ مورد استفاده قرار گرفت. از لحاظ تاریخی، اصول این روش در محاسبهٔ توابع توزیع احتمال چند بعدی، به ویژه در محاسبه احتمالات دو بعدی یا چند بعدی (مساحت زیر نمودار تابع توزیع احتمال) با استفاده از توابع توزیع تجمعی بسیار شناخته شده است.[۲]

استفاده از یک جدول مساحت تجمعی ( 2. ) برای جمع کردن یک مستطیل فرعی از مقادیر یک مربع جادویی مرتبه 6 ( 1. ). هر نقطه رنگی مجموع داخل مستطیل آن رنگ را برجسته می کند.

الگوریتم

ویرایش

همانطور که نام جدول مساحت تجمعی پیشنهاد می‌کند، مقدار ذخیره شده در هر پیکسل (x، y) در جدول برابر است با مجموع تمام پیکسل های بالا و سمت چپ آن پیکسل به علاوه مقدار خود آن پیکسل:  

 

که در آن   مقدار پیکسل در نقطه‌ٔ (x ، y) است.

جدول مساحت تجمعی را می توان تنها با یک بار عبور از روی تک تک خانه‌های تصویر محاسبه کرد، چرا که مقدار پیکسل (x، y) در جدول مساحت تجمعی برابر است با:

 

اگر محاسبهٔ ماتریس تجمعی را از گوشهٔ بالا سمت چپ تصویر شروع کنیم با پیمایش هر سطر برای محاسبهٔ هر پیکسل کافی است از مقدار پیکسل‌های سمت چپ، بالا و بالا سمت چپ آن پیکسل که قبلا محاسبه شده‌اند استفاده کرده مقادیر کل جدول را محاسبه‌ کنیم.

 
نمایش محاسبه مجموع در ساختمان داده/الگوریتم جدول مساحت تجمعی

پس از محاسبه‌‌ٔ جدول مساحت تجمعی، ارزیابی مجموع مقادیر در مساحت هر ناحیه مستطیلی مستلزم جمع تنها چهار عنصر جدول صرف نظر از اندازه مساحت مورد نظر است. یعنی همان طور که در شکل نمایش داده شده است، با داشتن مقادیر A و B و C می‌توان مقدار D را با استفاده از رابطه‌ی زیر محاسبه کرد:

  

این روش خیلی راحت قابل بسط به دامنه‌ی مقادیر پیوسته است. همچنین می توان این روش را به تصاویر با ابعاد بالاتر نیز بسط داد. [۳] اگر گوشه‌های مستطیل   که   زیر دامنه‌‌ٔ   باشد، مجموع مقادیر تصویر محدود به یک مستطیل با فرمول زیر محاسبه می شود

 

که در آن   تصویر انتگرالی در   است و   بعد تصویر. نماد گذاری   در حالت   متناظر است با   ،   ،   و   به عنوان مثال در تصویربرداری عصبی، وقتی از واکسل یا واسلکهایی با برچسب زمان استفاده شود بعد تصویر برابر است با   یا  .

این روش در کارهایی چون مقاله‌ی Phan و همکاران[۴] به تصویر انتگرال مراتب بالاتر بسط پیدا کرده است. در این مقاله دو، سه یا چهار تصویر انتگرالی برای محاسبهٔ سریع و کارآمد انحراف معیار (واریانس) ، چولگی و کشیدگی بلوک محلی در تصویر ارائه شده‌ است که در ادامه شرح داده می‌شود:

برای محاسبه واریانس یا انحراف معیار یک بلوک، ما به دو تصویر انتگرالی نیاز داریم:

 
 

واریانس با این فرمول محاسبه می‌شود:

 

اگر   و   به ترتیب مجموع بلوک   از   و   را نشان دهد،   و   به سرعت توسط تصویر انتگرال محاسبه می شوند. حال معادلهٔ واریانس را به صورت زیر تغییر می‌دهیم:

     

که در آن   و  .

همان طور که برای برآورد میانگین ( ) و واریانس ( ) به ترتیب به تصاویر انتگرالی درجه اول و دوم تصویر نیاز است (یعنی  )؛ می‌توان نشان داد که با استفاده از تصاویر درجه سوم و چهارم (یعنی  ) می‌توان مقادیر چولگی و کشیدگی را به دست آورد.

سرریز

ویرایش

یکی از جزئیات مهم پیاده سازی که باید در مورد روشهای فوق در نظر داشت این است که همانطور که توسط Shafait و همکاران اشاره شده است[۵] برای تصاویر انتگرالی مرتبه بالاتر اگر از اعداد ۳۲ بیتی صحیح استفاده شود ممکن است سرریز اتفاق بیفتد.

منابع

ویرایش
  1. Lewis, J.P. (1995). Fast template matching. Proc. Vision Interface. pp. 120–123.
  2. Finkelstein, Amir; neeratsharma (2010). "Double Integrals By Summing Values Of Cumulative Distribution Function". Wolfram Demonstration Project
  3. Tapia, Ernesto (January 2011). "A note on the computation of high-dimensional integral images". Pattern Recognition Letters. 32 (2): 197–201. doi:10.1016/j.patrec.2010.10.007.
  4. Phan, Thien; Sohoni, Sohum; Larson, Eric C.; Chandler, Damon M. (22 April 2012). Performance-analysis-based acceleration of image quality assessment بایگانی‌شده در ۲۴ مه ۲۰۱۴ توسط Wayback Machine (PDF). 2012 IEEE Southwest Symposium on Image Analysis and Interpretation. pp. 81–84. CiteSeerX 10.1.1.666.4791. doi:10.1109/SSIAI.2012.6202458. ISBN 978-1-4673-1830-3.
  5. Shafait, Faisal; Keysers, Daniel; M. Breuel, Thomas (January 2008). "Efficient implementation of local adaptive thresholding techniques using integral images" (PDF). Electronic Imaging. Document Recognition and Retrieval XV. 6815: 681510–681510–6. CiteSeerX 10.1.1.109.2748. doi:10.1117/12.767755. Archived from the original (PDF) on 15 December 2014. Retrieved 15 August 2021.