بحث الگو:دادههای دنیاگیری ۲۰۱۹–۲۰۲۰ کروناویروس/نمودار موارد پزشکی ایران
منبع
ویرایش@Freshman404 و Sunfyre: سلام. لطفاً منابعی که استفاده کردهاید را در بخش توضیحات یا در خود الگو وارد کنید. تشکر. Hanooz ۵ مارس ۲۰۲۰، ساعت ۱۱:۱۹ (UTC)
Medical cases chart
ویرایشبهتر نیست الگو:جعبه میله با الگو:Medical cases chart جایگزین شود؟ هومن (بحث) ۲۸ مارس ۲۰۲۰، ساعت ۰۴:۴۵ (UTC)
- @Hooman91: البته باید فرمتش را مثل الگو:دادههای دنیاگیری ۲۰۱۹-۲۰۲۰ کروناویروس/موارد پزشکی چین (تاییدشده) کنیم.. -- SunfyreT ۲۸ مارس ۲۰۲۰، ساعت ۰۴:۵۱ (UTC)
فاصله بین میلهها
ویرایش@Sunfyre: در دادههای ویژه:تفاوت/28563686 برای ستون درگذشتگان هم (+تعداد) و هم (+درصد) وجود دارد که با «;» جدا شدهاند، ولی الگو:Medical cases chart فقط یک مقدار را برای این ستون میپذیرد. جایگزین کردن «;» با «)(» در ویژه:تفاوت/28563769 (ادغام دو پارامتر) هم بین میلهها فاصله ایجاد میکند. فعلاً آخرین پارامتر دادهها (+درصد) را حذف میکنم. هومن (بحث) ۲۸ مارس ۲۰۲۰، ساعت ۰۷:۰۶ (UTC)
- @Hooman91: ممنون SunfyreT ۲۸ مارس ۲۰۲۰، ساعت ۰۷:۱۱ (UTC)
- خواهش میکنم. هومن (بحث) ۲۸ مارس ۲۰۲۰، ساعت ۲۲:۴۷ (UTC)
- @Hooman91: در الگو گزینه «گسترش» چند مرتبه نمایش داده میشود. -- SunfyreT ۳۰ مارس ۲۰۲۰، ساعت ۱۱:۰۸ (UTC)
- @Sunfyre: مشکل از تابع زمان است که امروز {{#time:F|feb|fa}} را «مارس» نمایش میدهد! الان سعی میکنم بیشتر بررسی کنم. (مثلاً ممکن است به leap year بودن 2020 مربوط باشد؟) هومن (بحث) ۳۰ مارس ۲۰۲۰، ساعت ۱۴:۲۱ (UTC)
- ظاهراً الگو مقادیر خالی را با مقادیر امروز جایگزین میکند (مثلاً {{#time:F|feb|fa}} را {{#time:F|2/30/2020|fa}} میبیند) و چون ماه فوریه ۲۹ روز داشته، روز ۳۰اُم فوریه را ۱ مارس نمایش میدهد. با دستکاری الگو:Medical cases chart/Month toggle button برطرف شد. هومن (بحث) ۳۰ مارس ۲۰۲۰، ساعت ۱۴:۳۱ (UTC)
درصد افزایش یا موارد جدید
ویرایشدرود. در حال حاضر در ستونهای دوم و چهارم درصد افزایش نمایش داده میشود، ولی فکر میکنم نمایش تعداد موارد جدید در این نمودار بیشتر کمککننده باشد:
- از روی نمودار میتوان درصد (نسبت تغییر) را تخمین زد، ولی حدس زدن تعداد از روی نمودار سختتر است؛ ضمناً درصدها در الگو:دادههای دنیاگیری ۲۰۱۹–۲۰۲۰ کروناویروس/موارد پزشکی ایران هم قابل مشاهده هستند. (در ویژه:تفاوت/28866981، درصد افزایش مرگ و میر را هم به جدول اضافه کردم.)
- این شیوهی محاسبهی درصد، اطلاعات خوبی در مورد مرحلهی شیوع بیماری نمیدهد. در واقع، با توجه به بزرگ شدن مخرج کسر به هر حال این درصد کوچکتر و کوچکتر میشود، ولی این کوچک شدن لزوماُ منطبق با مرحلهی شیوع بیماری نیست. برای مثال، در تصویر اول (R0=2 یعنی هر بیمار دو نفر را مبتلا کند) که قلهی بیماری در روز ۱۳۲ قرار دارد، این شیوهی محاسبهی درصد (_wiki) عدد 32.72% را برای آن روز نمایش میدهد؛ در صورتی که در تصویر دوم (R0=4 یعنی هر بیمار چهار نفر را مبتلا کند) که قلهی بیماری در روز ۵۳ قرار دارد، این شیوهی محاسبهی درصد عدد 59.51% را برای آن روز نمایش میدهد.
- (در تصاویر بالا، _wiki نسبت
تعداد موارد جدید به کل مواردمجموع موارد تا هر روز به مجموع موارد تا روز گذشته است که همواره کوچک میشود، و _percent نسبت موارد جدید هر روز به موارد جدید روز گذشته است که بسته به وضعیت شیوع بیماری میتواند کوچکتر یا بزرگتر و مثبت یا منفی شود.) (البته شخصاً تعداد را به درصد، چه _wiki و چه _percent، برای این نمودار خاص ترجیح میدهم.)
هومن (بحث) ۲۶ آوریل ۲۰۲۰، ساعت ۰۵:۰۱ (UTC)
@Hooman91: تعداد موارد جدید به کل موارد دقیقاً یعنی چه؟ یعنی مثلاً در روز ۱۰، تعداد موارد جدید روز ۱۰ را تقسیم بر مجموع موارد جدید روزهای ۱ تا ۹ میکنید؟ اگر بله، این به نظر من شاخص مفیدی نیست. باقی توضیحات را در چند بخش ارائه میکنم.
- تعریف درست R0
این را احتمالاً میدانید، اما محض احتیاط توضیح میدهم. تعریف R0 این نیست که «هر بیمار چند نفر را مبتلا میکند». تعریفش این است که «اگر تمام جامعهٔ هدف هنوز در معرض (susceptible) باشد، آن وقت هر بیمار فرد مبتلا چند نفر را مبتلا میکند». این 0 اشاره به صفرِ نمودار زمان (محور افقی) دارد. برای مبتلا کردن دیگران هم لازم نیست که بیمار باشید (میتوانید ناقل سالم باشید). هر چه بیماری پیشتر میرود، تعداد افرادی که یک فرد مبتلا میتواند مبتلا کند هم تغییر میکند و در روزهای آخر همهگیری، این عدد به صفر نزدیک میشود چون دیگر فرد بیمار به فرد دیگری که در معرض خطر باشد دسترسی نخواهد داشت (باقی افراد یا مردهاند یا ایمنی دارند).
- شاخصهای مطلق
فکر کنم برای شما بدیهی است که چرا شاخصهای مطلق، مفید هستند. تعداد موارد جدید، تعداد بستریهای جدید، تعداد مرگهای جدید و ...، شاخصهای مطلق هستند. تعداد کل موارد شناسایی شده، تعداد کل مرگها و ... هم شاخصهای تجمعی ولی مطلق هستند. اینها را معمولاً روزانه گزارش میکنند. ویروس کلاً از این که جامعهٔ هدف شما چقدر کوچک یا بزرگ است درکی ندارد. اگر هر فرد مبتلا بتواند دو نفر را مبتلا کند و در ابتدا فقط یک نفر در جامعه مبتلا باشد، تعداد افراد جدید در روز بعد میشود، روز بعدش ۴، روز بعدش ۸ و الی آخر، و این ارقام برای یک شهر نیم میلیون نفری و یک کشور یک میلیارد نفری، یکسان است. (این که ما میتوانیم موارد را درست تشخیص بدهیم و بشماریم، بحثی جداست.)
- شاخصهای نسبی
درک تغییرات نمایی، برای انسانها ساده نیست. من شاید با نگاه کردن به اعداد ۱ و ۲ و ۴ و ۸ و ... راحت بتوانم بفهمم که این ارقام هر روز دو برابر میشود، اما با نگاه کردن به اعدادی که به وضوح توانی از ۲ یا ۳ نباشند، چنین تشخیصی را نخواهم داشت. همچنین، اعداد اصولاً به این تر و تمیزی بالا نمیروند و روندشان معمولاً دارای قدری خطا (نویز) هم هست. مثال سادهاش میشود کسی که امروز صبح بیماری را میگیرد و عصر در تصادف میمیرد. این فرد شانس انتقال بیماری به دو نفر دیگر را نداشتهاست. مثال پیچیدهترش میشود این که اگر من مبتلا باشم و شما یکی از دو نفری باشید که بیماری را به او میدهم، شما که بلافاصله بیمار نمیشود؛ دورهٔ نهفتهٔ بیماری برای شما ممکن است بین x تا y روز طول بکشد و این، روند رشد بیماران را از یک رابطهٔ خطی (مثلاً نمایی) خارج میکند.
برای همین شاخصهای نسبی را به کار میبریم، به خصوص شاخصهای نسبی تجمعی. مثالش میشود: تعداد کل بیماران تا امروز، نسبت به تعداد کل بیماران تا دیروز. در دورهای که بیماری دارد نمایی بالا میرود (مثلاً هر روز دو برابر میشود)، این شاخصِ نسبی یک عدد ساده و قابل فهم به دست میدهد: رشد ۱۰۰٪ در هر روز. وقتی بیماری به مرحلهای رسید که رشدش دیگری نمایی نیست و مثل یک خط راست بالا میرود، شاخصِ مطلق بیماران جدید هر روز مثل دیروز میشود و شاخصِ نسبیای که معرفی کردم هر روز کوچکتر میشود.
شاخص «تعداد بیماران جدیدِ امروز تقسیم بر تعداد بیماران جدیدِ دیروز» از این جهت شاخص نسبی خوبی نیست که چون هم صورت و هم مخرجش اعداد مربوط به فقط یک روز است، تأثیر نویز در آن بسیار زیاد است. شاخصهای نسبی تجمعی این مزیت را دارند که با تجمیع دادههای چندین روز، اثر این نویز را کم میکنند. لزومی هم ندارد که شاخص تجمعی همیشه «از ابتدا تا امروز» تعریف بشود. شما میتوانید شاخص را به صورت «تعداد بیماران جدید ۱۰ روز اخیر تقسیم بر تعداد بیماران جدید ۹ روز اول این دورهٔ ۱۰ روزه» تعریف کنید تا مثلاً اگر در ابتدای دورهٔ بیماری دادههایتان به هر دلیلی نویز بیشتری داشتند، این نویز را مدام در دادههای تجمعی با خودتان جلو نکشیده باشید.
- تحلیل شاخصهای نسبی
شاخصهای نسبی، باید در زمینهای که تعریف شدهاند تحلیل بشوند و به صورت یک عدد تکی، تحلیلپذیر نیستند. این که من به شما بگویم «تعداد کل بیماران دارد هر روز ۴۰٪ بالا میرود» خوب است؟ بد است؟ این عدد را نمیشود به تنهایی ارزیابی کرد. در درجهٔ اول باید این را در همان جامعهٔ هدف، در طول روزهای متمادی نگاه کرد و مقایسه کرد. اگر این عدد از دیروز به امروز در حال کوچک شدن است، این میتواند خوب باشد. در درجهٔ دوم هم میشود این را بین اجتماعهای مختلف مقایسه کرد منتها به شرطها و شروطها که دیگر واردش نشویم!
- خلاصه
اگر بنا باشد که محتاط باشیم، بهتر است که هیچ شاخص نسبیای در جدول نیاید. تصمیم این که چه شاخص نسبیای مفید است، به «کاربردی» که برای شاخص نسبی در نظر داریم وابسته است و ما نمیتوانیم تمام کاربردها را پوشش بدهیم یا بینشان انتخاب کنیم. دادههای مطلق، غیر قابل انکار هستند و حتماً باید در جدول بیایند. اما دادههای نسبی لزوماً چنین نیستند.
اما اگر قصد دارید که یک شاخص نسبی هم در جدول یا نمودار بگنجانید، توصیهٔ من یک شاخص تجمعی خواهد بود، نظیر همان که مثال زدم: درصد رشد بیماران (به معنی تعداد کل بیماران شناخته شده تا امروز تقسیم بر تعداد کل بیماران شناخته شده تا دیروز). الآن هم در جدول این الگو، دو تا از همین نوع شاخص را داریم (یکی درصد رشد کل موارد مثبت کشف شدهاست و دیگری درصد رشد کل مرگومیر). — حجت/بحث ۲۶ آوریل ۲۰۲۰، ساعت ۱۳:۱۳ (UTC)
- از پاسخ «مبسوط» شما بسیار بسیار سپاسگزام! :)
- شاخص نسبی فعلی این نمودار که مشابه آن در تصاویر بالا ذیل _wiki محاسبه شده، نسبت مجموع مبتلایان تا آن روز به مجموع مبتلایان تا روز قبل است. (به جای «مجموع موارد»، به اشتباه «موارد جدید» نوشته بودم.) همچنین، بابت تدقیق تعریف R0 متشکرم.
- این مدل در اپیدمیولوژی، یکی از سادهترین (و در نتیجه محدودترین) مدلهای ریاضی برای بررسی بیماریهای عفونی است. این مدل همراه با پیشفرضهای ثابت ماندن جمعیت، ایمنی کامل نسبت به بیماری پس از بهبودی، نرخ عفونت ثابت در روز، طول ثابت بیماری، و در ارتباط کامل بودن همهی جمعیت باهم است. متغیرها در این مدل شامل β برابر با تعداد افرادی که هر فرد مبتلا در هر روز با آنها در تماس است و γ برابر با یک تقسیم بر تعداد روزهای بیماری هستند، و کسر β/γ (تعداد افرادی که هر فرد مبتلا در طول بیماری با آنها در تماس است) برابر R0 در نظر گرفته میشود. تصاویر بالا بر اساس این مدل ترسیم شدهاند.
- شاخصهای نسبی
- دقیقاً همانطور که گفتید، «درک تغییرات نمایی برای انسانها ساده نیست» به خصوص وقتی دادهها همراه با نویز و/یا اعداد خیلی بزرگ باشند، و برای همین از شاخصهای نسبی استفاده میکنیم. (البته نموارها هم گزینهی دیگری برای کمک به درک این نوع تغییرات هستند.) از طرفی، همانطور که اشاره کردید، این شاخصهای نسبی به تنهایی قابل ارزیابی نیستند (مثلاً در تصاویر بالا، ۵۹٪ در تصویر اول نشاندهنده مرحلهی رشد نمایی و در تصویر دوم نشاندهنده مرحلهی ثابت-شدن رشد است) و هر کدام از شاخصهای نسبی هم مزایا و معایب مخصوص خود را دارند (مثلاً نسبت تعداد موارد جدید هر روز به تعداد موارد جدید روز قبل نسبت به نویز آسیبپذیرتر بوده، ولی تفسیر آن به دلیل علامتدار بودن سادهتر از تفسیر نسبت تعداد کل موارد هر روز به تعداد کل موارد روز قبل است).
- به هر حال، به همین دلایل که در خصوص شاخصهای نسبی و تحلیل آنها توضیح دادید، و با در نظر گرفتن اینکه مهمترین مزیت شاخصهای نسبی —کمک به درک تغییرات نمایی— با نگاه کردن به نمودار برآورده میشود، بنده هم فکر میکنم بهتر است هیچ شاخص نسبیای در این نمودار نیاید.