Data Covid-19: Masalah Analisis Data Kumulatif


Sebagian besar Website kredibel yang menyediakan informasi mengenai Covid-19 pada umumnya menyajikan grafik data kumulatif (harian) sebagai sajian utama. Grafik 1 dan 2 mengilustrasikan grafik yang dimaksud. Yang menjadi keprihatinan tulisan ini adalah bahwa grafik semacam itu bagi sebagian sangat menggoda untuk mengajukan pertanyaan kapan kasusnya mencapai puncak dan turun.

Pertanyaan semacam itu sebenarnya tidak pada tempatnya (misplaced) sejauh data yang digunakan adalah data kumulatif. Tulisan ini menjelaskan secara singkat kenapa demikian[1]. Tulisan ini didedikasikan khususnya bagi teman-teman sejawat yang bersemangat mengutak-katik data Covid-19. Kunci permasalahan terletak pada pemahaman yang jernih mengenai sifat data kumulatif.

Data Kumulatif

Data kumulatif kasus Covid-19 menunjukkan jumlah atau seluruh kasus Covid-19 pada suatu waktu (katakanlah t) terhitung mulai hari pertama merebaknya kasus itu (t=0). Jika c(t) adalah data kumulatif yang dimaksud maka

c(t) = c(t-1) + d(t)…. (1)

di mana

c(t-1) : kasus kumulatif sebelumnya, dan

d(t): kasus baru hari ke-t. (t >=0: selalu positif dan monoton.)

Grafik 1: Perkiraan Kasus Covid-19 dan yang Tersembuhkan

 

Grafik 2: Perkembangan Kasus Covid-19 di Beberapa Negara

 

Beberapa implikasi dari dari Rumus (1) adalah sebagai berikut:

  • Kasus baru selalu positif atau nol: d (t)>=0.
  • c(t)>=c(t-1) dalam semua kondisi
  • c(t)=ct(t-1) jika dan hanya jika d(t)=0; artinya, dalam kondisi tidak ada lagi kasus baru atau pandemik sudah benar-benar berakhir

Beberapa implikasi lebih lanjut:

  • Berdasarkan (1), kasus kumulatif tidak pernah turun.
  • Berdasarkan (3), data kumulatif tidak memiliki titik puncak; yang ada adalah garis lurus yang menunjukkan himpunan titik maksimum dalam jumlah yang tak terhingga karena sifat monoton dari waktu (t).
  • Juga berdasarkan (3), jika d(t)=0 maka
    • c(t)-c(t-1) = 0 dan
    • c(t)/c(t-1)=1

Sebagai catatan, implikasi ke-6 menunjukkan secara intuitif bahwa r– yang menurut definisi fungsi dari hubungan c(t) dan c(t-1)– selalu non-negatif, r>=0.

Kesimpulannya jelas: keliru jika berharap kurva data kumulatif sebagaimana diilustrasikan oleh Grafik 1 dan Grafik 2 akan mencapai titik puncak dan turun.

Model Statistik

Pertanyaannya, apakah dengan menggunakan  model statistik kita dapat berharap dapat menurunkan kurva data kumulatif? Jawabannya, tidak. Berikut adalah penjelasan singkatnya.

Dengan mencermati Grafik 2 kita mungkin menduga pola pergerakan data mengikuti fungsi eksponensial atau keluarganya. Dugaan ini kemungkinan besar benar. Yang salah adalah berharap kurva akan turun. Jawabannya sekali lagu tidak. Berikut alasan singkatnya

Model umum fungsi ini dapat dinyatakan dalam rumus

c(t)= c(t-1)exp(rt) … (2)

di mana r adalah angka pertumbuhan.

Berdasarkan rumus rumus c(t) akan dan hanya akan turun jika exp(rt) <0. Tetapi menurut definisi ini mustahil karena menurut definisi exp(n)>=0 untuk setiap nilai n (positif atau negatif). Sebagai ilustrasi, exp(-100 = 1/exp(100).

Pertanyaan berikutnya, apak model yang lebih canggih seperti fungsi polynomial bisa negatif dapat membuatnya turun? Sekali lagi, sekali lagi, jawabannya tidak. Dalilnya seperti yang terungkap dalam wejangan mbah wiki, Every cumulative distribution function is non-decreasing and right-continuous….”

…..keliru  berharap kurva data kumulatif akan mencapai titik puncak dan turun.

Kesimpulan Logis

Kesimpulan logis dari tulisan ini dapat dinyatakan dalam tiga macam kekeliruan:

  • Kekeliruan 1: Menggunakan data kumulatif untuk memahami pola pergerakan data Covid-19 apalagi untuk membuat memprediksi ke depan.
  • Kekeliruan 2: Mengajukan pertanyaan kapan kasus Covid-19 mencapai puncak dan turun sejauh menggunakan data kumulatif.
  • Kekeliruan 3: Berharap model statistik dapat menjawab pertanyaan keliru itu.

Wallahualam….@

[1] Penulis berterima kasih kepada Bapak Farid M. Noor dan Bapak Sodikin atas ketulusan mereka melayani penulis berkonsultasi ketika menyiapkan tulisan ini. Keduanya adalah pakar statistik dan dosen di perguruan tinggi terkemuka di ngeri ini.

One thought on “Data Covid-19: Masalah Analisis Data Kumulatif

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.