Tỉ lệ tử vong covid ở miền Đông & Tây Bắc “quá đẹp”

Đọc dữ liệu về tỉ lệ tử vong liên quan đến covid giữa các tỉnh tôi thấy một xu hướng thú vị: các tỉnh vùng Đông và Tây Bắc có tỉ lệ tử vong rất thấp (thường là 0). Xác suất ‘sự kiện’ này xảy ra là rất rất thấp.

Tính đến sáng hôm nay (8/11), số ca tử vong [covid] ở Việt Nam là 22,526 người. Tính theo case fatality rate (CFR) thì tỉ lệ tử vong là 2.23%. Tuy nhiên, tỉ lệ này rất khác biệt giữa các tỉnh. Nếu tính theo CFR, thì TPHCM có tỉ lệ tử vong cao nhứt (3.88%), theo sau là 10 tỉnh thành:

  • Tiền Giang (2.32%)
  • Đồng Tháp (2.09)
  • Đà Nẵng (1.89)
  • Bến Tre (1.88)
  • Quảng Ngãi (1.58)
  • Cần Thơ (1.58)
  • Vĩnh Long (1.45)
  • Long An (1.41)
  • Ninh Thuận (1.30)
  • Tây Ninh (1.26)

Các bạn thấy gì từ danh sách trên? Tất cả 10 tỉnh/thành có tỉ lệ tử vong cao hay tương đối cao đều là các tỉnh/thành miền Nam và Trung, đặc biệt là miền Tây. Không có một tỉnh thành nào từ miền Bắc trong danh sách ‘top 10’ trên.

Tỉ lệ tử vong (case fatality rate; %) ở các tỉnh thành (loại trừ TPHCM). Chú ý các tỉnh miền Đông và Tây Bắc không ghi nhận ca tử vong nào (biểu đồ trái), nhưng nếu phân tích theo phương pháp Bayes thì các tỉnh này ‘kì vọng’ có số ca tử vong. Số liệu gốc tính đến ngày 8/11/2021. nguồn: covid19.gov.vn

Thật ra, nếu chia 63 tỉ lệ tử vong (thuộc 63 tỉnh/thành) thành 3 vùng, rồi tính trung vị cho mỗi vùng thì kết quả như sau:

  • Các tỉnh miền Bắc: trung vị tỉ lệ tử vong là 0.00%
  • Các tỉnh miền Trung: 0.73%
  • Các tỉnh miền Nam: 0.98%

Điều đáng chú ý nhứt theo tôi là có đến 18 tỉnh không ghi nhận bất cứ một ca tử vong nào. Trong tổng số 18 tỉnh này, 17 tỉnh là thuộc miền Bắc (và chỉ có 1 tỉnh miền Cao Nguyên là Kontum). Thử điểm qua danh sách 17 tỉnh với zero tử vong này:

  • Bắc Kạn: 10 ca nhiễm
  • Điện Biên: 169
  • Hà Giang: 1608
  • Hà Nam: 1161
  • Hải Phòng: 104
  • Hoà Bình: 50
  • Lai Châu: 30
  • Lào Cai: 145
  • Nam Định: 472
  • Ninh Bình: 213
  • Phú Thọ: 1142
  • Quảng Ninh: 239
  • Sơn La: 304
  • Thái Bình: 177
  • Thái Nguyên: 61
  • Tuyên Quang: 145
  • Yên Bái: 20

Đa số (13/17) địa phương trong danh sách này là các tỉnh miền Tây Bắc và Đông Bắc. Có những tỉnh với số ca nhiễm hơn 1000 (như Hà Giang, Hà Nam, Phú Thọ) nhưng chẳng ghi nhận bất cứ 1 ca tử vong nào.

Tại sao các tỉnh này có tỉ lệ quá ‘đẹp’?

Mà, bất cứ kết quả nào quá đẹp thì cũng đều đáng chú ý. Người phương Tây có câu “Too good to be true”. Còn nhớ vài năm trước khi phân tích điểm thi tốt nghiệp trung học phổ thông, tôi cũng thấy một số các tỉnh miền Tây và Đông Bắc (đặc biệt là Hà Giang) có kết quả quá đẹp. Sau này chúng ta biết là các tỉnh đó có vấn đề về tổ chức và chấm thi, nên kết quả đẹp đó không phản ảnh tình hình thực tế.

Suy nghĩ thống kê

Nay, lại các tỉnh đó cũng có kết quả về tỉ lệ tử vong quá đẹp. Có cách nào để định lượng hoá cái đẹp của các tỉnh thành này? Tôi nghĩ có thể ứng dụng suy nghĩ thống kê để trả lời câu hỏi này. Suy nghĩ này bắt đầu bằng câu hỏi: nếu các tỉnh thành vùng Đông và Tây Bắc có tỉ lệ tử vong như toàn miền Bắc thì con số tử vong kì vọng là bao nhiêu?  

Tính trung bình, tỉ lệ tử vong covid ở các tỉnh miền Bắc là 0.0038 (hay 0.38%). Nếu chúng ta dùng con số này làm điểm tham chiếu, thì tỉnh Hà Giang với 1608 ca nhiễm, chúng ta kì vọng quan sát được chừng 6 ca tử vong (1608*0.0038). Nhưng trong thực tế, Hà Giang không ghi nhận ca tử vong nào.

Tương tự, Hà Nội với 5460 ca nhiễm, con số tử vong kì vọng là 21, nhưng trong thực tế Hà Nội ghi nhận 39 ca tử vong, tức cao gần gấp 2 lần trung bình.

Biểu đồ thể hiện mối liên quan giữa số tử vong ‘kì vọng’ (trục hoành) và số tử vong ghi nhận (trục tung) cho các tỉnh miền Bắc. Đường 45 độ là đường tham chiếu. Các tỉnh nào nằm trên đường tham chiếu có nghĩa là số ca tử vong trong thực tế cao hơn con số kì vọng. Các tỉnh nào nằm dưới đường tham chiếu là có số ca tử vong thấp hơn kì vọng. Chú ý đa số các tỉnh miền Đông và Tây Bắc đều nằm dưới đường tham chiếu.

Sự khác biệt giữa số tử vong ghi nhận và số tử vong ‘kì vọng’ cung cấp cho chúng ta một thước đo về sự ngạc nhiên. Trong thực tế, chúng ta có thể tính chỉ số Ki bình phương (Chi-squared test = (O – E)^2 / E; O là số tử vong quan sát, E là số tử vong kì vọng) và xác định trị số P. Chỉ vài dòng tính toán, chúng ta có:

Chỉ số Ki bình phương: 66.26

Trị số P = 0.000038

Xác suất mà tỉ lệ tử vong zero ở các tỉnh này (Đông và Tây Bắc) rất thấp có nghĩa là xu hướng này không phải ngẫu nhiên. Mà, nếu không ngẫu nhiên, thì phải là do hệ thống. ‘Hệ thống’ ở đây có thể là chiến lược kiểm soát dịch quá tốt hay một yếu tố khác liên quan đến cách báo cáo. Cũng có thể những người bị nhiễm có đặc điểm lâm sàng và sinh trắc khác với các tỉnh khác. Tìm hiểu chiến lược chống dịch và thông tin dịch tễ ở các tỉnh này có thể cung cấp cho các tỉnh miền Tây những bài học rất có ích.

2 thoughts on “Tỉ lệ tử vong covid ở miền Đông & Tây Bắc “quá đẹp””

  1. Có thể ở các tỉnh đó ít dân, mật độ dân số thấp, và người dân các vùng
    nông thôn cũng khỏe hơn 😁! Cách nhìn tích cực của em ạ. Em nghĩ là có cả
    hai, như thầy đã nhận xét. Mùa dịch được đọc những bài viết của thầy, được
    mở mang nhiều lắm ạ!

    Vào 7:06, Th 3, 9 thg 11, 2021 Tuan V. Nguyen
    đã viết:

    > nguyenvantuan.info posted: ” Đọc dữ liệu về tỉ lệ tử vong liên quan đến
    > covid giữa các tỉnh tôi thấy một xu hướng thú vị: các tỉnh vùng Đông và Tây
    > Bắc có tỉ lệ tử vong rất thấp (thường là 0). Xác suất ‘sự kiện’ này xảy ra
    > là rất rất thấp. Tính đến sáng hôm nay (8/11), số ca tử v”
    >

    Like

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s