Mật độ dân số, số ca nhiễm, và tử vong

Đọc dữ liệu về số ca nhiễm và tử vong giữa các tỉnh thành, tôi phát hiện một xu hướng thú vị: nơi nào có mật độ dân số càng cao thì số ca nhiễm cũng càng cao, và số ca nhiễm càng cao có liên quan mật thiết với số ca tử vong. Từ đó, chúng ta có thể ‘xếp hạng’ các tỉnh thành.

Biểu đồ 1 phản ảnh mối liên quan giữa mật độ dân số và số ca nhiễm (tính bằng đơn vị log) cho 62 tỉnh thành có ghi nhận số ca nhiễm. Như có thể thấy, tỉnh thành nào có mật độ dân số cao thì tính trung bình cũng ghi nhận nhiều số ca nhiễm. Đứng đầu là TPHCM như chúng ta biết. Nhưng các tỉnh thành khác như Hà Nội, Đà Nẵng, Tiền Giang và Bình Dương cũng nằm trong nhóm có mật độ dân số cao và có nhiều ca nhiễm. Ngược lại, các tỉnh miền Tây Bắc và Đông Bắc thì có số ca nhiễm rất thấp và mật độ dân số cũng thấp nhứt nước.

Mối liên quan giữa mật độ dân số và số ca nhiễm (tính bằng đơn vị log) cho 62 tỉnh thành có ghi nhận số ca nhiễm.

Biểu đồ 2 phản ảnh mối liên quan giữa mật độ dân số và tỉ lệ tử vong (tính trên số ca nhiễm hay còn gọi là CFR). Tuy có mối liên quan dương tính (tỉnh thành với mật độ dân số cao thì nguy cơ tử vong cũng cao), nhưng mối liên quan nói chung là không chặt chẽ như giữa mật độ dân số và số ca nhiễm, vì mức độ phân tán khá cao.

Mối liên quan giữa mật độ dân số và tỉ lệ tử vong (tính trên số ca nhiễm hay còn gọi là CFR) của 62 tỉnh thành.

Biểu đồ 3 cho thấy mối liên quan giữa số ca nhiễm và số ca tử vong cho 42 tỉnh thành nào có hơn 100 ca nhiễm và có ghi nhận số ca tử vong. Chúng ta thấy mối liên quan rất cao, với hệ số tương quan 0.9 (tối đa là 1). Biểu đồ này cho thấy qui luật dân gian: càng nhiễm nhiều thì số ca tử vong càng nhiều.

Mối liên quan giữa số ca nhiễm và số ca tử vong cho 42 tỉnh thành nào có hơn 100 ca nhiễm và có ghi nhận số ca tử vong.

Chúng ta có thể dùng qui luật đó để so sánh tỉ lệ tử vong giữa các tỉnh thành. Bởi vì số ca tử vong là tương đối thấp so với số ca nhiễm, nên chúng ta có thể giả định rằng số ca tử vong tuân theo luật phân bố Poisson. Gọi số ca tử vong là Y, giả định đó có nghĩa là Y ~ Poisson(mu), trong đó ‘mu’ là tỉ lệ nhiễm. Mô hình hồi qui Poisson với tỉnh/thành là predictor có thể viết như sau: log(mu) = a + beta*tỉnh. so sánh tỉ lệ tử vong của tỉnh với giá trị kì vọng, và do đó cho chúng ta biết tỉnh thành nào có tỉ lệ tử vong cao hay thấp ra sao. Kết quả tính toán này được trình bày trong Hình 4.  

Trong Hình 4, những tỉnh nào có hệ số ‘estimate’ dương có nghĩa là tỉ lệ tử vong cao hơn giá trị kì vọng; ngược lại, tỉnh thành nào có giá trị âm có nghĩa là tỉ lệ tử vong thấp hơn kì vọng. Nhưng vì do dao động mẫu, nên phải xem xét đến trị số P. Trị số P < 0.01 có thể xem là có ý nghĩa thống kê (significant), còn trị số P > 0.01 thì xem như không có khác biệt giữa tỉ lệ tử vong của tỉnh thành đó và giá trị kì vọng.

Hình 4: So sánh hệ số tử vong giữa các tỉnh thành. Ví dụ cách diễn giải: Tỉnh Bà Rịa – Vũng Tàu có hệ số 0.65, có nghĩa là tỉ lệ tử vong ở tỉnh này cao hơn exp(0.65) = 1.9 lần so vì kì vọng dựa vào số ca nhiễm, và sự khác biệt này đáng chú ý vì trị số P = 0.009. Ngược lại, Bạc Liêu có hệ số -0.14, có nghĩa là tỉ lệ tử vong ở đây thấp hơn kì vọng chừng 14% (1 – exp(-0.14)), nhưng vì trị số P = 0.85, nên sự khác biệt này không đáng chú ý, có thể do yếu tố ngẫu nhiên. 

Như có thể thấy, chỉ có Bắc Giang có tỉ lệ tử vong thấp hơn kì vọng. Còn lại, các tỉnh thành có tỉ lệ tử vong cao là: HCM, Bến Tre, Vĩnh Long, Tiền Giang, Sóc Trăng, Bình Thuận, Đà Nẵng, Đồng Tháp, Cần Thơ, Tây Ninh. Các tỉnh khác cũng có tỉ lệ tử vong cao đáng chú ý là Bà Rịa – Vũng Tàu, Bình Dương, Long An, Khánh Hoà, Phú Yên, Trà Vinh, Hà Nội.

Tóm lại, các dữ liệu này cho thấy (a) số ca tử vong có liên quan mật thiết với số ca nhiễm; và (b) số ca nhiễm có liên quan với mật độ dân số. Điều này cho thấy chiến lược chống dịch cần phải xem xét đến mật độ dân số.

PS: Dĩ nhiên, đây chỉ là một thể thao trí não thôi, vì tất cả những con số về số ca nhiễm và tử vong có xác suất rất cao là đều sai. Nhưng cái note này cũng chỉ ra rằng với số liệu hạn chế như vậy, chúng ta vẫn có thể trả lời vài câu hỏi quan trọng bằng phương pháp mô hình thống kê.

Nguồn số liệu về ca nhiễm và tử vong: https://covid19.gov.vn. Số liệu về dân số và mật độ dân số lấy từ Tổng cục Thống kê.

2 thoughts on “Mật độ dân số, số ca nhiễm, và tử vong”

  1. Phân tích của Thầy có thể lý giải một trường hợp cụ thể là tỉnh Bình Dương về mặt thống kê. Hiện nay các huyện phía bắc của tỉnh với mật độ dân số thấp thì nay đã được công nhận là “vùng xanh”; những nơi có mật độ dân số cao như Dĩ An, Thuận An, Tân Uyên thì vẫn là “vùng đỏ”. Phương pháp test nhanh “ngoáy mũi” vẫn đang được tiến hành một cách kiên quyết và miệt mài để tách F0 ra khỏi “pháo đài”. Mặc dù từ “ai ở đâu ở yên đó” tới “đông cứng khóa chặt” trong hơn 3 tháng nay thì ở các tổ xóm trong các “pháo đài” càng về sau càng phát hiện thêm nhiều các “chùm lây nhiễm”. Đài báo vừa đưa tin tỉnh Bình Dương đưa di dân về quê an toàn – họ có lẽ không còn đủ sức để cùng Bình Dương chung tay chống dịch và chờ tới ngày mở cửa & trạng thái bình thường mới.

    Like

Leave a Reply to Truong Cancel reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s