Mật độ dân số, số ca nhiễm, và tử vong

Đọc dữ liệu về số ca nhiễm và tử vong giữa các tỉnh thành, tôi phát hiện một xu hướng thú vị: nơi nào có mật độ dân số càng cao thì số ca nhiễm cũng càng cao, và số ca nhiễm càng cao có liên quan mật thiết với số ca tử vong. Từ đó, chúng ta có thể ‘xếp hạng’ các tỉnh thành.

Biểu đồ 1 phản ảnh mối liên quan giữa mật độ dân số và số ca nhiễm (tính bằng đơn vị log) cho 62 tỉnh thành có ghi nhận số ca nhiễm. Như có thể thấy, tỉnh thành nào có mật độ dân số cao thì tính trung bình cũng ghi nhận nhiều số ca nhiễm. Đứng đầu là TPHCM như chúng ta biết. Nhưng các tỉnh thành khác như Hà Nội, Đà Nẵng, Tiền Giang và Bình Dương cũng nằm trong nhóm có mật độ dân số cao và có nhiều ca nhiễm. Ngược lại, các tỉnh miền Tây Bắc và Đông Bắc thì có số ca nhiễm rất thấp và mật độ dân số cũng thấp nhứt nước.

Mối liên quan giữa mật độ dân số và số ca nhiễm (tính bằng đơn vị log) cho 62 tỉnh thành có ghi nhận số ca nhiễm.

Biểu đồ 2 phản ảnh mối liên quan giữa mật độ dân số và tỉ lệ tử vong (tính trên số ca nhiễm hay còn gọi là CFR). Tuy có mối liên quan dương tính (tỉnh thành với mật độ dân số cao thì nguy cơ tử vong cũng cao), nhưng mối liên quan nói chung là không chặt chẽ như giữa mật độ dân số và số ca nhiễm, vì mức độ phân tán khá cao.

Mối liên quan giữa mật độ dân số và tỉ lệ tử vong (tính trên số ca nhiễm hay còn gọi là CFR) của 62 tỉnh thành.

Biểu đồ 3 cho thấy mối liên quan giữa số ca nhiễm và số ca tử vong cho 42 tỉnh thành nào có hơn 100 ca nhiễm và có ghi nhận số ca tử vong. Chúng ta thấy mối liên quan rất cao, với hệ số tương quan 0.9 (tối đa là 1). Biểu đồ này cho thấy qui luật dân gian: càng nhiễm nhiều thì số ca tử vong càng nhiều.

Mối liên quan giữa số ca nhiễm và số ca tử vong cho 42 tỉnh thành nào có hơn 100 ca nhiễm và có ghi nhận số ca tử vong.

Chúng ta có thể dùng qui luật đó để so sánh tỉ lệ tử vong giữa các tỉnh thành. Bởi vì số ca tử vong là tương đối thấp so với số ca nhiễm, nên chúng ta có thể giả định rằng số ca tử vong tuân theo luật phân bố Poisson. Gọi số ca tử vong là Y, giả định đó có nghĩa là Y ~ Poisson(mu), trong đó ‘mu’ là tỉ lệ nhiễm. Mô hình hồi qui Poisson với tỉnh/thành là predictor có thể viết như sau: log(mu) = a + beta*tỉnh. so sánh tỉ lệ tử vong của tỉnh với giá trị kì vọng, và do đó cho chúng ta biết tỉnh thành nào có tỉ lệ tử vong cao hay thấp ra sao. Kết quả tính toán này được trình bày trong Hình 4.  

Trong Hình 4, những tỉnh nào có hệ số ‘estimate’ dương có nghĩa là tỉ lệ tử vong cao hơn giá trị kì vọng; ngược lại, tỉnh thành nào có giá trị âm có nghĩa là tỉ lệ tử vong thấp hơn kì vọng. Nhưng vì do dao động mẫu, nên phải xem xét đến trị số P. Trị số P < 0.01 có thể xem là có ý nghĩa thống kê (significant), còn trị số P > 0.01 thì xem như không có khác biệt giữa tỉ lệ tử vong của tỉnh thành đó và giá trị kì vọng.

Hình 4: So sánh hệ số tử vong giữa các tỉnh thành. Ví dụ cách diễn giải: Tỉnh Bà Rịa – Vũng Tàu có hệ số 0.65, có nghĩa là tỉ lệ tử vong ở tỉnh này cao hơn exp(0.65) = 1.9 lần so vì kì vọng dựa vào số ca nhiễm, và sự khác biệt này đáng chú ý vì trị số P = 0.009. Ngược lại, Bạc Liêu có hệ số -0.14, có nghĩa là tỉ lệ tử vong ở đây thấp hơn kì vọng chừng 14% (1 – exp(-0.14)), nhưng vì trị số P = 0.85, nên sự khác biệt này không đáng chú ý, có thể do yếu tố ngẫu nhiên. 

Như có thể thấy, chỉ có Bắc Giang có tỉ lệ tử vong thấp hơn kì vọng. Còn lại, các tỉnh thành có tỉ lệ tử vong cao là: HCM, Bến Tre, Vĩnh Long, Tiền Giang, Sóc Trăng, Bình Thuận, Đà Nẵng, Đồng Tháp, Cần Thơ, Tây Ninh. Các tỉnh khác cũng có tỉ lệ tử vong cao đáng chú ý là Bà Rịa – Vũng Tàu, Bình Dương, Long An, Khánh Hoà, Phú Yên, Trà Vinh, Hà Nội.

Tóm lại, các dữ liệu này cho thấy (a) số ca tử vong có liên quan mật thiết với số ca nhiễm; và (b) số ca nhiễm có liên quan với mật độ dân số. Điều này cho thấy chiến lược chống dịch cần phải xem xét đến mật độ dân số.

PS: Dĩ nhiên, đây chỉ là một thể thao trí não thôi, vì tất cả những con số về số ca nhiễm và tử vong có xác suất rất cao là đều sai. Nhưng cái note này cũng chỉ ra rằng với số liệu hạn chế như vậy, chúng ta vẫn có thể trả lời vài câu hỏi quan trọng bằng phương pháp mô hình thống kê.

Nguồn số liệu về ca nhiễm và tử vong: https://covid19.gov.vn. Số liệu về dân số và mật độ dân số lấy từ Tổng cục Thống kê.

Hiệu lực của vaccine Tàu và tử vong

Cái note này trình bày dữ liệu về tử vong liên quan đến covid ở hai nước dùng vaccine Tây (Do Thái và Mĩ) và 7 nước chủ yếu dùng vaccine Tàu (Cambodia, Thái Lan, Mã Lai, Nam Dương, Chile, Seychelles và UAE). Các bạn sẽ thấy hình như vaccine Tây có hiệu lực tốt hơn vaccine Tàu.

Để đánh giá hiệu lực của vaccine trong cộng đồng (effectiveness), con số tử vong rất quan trọng. Con số ca nhiễm chỉ quan trọng trong thử nghiệm lâm sàng, vì nó dùng để đánh giá hiệu quả của vaccine (efficacy). Ngoài cộng đồng, chúng ta chỉ quan tâm đến những ca nặng và tử vong. Do đó, con số tử vong phản ảnh khá đúng với mức độ nghiêm trọng của dịch.

Vaccine Tàu đã được nhiều nước trên thế giới sử dụng trong việc phòng chống dịch. Trong thử nghiệm lâm sàng, hiệu quả của vaccine Tàu dao động từ 51% đến 70% (tuỳ vào cách phân tích).  Câu hỏi đặt ra là trong cộng đồng thì vaccine Tàu hiệu lực ra sao?

Để trả lời câu hỏi này, chúng ta có thể so sánh tỉ lệ tử vong trước và sau khi đợt dịch mới xảy ra. Đợt dịch mới xảy ra vào khoảng tháng 5 hay 6 (tùy nơi). Do đó, số liệu về tử vong trước và sau dịch ở những nước sử dụng vaccine Tây và vaccine Tàu có thể cho chúng ta một vài thông tin về hiệu lực của vaccine.

Nếu vaccine có hiệu lực, chúng ta kì vọng rằng tỉ lệ tử vong phải suy giảm theo thời gian. Và, đó chính là những gì có thể thấy qua hai nước Mĩ và Do Thái. Ở Mĩ, tỉ lệ tử vong tháng 8/2021 là 0.78%, giảm 70% so với tỉ lệ tử vong vào tháng 6/2021 (2.5%). Ở Do Thái, tỉ lệ tử vong vào tháng 8 là 0.29%, giảm hơn 90% so với tháng 4 và 5. Hai nước này chỉ dùng vaccine Tây, chủ yếu là Pfizer và Moderna.

Tỉ lệ tử vong ở một số nước dùng vaccine phương Tây (màu xanh) và vaccine Tàu (màu đỏ). Số liệu lấy từ worldometer

Còn các nước dùng vaccine Tàu thì sao? Biểu đồ dưới đây trình bày tỉ lệ tử vong cho các nước Cambodia, Thái Lan, Mã Lai, Nam Dương, Chile, Seychelles và UAE (màu đỏ). Như các bạn thấy, tỉ lệ tử vong ở các nước này tăng trong 3 tháng qua. Chẳng hạn như Nam Dương, tỉ lệ tử vong tháng 8/2021 là 5.75%, tăng gần 2 lần so với tỉ lệ tháng 4/2021 (2.96%).

Ở Cambodia, tỉ lệ tử vong liên tục tăng từ 0.7% vào tháng 5/2021 đến 3.18% trong tháng 8/2021. Tình hình ở Thái Lan và Mã Lai cũng vậy: tỉ lệ tử vong covid tăng trong những tháng qua. Theo báo Khmer Times thì chánh phủ Cambodia đã ra lệnh ngưng lễ hội Kan Ben vì số ca nhiễm và tử vong tăng nhanh trong 3 tháng qua.

Ngay cả ở những nước xa chúng ta như Chile, Seychelles và UAE cũng ghi nhận sự gia tăng về tử vong. Đáng chú ý là Chile, với tiêm chủng bao phủ 77% dân số, tỉ lệ tử vong vào tháng 8/2021 lên đến 6.4%, cao gấp 4 lần so với tỉ lệ tháng 5/2021.

Seychelles là một hòn đảo có tỉ lệ tiêm chủng vaccine (chủ yếu là Sinopharm) rất cao (78%). Nhưng tỉ lệ tử vong trong tháng 6-8 là 0.6% đến 1%, so với 0.3% vào tháng 4.

Tỉ lệ tiêm chủng vaccine trên trên toàn dân số ở Mĩ, Do Thái, Cambodia, Thái Lan, Mã Lai, Nam Dương, Chile, Seychelles và UAE

Tóm lại, những dữ liệu thực tế mới nhứt cho thấy những nước dùng vaccine Tàu đang trải qua một đợt dịch mới và tỉ lệ tử vong tăng khá cao dù tỉ lệ tiêm chủng vaccine đã đạt trên 70% (Mã Lai, Chile, Seychelles, UAE). Ngược lại, hai nước dùng vaccine phương Tây (Do Thái và Mĩ) có tỉ lệ tử vong trong đợt dịch mới suy giảm rất đáng kể so với những tháng trước đó.

Những con số này phản ảnh một phần về hiệu lực của vaccine Tàu và Tây. Tôi nói ‘một phần’ là vì còn các yếu tố khác nữa, chớ không phải chỉ vaccine, có thể giúp các nước như Mĩ và Do Thái giảm tỉ lệ tử vong hay các nước kia tăng nguy cơ tử vong. Đây là số liệu cấp quần thể, nên chúng ta không thể suy luận cho cá nhân. Nhưng ở cấp độ quần thể thì sự giảm về tử vong ở những nơi dùng vaccine Tây rất nhứt quán với kết quả nghiên cứu khoa học đã được công bố.

Tại sao tỉ lệ tử vong covid ở Bình Dương thấp hơn TPHCM?

Tỉ lệ tử vong liên quan đến covid ở Bình Dương hiện nay là 0.75% (858 / 114788), thấp hơn HCM 4.0% (8869 / 221268) [1]. Câu hỏi là tại sao có sự khác biệt lớn như thế? Tôi xin giải thích bằng khái niệm dịch tễ học có tên là ‘lead-time bias’ dưới đây.

Tỉ lệ tử vong liên quan đến covid ở Việt Nam hiện nay là 2.5%, thuộc hàng cao nhứt nhì trong vùng. Tuy nhiên, nếu phân tích chi tiết, tỉ lệ này khá khác biệt giữa các tỉnh thành (xem Hình 1). TPHCM có tỉ lệ cao nhứt (4%), cao hơn so với Bình Dương (0.75%), Đồng Tháp (2.04%) và Tiền Giang (2.43%). Cần Thơ tuy có số ca nhiễm thấp, nhưng tỉ lệ tử vong khá cao (1.52%).

Hình 1: Tỉ lệ tử vong (%) tính theo số ca tử vong chia cho số ca dương tính (biểu đồ trên) và số ca nhiễm (diểu đồ dưới) cho một số tỉnh thành có tỉ lệ tử vong khá cao. Số liệu tính đến ngày 1/9/2021.

Tại sao có sự khác biệt về tỉ lệ tử vong giữa các tỉnh thành?

Case fatality rate

Cách tính tỉ lệ tử vong hợp lí nhứt là lấy số ca tử vong chia cho số ca bị nhiễm nCov. Thuật ngữ dịch tễ học gọi chỉ số này là CFR (case fatality rate). Nhưng vấn đề ở đây là chúng ta không biết trong cộng đồng có bao nhiêu người thật sự bị nhiễm.  

Chúng ta chỉ biết (a) số ca dương tính, hoặc/và (b) số ca nhiễm được phát hiện qua tầm soát. Số ca dương tính tuỳ thuộc vào số người được làm xét nghiệm, hiểu theo nghĩa xét nghiệm nhiều thì số ca dương tính cũng tăng theo.

Số ca được phát hiện qua tầm soát thường chỉ phản ảnh một phần của con số nhiễm thật. Trong thực tế cứ mỗi ca chúng ta phát hiện được thì có 6-7 ca chưa phát hiện trong cộng đồng.

Điều này có nghĩa là nếu chúng ta lấy số ca tử vong chia cho số ca nhiễm (hay dương tính) phát hiện được thì lúc nào cũng cao hơn tỉ lệ thật. Cao hơn chừng 6-7 lần.

Lead-time bias

Tôi chưa biết dịch thuật ngữ này sang tiếng Việt là gì, nhưng tạm hiểu là ‘Thời gian vượt‘. Có thể thời gian này là thời gian từ lúc bị nhiễm đến lúc biến cố xảy ra. “Biến cố” có thể là chết (dấu hiệu “x”) hay sống. Thời gian này làm cho việc tính toán tỉ lệ tử vong đơn giản như mô tả trên là không đúng.

Hình 2: Minh hoạ cho khái niệm ‘leadtime bias’ để giải thích tỉ lệ tử vong tuỳ thuộc vào thời gian. Tại thời điểm 1 tháng, có 10 người, và trong số này có 1 người chết trước đó. Như vậy, tỉ lệ tử vong là 1/10. Tại thời điểm 6 tháng, có thêm 2 người bị nhiễm nhưng cả hai đều bình phục (màu tím). Tính tích luỹ, có 12 người, và trong số này có 5 ca tử vong. Do đó, tỉ lệ tử vong ở tháng thứ 6 là 5/12. Sự khác nhau giữa 2 tỉ lệ là do ‘lead time bias’.

Để minh hoạ cho vấn đề, tôi vẽ một giản đồ dưới đây, thể hiện diễn biến nhiễm của 12 người. Người có dấu “x” có nghĩa là chết. Giả dụ rằng chúng ta tính toán tỉ lệ tử vong ở 2 thời điểm: lúc 1 tháng và lúc 6 tháng.

Tại thời điểm 1 tháng, chúng ta quan sát 10 người, và trong số này có 1 người chết trước đó. Như vậy, tỉ lệ tử vong là 1/10.

Tại thời điểm 6 tháng, chúng ta có thêm 2 người bị nhiễm nhưng cả hai đều bình phục (màu tím). Tính tích luỹ đến tháng thứ 6, chúng ta có 12 người, và trong số này có 5 ca tử vong. Do đó, tỉ lệ tử vong ở tháng thứ 6 là 5/12.

Minh hoạ đơn giản trên cho thấy ‘thời gian vượt’ rất quan trọng trong việc so sánh tỉ lệ tử vong. Ở TPHCM, đợt dịch mới này xảy ra từ tháng 5 (tạm xem như thế), nên thời gian vượt đến nay là chừng 4 tháng. Còn Bình Dương thì dịch mới bắt đầu chưa đầy 1 tháng (?), do đó chưa đủ thời gian vượt để quan sát đầy đủ biến cố. Đó chính là lí do tại sao hiện nay, tỉ lệ tử vong ở Bình Dương thấp hơn HCM.

Nhưng chúng ta có thể đoán rằng trong 1-2 tháng tới, tỉ lệ tử vong ở Bình Dương có thể tăng lên (với điều kiện số ca tử vong được thu thập đầy đủ và đánh giá khách quan đúng như cách đánh giá ở HCM).

____

[1] https://ncov.moh.gov.vn