Nhiều bạn cứ gởi msg riêng bảo tôi bình luận về kết quả thử nghiệm lâm sàng giai đoạn II về Nanocovax. Thú thiệt là tôi không có hứng làm việc đó. Thôi thì thay vì bình luận về kết quả, tôi sẽ ghi lại vài nhận xét của tôi về bài báo, trước là để tôi hiểu, sau là để góp vài ý cho nhóm nghiên cứu.
‘Vaccine made in Vietnam’ có tin tốt. Theo Vnexpress thì ‘Nanocovax đạt hiệu quả bảo về 90%’ [1]. Trước đây chừng 2 tháng thì vaccine này ‘đáp ứng kháng thể với protein S1 đạt 99,4%.’ [2] Nhưng tôi e rằng cách dùng chữ của giới báo chí không đúng. Hai chữ ‘hiệu quả’ ở đây có lẽ sai lệch. Chúng ta nên đọc dữ liệu do nhóm nghiên cứu công bố thì có cái nhìn hi vọng là đúng hơn.
Kết quả thử nghiệm lâm sàng giai đoạn II chưa công bố trên một tập san nào, nhưng đã được upload lên trạm preprint medRxiv. Thông thường, ngày nay nhiều nghiên cứu trước khi công bố trên một tập san thì tác giả upload lên một trạm preprint. Cũng có khi tập san yêu cầu tác giả phải upload lên một preprint. Cách làm này cũng giống như ‘trình làng’ hay ‘ra mắt’ nghiên cứu trước công chúng. Mục đích chánh là để công chúng hay giới khoa học bình luận và góp ý.
Tôi đã đọc bài báo ngay từ lúc upload, nhưng nay mới có dịp ngồi xuống viết vài dòng nhận xét. Những nhận xét dưới đây cũng có thể xem là những góp ý cho nhóm tác giả. Tôi không quen nhóm tác giả và cũng chẳng có liên quan gì đến công trình nghiên cứu, nên tôi nghĩ mình ‘độc lập’ ở đây. Tôi làm biên tập học thuật (academic editor) và chuyên gia bình duyệt (expert reviewer) cho nhiều tập san y khoa, nên những nhận xét này viết ra trong vai trò đó và trong thân tình người Việt với nhau (do đó, tôi không dùng tiếng Anh).
1. Tóm tắt
Bài báo báo cáo kết quả 2 thử nghiệm lâm sàng giai đoạn I và II. Thử nghiệm giai đoạn I gồm 60 người, và giai đoạn II gồm 560 người chia thành 4 nhóm như sau [3]:
- nhóm liều lượng thấp (25 mcg): 161 người;
- nhóm liều lượng trung (50 mcg): 160 người;
- nhóm liều lượng cao (75 mcg): 159 người;
- nhóm chứng: 80 người.
Mục tiêu của thử nghiệm giai đoạn I là xem có phản ứng phụ (adverse event). Trong số 60 người được theo dõi từ 17/12/2020 (chia thành 3 nhóm: 20 người nhận liều 25 mcg, 20 người nhóm 50 mcg, và 20 người 75 mcg). Không có phản ứng nào được xem là ‘serious’ (nghiêm trọng) cả.
Với thử nghiệm giai đoạn II, mục tiêu chánh là đánh giá độ an toàn của vaccine. Do đó, chỉ số chánh là “reactogenicity”, hay nói theo ngôn ngữ thuờng dân là các phản ứng viêm như đau ở chỗ tiêm, da màu đỏ, xưng, sốt, yếu cơ và nhức đầu. Nói chung, các biến chứng này chiếm khoảng 23-30% tổng số, và nhẹ. Các vaccine khác cũng có phản ứng như vậy.
Nhưng nghiên cứu có ghi nhận 12 ca hypthermia (giảm thân nhiệt), chiếm 2.1% tổng số, có thể xem là tương đối quan trọng như tác giả mô tả. Nhưng trong bài báo, không thấy tác giả bàn về vấn đề này.
Các nhà nghiên cứu còn đo lường các chỉ số như “anti-S IgG antibody“, có nghĩa là kháng thể đặc hiệu chống lại SARS-Cov-2. Các tác giả kết luận rằng “Up to 42 days, Nanocovax vaccine was safe, well tolerated and induced robust immune responses. We propose using Nanocovax 25 mcg for Phase 3 to evaluate the vaccine efficacy.” (Đến ngày 42, nanocovax an toàn và cho ra đáp ứng miễn dịch tốt. Chúng tôi đề nghị dùng Nanocovax 25 mcg cho thử nghiệm lâm sàng giai đoạn III). Tôi nghĩ kết quả trình bày nhứt quán với kết luận.
Kết luận này khiêm tốn hơn và không giống như trên báo chí tiếng Việt nói về hiệu quả bảo vệ 90%.
Tuy nhiên, phần hai của kết luận thì thật ra nhóm nghiên cứu không đề nghị nữa, mà họ đã và đang thực hiện thử nghiệm giai đoạn 3!
2. Tình nguyện viên
Theo bài báo, nghiên cứu tuyển những tình nguyện viên khoẻ mạnh và không mang thai (nữ giới), tuổi từ 18 trở lên với BMI trong khoảng 17 đến 35. Tôi nghĩ cách cung cấp thông tin như vậy cũng được, nhưng chưa đầy đủ. Lí do là các số liệu từ tình nguyện viên có ý nghĩa ‘external validity’ (hợp lí ngoại tại), cho nên tác giả nên mô tả kĩ hơn. Nếu (chỉ là ví dụ) tình nguyện viên là nhân viên y tế thì rất có thể họ đã có miễn dịch, và kết quả thử nghiệm từ họ có thể làm lệch kết quả nghiên cứu theo chiều hướng tích cực (ngôn ngữ dịch tễ học gọi là ‘bias’).
Do đó, bài báo nên cung cấp thông tin cho độc giả biết các tình nguyện viên này là ai (nhân viên y tế hay tuyển từ cộng đồng) và họ được tiếp cận như thế nào. Bao nhiêu người được tiếp cận, và bao nhiêu người đồng ý tham gia vào nghiên cứu. Những thông tin căn bản đó rất cần thiết chobất bài báo về thử nghiệm lâm sàng nào.
3. Vấn đề placebo và masking
Thế mạnh của nghiên cứu này là có nhóm chứng (placebo, giả dược). Nhưng câu hỏi đặt ra là cách sản xuất vaccine placebo ra sao. Hiện nay, bài báo chỉ có một câu ngắn, “Placebo was sterile 0.05% aluminum“, theo tôi là không đủ. Tôi nghĩ tác giả cần phải cung cấp thêm thông tin về cách / công thức sản xuất placebo. Ngoài ra, vì đây là nghiên cứu ‘double-blind’, tác giả phải giải thích ai là người được làm ‘mù’.
(Xin nói thêm để độc giả ngoài y khoa hiểu rằng khái niệm ‘blind’ – ‘mù’ là để bảo đảm tính khách quan của kết quả nghiên cứu. Theo đó, người phân tích dữ liệu và người đánh giá phản ứng phụ của một tình nguyện viên không biết tình nguyện viên thuộc nhóm chứng hay nhóm vaccine. Cách làm đó gọi là ‘mù đôi’. Nhưng ở đây bài báo chưa mô tả qui trình này).
4. Phương pháp ngẫu nhiên hoá
Đây là thử nghiệm lâm sàng giai đoạn II, nên phương pháp ngẫu nhiên hoá rất rất quan trọng. Nó quan trọng vì nếu làm đúng phương pháp thì các nhóm được phân bố một cách tương đồng nhau về các đặc điểm lâm sàng lúc ban đầu (ví dụ như tuổi, giới tính, tiền sử bệnh lí, v.v.)
Bài báo cho biết “Randomization lists, using block randomization stratified by study group and study site, were generated by the study statistician” (tức là ngẫu nhiên hoá theo cụm và nơi nghiên cứu). Tuy nhiên, thông tin này quá chung chung, vì không nói rõ mỗi cụm/block có bao nhiêu người, và block có phân chia nhỏ theo nơi nghiên cứu hay không.
Quan trọng hơn là phải cho biết phương pháp (algorithm) cụ thể là gì, chớ không phải chỉ đơn giản ‘block randomization’. Trong thực tế, có nhiều phương pháp ngẫu nhiên hoá, và mỗi phương pháp thích hợp cho mỗi tình huống. Do đó, các bài báo về thử nghiệm lâm sàng thường dành một phần khá chi tiết trong phụ chú để giải thích phương pháp này.
Thật ra đoạn mô tả về ngẫu nhiên hoá trên rất giống đoạn mô tả trong bài báo trên Lancet [4] của nhóm nghiên cứu AstraZeneca nhưng họ chỉ ra web cụ thể hơn (“Randomisation lists, using block randomisation stratified by age and dose group and study site, were generated by the study statistician (MV). […] Computer randomisation was done with full allocation concealment within the secure web platform used for the study electronic case report form (REDCap version 9.5.22).”)
Một khía cạnh khác cũng cần chú ý là nghiên cứu chia tầng theo độ tuổi (18- 45, 46 – 60, và trên 60), và tôi nghĩ đây là ý tưởng tốt. Thế nhưng phương pháp ngẫu nhiên hoá không nói gì đến cách chia theo độ tuổi!
5. Cỡ mẫu
Cỡ mẫu (số tình nguyện viên) lúc nào cũng là một yếu tố quan trọng trong thử nghiệm lâm sàng. Bài báo cho biết rằng cỡ mẫu được tính toán dựa vào “the estimated probability of observing an adverse event” (xác suất quan sát 1 phản ứng phụ), và theo đó họ có được con số 560 tình nguyện viên. Thú thiệt, tôi không hiểu câu “the estimated probability of observing an adverse event” là gì.
Thường thì cỡ mẫu được xác định bởi 3 giả định chánh: (a) khác biệt về xác suất phản ứng phụ cho mỗi nhóm; (b) độ nhạy hay power và xác suất dương tính giả mà nhà nghiên cứu chấp nhận; (c) phương pháp phân tích xác suất phản ứng phụ. Nhưng ở đây, chúng ta không biết gì về 3 giả định đó. Mà, ngay cả có được con số đó thì tác giả cũng nên nói rõ nó là bao nhiêu, và quan trọng hơn là phương pháp tính cỡ mẫu cụ thể là gì.
Thật ra, tôi không chắc là tác giả có làm tính toán, hay chỉ dựa vào một công trình trước đây bên Anh [4]. Trong công trình nghiên cứu về vaccine AstraZeneca, nhóm tác giả cũng chọn 560 tình nguyên viên, nhưng họ nói rõ rằng họ không tính cỡ mẫu hay độ nhạy nghiên cứu (power) mà chỉ ‘nominal’ (giống như ước lượng cho có) đối với outcome là chỉ số miễn dịch (immunogenicity).
Tuy nhiên, tôi nghĩ lí luận đằng sau cách tính trên (xác suất quan sát 1 phản ứng phụ) là sai lệch khỏi mục tiêu nghiên cứu. Lí do là vì nghiên cứu này lấy chỉ số kháng thể Anti-S IgG làm outcome chánh, và do đó đáng lí ra các tác giả phải tính cỡ mẫu dựa vào IgG, chớ không phải dựa vào tỉ lệ bị phản ứng phụ. Người khó tính thì nói đây là một sai lầm, người dễ tính như tôi thì đề nghị tác giả viết lại cho thuyết phục hơn. Tính toán cỡ mẫu đa nhóm với chỉ số IgG không hề đơn giản, mà có khi đòi hỏi phải làm mô phỏng. Phải có chuyên gia thống kê thành thạo mới làm được.
6. Hội đồng giám sát và theo dõi dữ liệu
Bất cứ thử nghiệm lâm sàng nào cũng cần có một hội đồng giám sát dữ liệu và an toàn, gọi theo tiếng Anh là “ Data Safety Monitoring Board” (DSMB). Hội đồng này bao gồm những người đa số không phải là thành viên của nhóm nghiên cứu, họ là chuyên gia dịch tễ học và thống kê học (đóng vai trò chủ yếu), lâm sàng, vaccine, v.v. Đã từng phục vụ trong vài DSMB ở Việt Nam, Âu châu và Á châu, nên tôi biết được DSMB quan trọng như thế nào. Đại khái, chức năng của DSMB là theo dõi phản ứng phụ, chất lượng dữ liệu, và giám sát phân tích dữ liệu có theo kế hoạch hay không.
Tuy nhiên, trong bài báo này thì không thấy tác giả đề cập đến DSMB, cũng không thấy nói đến kế hoạch phân tích. Nếu nghiên cứu không có DSMB thì đó là một thiếu sót. Nếu nghiên cứu có DSMB thì nên báo cáo trong phần Appendix để độc giả biết các chuyên gia này là ai và ‘track record’ của họ ra sao. Thông tin này giúp nâng uy tín của công trình nghiên cứu.
Cần nói thêm rằng vì an toàn là một outcome quan trọng của nghiên cứu, và những ca có phản ứng phụ cần phải được đánh giá theo thang điểm FDA. Do đó, thành viên có kinh nghiệm lâm sàng của DSMB là người có nhiệm vụ đánh giá (chớ không phải tác giả). Điều này quan trọng, và cần được mô tả rõ ràng hơn trong bài báo.
7. Đo lường kháng thể IgG
Đây là outcome chánh của nghiên cứu, nên tôi nghĩ tác giả cần phải viết rõ hơn cách đo lường Anti-S IgG. Hiện nay, cách mô tả rất đơn giản là “The primary outcome was anti-S IgG responses to Nanocovax evaluated by chemiluminescence immunoassay (CLIA).” Một mô tả như vậy chưa đủ cho một biến số quan trọng của công trình nghiên cứu. Cần phải mô tả chi tiết về kĩ thuật, độ tin cậy (reliability), chính xác (validity), độ nhạy, độ đặc hiệu của CLIA để độc giả cảm thấy an lòng. Tôi không rành về CLIA nên không biết kĩ thuật này chính xác ra sao. Có lẽ các chuyên gia về sinh hoá sẽ có ý kiến.
Đa số các thử nghiệm lâm sàng về các vaccine khác đều đo IgG RBD (receptor binding domain) ACE2, vốn rất quan trọng để đánh giá kháng thể. Tôi không rõ tại sao nghiên cứu này không đo lường IgG RBD.
8. Phân tích dữ liệu
Kết luận của nghiên cứu tuỳ thuộc vào kết quả phân tích dữ liệu và phương pháp phân tích. Bài báo này cho chúng ta biết outcome chánh là kháng thể IgG, nhưng không cho chúng ta biết giả thuyết là gì và câu hỏi nghiên cứu là gì. Câu hỏi nghiên cứu liên quan đến cách tính cỡ mẫu. Tôi nghĩ (đoán) rằng giả thuyết là có sự khác biệt về sự thay đổi về IgG theo thời gian giữa các nhóm tình nguyện viên, thế nhưng cỡ mẫu thì không tính theo giả thuyết này, và điều này làm cho việc diễn giải kết quả rất khó khăn.
Tác giả cho biết là tính toán giá trị trung bình tích số (geometric mean hay GMC). Sau đó, họ phân tích “analyzed base on two-sided test with 95% confidence in the t-distribution function“. Thú thiệt, tôi không hiểu câu đó có nghĩa là gì. Không rõ phương pháp là gì ở đây. Chỉ có thể đoán rằng tác giả dùng kiểm định t? Thật ra, tác giả chỉ viết chung vậy thôi, chớ trong bài báo không hề có báo cáo trị số P, cũng chẳng có báo cáo về khoảng tin cậy 95% mức độ khác biệt giữa các nhóm. (Họ có báo cáo khoảng tin cậy 95% cho mỗi nhóm, nhưng không báo cáo khoảng tin cậy 95% cho khác biệt giữa các nhóm, và đó là một thiếu sót).
Tuy nhiên, dù gì thì việc ứng dụng phương pháp phân tích t-test là một sai lầm. Lí do là vì phương pháp t-test giả định rằng các giá trị IgG trong mỗi cá nhân qua 4 thời điểm (ngày 0, 28, 35 và 42) độc lập với nhau, nhưng trong thực tế thì các giá trị IgG trong mỗi cá nhân không độc lập với nhau. Vì không độc lập với nhau, nên phương pháp t-test sẽ cho ra sai độ lệch chuẩn và trị số P cũng sai. Để phân tích đúng, tác giả phải ứng dụng một phương pháp thích hợp cho loại nghiên cứu theo thời gian.
Một khía cạnh khác của phân tích là hình như tác giả không bám sát vào thiết kế nghiên cứu. Theo thiết kế, các tình nguyện viên được phân chia thành nhóm tuổi (như mô tả trên), thì đáng lí ra phân tích cũng phải làm theo nhóm tuổi. Thế nhưng trong thực tế thì tác giả bỏ qua việc này.
9. Cách trình bày kết quả
Tôi nghĩ cách trình bày kết quả có thể cải thiện tốt hơn. Biểu đồ 3 (Figure 3) trong bài báo rất quan trọng nhưng nó lại được trình bày hơi đơn giản, và có thể làm cho người đọc hiểu lầm rằng dữ liệu quá đẹp và quá sạch. Trong thực tế, chắc chắn sự thay đổi IgG theo thời gian không ‘trơn tru’ như mô tả trong Biểu đồ, bởi các tình nguyện viên rất khác nhau. Cách trình bày tốt hơn và trung thực hơn là cho thấy sự thay đổi trong mỗi cá nhân tình nguyện viên; nếu nhóm nghiên cứu có 80 cá nhân thì phải có 80 đường biểu diễn (còn gọi là biểu đồ bánh tằm – spaghetti plot) để độc giả cảm nhận được biến chuyển của IgG.

Ngoài ra, tôi chưa rõ cái ‘error bar’ trong biểu đồ này được tính toán ra sao. Tôi đoán rằng tác giả tính dựa vào standard error (sai số chuẩn). Đáng lí ra nên tính theo standard deviation (độ lệch chuẩn). Sai số chuẩn lúc nào cũng thấp hơn độ lệch chuẩn, và do đó nó cho ra một kết quả ‘đẹp’ hơn thực tế, và do đó các tập san khoa học đều khuyến cáo là nên dùng độ lệch chuẩn. Ngay cả chú thích trong biểu đồ cũng khó hiểu, và tác giả nên xem xét lại điều này vì nó có thể làm cho người đọc đánh giá sai kết quả nghiên cứu.
Kết quả chánh của thử nghiệm giai đoạn II có thể tóm tắt trong bảng dưới đây. Trong bảng dưới đây, tôi ghi lại những kết quả kháng thể IgG được mô tả trong phần văn bản, và tính toán lại khoảng tin cậy 95% cho đúng hơn.
Ngày / nhóm | Trung bình và khoảng tin cậy 95% (báo cáo) | Trung bình và khoảng tin cậy 95% (tính lại) |
Ngày 35 | ||
25 mcg | 6.78 (5.09 – 9.03) | 6.78 (0.18 – 257.7) |
50 mcg | 9.38 (6.99 – 12.58) | 9.38 (0.23 – 387.1) |
75 mcg | 13.04 (9.46 – 17.98) | 13.04 (0.23 – 746.2) |
Ngày 42 | ||
25 mcg | 60.48 (51.12 – 71.55) | 60.48 (7.16 – 510.7) |
50 mcg | 49.11 (41.26 – 58.46) | 49.11 (5.42 – 444.6) |
75 mcg | 57.18 (48.40 – 67.50) | 57.18 (6.99 – 467.9) |
Như có thể thấy qua bảng trên, khoảng tin cậy 95% của anti-S IgG sau khi tính toán lại rất khác với kết quả tác giả báo cáo. Chẳng hạn như ở ngày 35, khoảng tin cậy 95% được báo cáo là từ 5.09 đến 9.03, nhưng thật ra là từ 0.18 đến 257.7. Nói cách khác, sự khác biệt giữa các cá nhân rất cao chớ không như báo cáo. Tôi phải nhấn mạnh là kết quả tác giả báo cáo không sai, chỉ là cách báo cáo không hợp lí vì dùng sai chỉ số thống kê để mô tả mức độ khác biệt giữa các tình nguyện viên. Tác giả báo cáo khoảng tin cậy của giá trị trung bình, còn tôi tính là khoảng tin cậy của mẫu nghiên cứu. Khoảng tin cậy cho số trung bình không có ý nghĩa thực tế ở đây.
Phần Kết quả có câu “The seroconversion rate was defined as GMFR > 4” cũng cần giải thích tại sao có ngưỡng đó (hay cho một tài liệu tham khảo). Tốt nhứt là nên trình bày con số thật hơn là ngưỡng cụ thể, bởi vì GMFR là một biến số liên tục. Cách phân nhóm trên hay dưới 4 làm mất thông tin. Ví dụ như 4.01 và 6.9 rất khác nhau, nhưng vẫn bị gộp chung một nhóm theo ngưỡng 4.
10. Cách viết và tiếng Anh
Tiếng Anh là điểm yếu của chúng ta, nhưng tiếng Anh của bài báo thì nhìn chung là rất tốt. Chỉ có điều là có nhiều chỗ khó hiểu, một phần vì cách viết tiếng Anh không ‘standard’. Khó có thể liệt kê hết những câu văn không chuẩn, nhưng vài ví dụ để thấy (dùng sai chữ, sai thì, câu văn đong đưa, v.v.):
“Here we report the findings of the phase 1 and 2 trials started in December 2020 and February 2021 respectively, to evaluate the safety and immunogenicity”, “Values higher than normal ranges/thresholds will be assessed for clinical significance by researchers”, “In details, unsolicited AE incidence of groups”, “Most adverse events and serious adverse events were grade 1 which disappeared within 48 hours after injection”, “Limitations of these phase 1 and 2 trials are limited ethnic diversity (almost exclusively Vietnamese Kinh people), short follow-up duration“, v.v.
Theo tôi thì phải biên tập lại tiếng Anh, trước khi gởi cho một tập san khoa học. Tập san không có thì giờ sửa tiếng Anh, và ban biên tập chỉ cần đọc qua mà thấy nhiều sai sót thì họ sẽ trả lại bản thảo cho tác giả.
Ngay cả cách viết cũng có nhiều chỗ mang tính áp đặt (còn gọi là ‘putting words in one’s mouth’ – nhét chữ vào miệng người đọc). Chẳng hạn như câu “These preliminary results showed that Nanocovax were safe at all dose strength” (Kết quả sơ khởi này cho thấy Nanocovax là an toàn ở tất cả liều lượng). Câu đó viết cho báo chí phổ thông thì may ra ok, nhưng cho tập san khoa học thì không. Tôi nghĩ câu này không nên viết trong phần Kết quả, mà có thể dành cho phần Bàn luận. Viết như thế thì chuyên gia bình duyệt đánh giá trình độ khoa học của tác giả, bởi người có kinh nghiệm khoa học không diễn giải đơn giản như vậy.
Theo tôi thấy, phần Kết quả viết quá dài và quá … lan man. Nhiều chỗ lặp lại kết quả trong bảng số liệu và biểu đồ một cách không cần thiết. Đáng lí ra phần mô tả các con số (rất quan trọng) nên trình bày trong bảng số liệu, nhưng tác giả chọn text, và thế là câu văn quá dài. Câu văn quá dài làm cho độc giả khó theo dõi. Nên đi thẳng vào vấn đề và trong tâm của outcome. Cần nhắc lại rằng phần Kết quả là thông tin (information) chớ không phải dữ liệu (data) vốn nằm trong biểu đồ và bảng số liệu. Thế nhưng tác giả tỏ ra lẫn lộn giữa information và data ở phần Kết quả.
Phần Bàn luận thì lại viết quá ngắn, quá sơ sài, gây cảm tưởng không tốt ở người đọc. Đây là phần được ví von là bộ não của nghiên cứu, là nơi mà tác giả giải thích tại sao độc giả phải quan tâm đến kết quả nghiên cứu, và nơi mà tác giả chứng minh mình là ‘leader’. Ngay cả phần bàn luận về điểm mạnh và yếu, tác giả cũng chưa chứng tỏ đã suy nghĩ kĩ về các khía cạnh này. Thành ra, tôi e rằng với cách viết hiện tại có lẽ không đem lại công bằng cho những gì họ đã làm mà còn dễ gây ấn tượng rằng tác giả chưa hẳn là ‘intellectual leader’ trong chuyên ngành. Cần phải viết bài bản hơn nữa: như bàn luận và giải thích kết quả anti-S IgG; như giải thích 12 ca hạ thân nhiệt; như tại sao số ca phản ứng phụ rất thấp, có phải do thời gian theo dõi chưa đủ; như điểm mạnh và yếu về đo lường; như cỡ mẫu và phân tích; như ý nghĩa của vaccine trong thời gian này; như những gì cần làm tiếp, v.v. Có nhiều điều để bàn, nhưng tác giả chưa làm.
Ngay cả phần Abstract (tóm tắt) cũng cần phải cải tiến. Cần nhắc lại rằng Abstract là một phần độc lập của bài báo, nên tác giả phải soạn sao cho người đọc có thể nắm lấy thông tin chánh của nghiên cứu. Hiện nay cái Abstract còn quá chung chung và thiếu thông tin định lượng. Chẳng hạn như câu “Nanocovax induced robust anti-S antibody responses” không hàm chứa thông tin, hay câu “There was no statistical difference in antibody responses among dose strengths on Day 42, in terms of anti S-IgG level and neutralizing antibody titer” nhưng không hề cung cấp thế nào là ‘no statistical difference’? Thật ra, mệnh đề ‘statistical difference‘ cũng không đúng thuật ngữ khoa học. Tôi nghĩ tác giả nên viết lại cái Abstract cho tốt hơn.
11. Nhà tài trợ
Một khía cạnh khác hơi tế nhị là khi nghiên cứu được công ti sản xuất vaccine tài trợ, mà người của công ti cũng là tác giả thì dễ làm cho người đọc nghĩ là ‘conflict of interest’ (mâu thuẫn lợi ích). Tôi nghĩ nên có một tuyên ngôn về vai trò của nhà tài trợ trong việc quản lí dữ liệu, phân tích dữ liệu, và diễn giải kết quả nghiên cứu.
12. Chọn liều lượng nào?
Đây là câu hỏi khó có câu trả lời dứt khoát, bởi vì sự khác biệt giữa các nhóm liều lượng (25 mcg, 50 mcg và 75 mcg) tuỳ thuộc vào thời điểm theo dõi và cách phân tích của tác giả chưa trả lời được câu hỏi đó. Thế nhưng có vẻ nhóm tác giả và nhà sản xuất đã chọn liều 25 mcg để làm thử nghiệm giai đoạn 3.
Nếu đọc Biểu đồ 3 trong bài báo, chúng ta dễ dàng đồng ý rằng cả 3 liều chẳng khác nhau về lượng kháng thể IgG ở ngày thứ 28. Nhưng ở ngày 35, thì câu chuyện hơi khác: nhóm 25 mcg có lượng kháng thể thấp hơn nhóm 50 mcg chừng 13% (P = 0.12, theo tính toán của tôi) và thấp hơn nhóm 75 mcg khoảng 25% (P = 0.0027), tức nhóm 75 mcg là tốt nhứt. Đến ngày 42 thì lượng kháng thể của cả 3 nhóm tương đương nhau.
Tuy nhiên, phân tích trên (từng thời điểm) về mặt thống kê học là sai. Lí do là vì lượng kháng thể trong mỗi cá nhân qua các thời điểm phải có liên quan với nhau (hiểu theo nghĩa ‘correlation’) và như vậy việc phân tích đơn giản theo t-test cho mỗi thời điểm không còn áp dụng được nữa vì nó dựa vào giả định là giá trị các thời điểm độc lập với nhau. Ngoài ra, phân tích như vậy chưa hiệu chỉnh cho vấn đề kiểm định đa giả thuyết (multiplicity).
Nói cách khác, với phân tích như trong bài báo, rất khó nói liều lượng nào là tối ưu. Tôi nghĩ cần phải phân tích lại cho đúng phương pháp thì mới nói được. Điều quan trọng cần nhấn mạnh là nghiên cứu này không được thiết kế để tìm liều tối ưu (tức số cỡ mẫu không được tính toán dựa trên nồng độ IgG), nên những khác biệt mà chúng ta thấy nó chỉ có ý nghĩa mô tả, chớ không xác định một giả thuyết nào.
Tóm lại
Công trình thử nghiệm Nanocovax là một nỗ lực khá qui mô (về cỡ mẫu), nhưng tôi nghĩ về mặt đo lường và đánh giá kháng thể nếu làm được nhiều hơn thì sẽ thuyết phục hơn. Về thiết kế cũng có vài điểm có thể cải thiện, nhưng đã qua rồi. Về phân tích thì có lẽ phải phải làm lại vì phương pháp như báo cáo là không thích hợp, nếu không muốn nói là không đúng, với mục tiêu của nghiên cứu. Nên phân tích lại cho đúng hơn.
Nhưng phương pháp là một chuyện (chẳng có nghiên cứu nào hoàn hảo), còn kết quả mới là điểm cần bàn thêm. Tôi nghĩ những kết quả mà nhóm tác giả công bố, dù dưới dạng preprint, cho thấy nanocovax có triển vọng, vì rõ ràng nồng độ IgG tăng theo thời gian dù không có khác biệt (?cần xem lại) giữa các nhóm liều lượng. Dữ liệu chỉ cho phép chúng ta nói rằng những người được tiêm vaccine có lượng kháng thể tăng so với người không được tiêm vaccine. Còn mức độ bao nhiêu thì cần phải phân tích dữ liệu cho đúng phương pháp mới biết được.
Tuy nhiên, những phát biểu trên báo chí như “đạt hiệu quả 90%” là không đúng với dữ liệu trình bày. Xin nói thêm rằng chữ ‘hiệu quả’ trong nghiên cứu vaccine được hiểu là ‘vaccine efficacy‘ (VE), có nghĩa là phần trăm giảm nguy cơ lây nhiễm. Nghiên cứu này chưa cho phép nhà nghiên cứu ước tính VE, và do đó báo chí không nên dùng chữ ‘hiệu quả’.
Về báo cáo thì chắc nhóm tác giả phải soạn lại cho phù hợp với tuyên bố CONSORT cho các thử nghiệm lâm sàng và cung cấp thông tin minh bạch hơn như cách mà tôi và đồng nhiệp soạn trước đây cho tập san JBMR [6].
____
[1] https://vnexpress.net/nha-san-xuat-thong-bao-nanocovax-dat-hieu-qua-bao-ve-90-4336494.html
[2] https://tphcm.chinhphu.vn/kien-nghi-thu-tuong-xin-cap-phep-khan-cap-cho-vac-xin-nanocovax
[3] https://doi.org/10.1101/2021.07.22.21260942
[4] https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(20)32466-1/fulltext
[5] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7682882
[6] https://asbmr.onlinelibrary.wiley.com/doi/full/10.1002/jbmr.3885