“Calling Bullshit” (Xạo): tài nguyên cho công dân

Trong thời gian lockdown, tôi đọc được một cuốn sách hay và muốn có đôi lời vừa là điểm sách vừa là chia sẻ cùng các bạn. Đó là cuốn sách “Calling Bullshit: The Art of Skepticism in a Data-Driven World“, tạm dịch là “Xạo: Nghệ Thuật Hoài Nghi Trong Thế Giới Được Thống Trị Bởi Dữ liệu” (hay ngắn hơn là ‘Xạo’). Tác giả cuốn sách này, nhà sinh học Carl Bergstrom và nhà thống kê học Jevin West, chỉ cho độc giả cách phát hiện và bác bỏ những sai trái, những vô duyên, những điều xạo trong các bài báo khoa học, trong các tuyên bố vung vít về Dữ Liệu Lớn và những bài nói chuyện trơn tru trên TED.

Trước hết là chữ “Xạo”. Chữ này theo tôi biết là xuất phát từ miền Nam thời trước 1975. Ai cũng hiểu lờ mờ xạo là gì, nhưng nếu hỏi về định nghĩa thì rất khó ai có thể diễn đạt cho thông. Từ điển Tiếng Việt (Hoàng Phê) giải thích xạo là “Không đứng đắn, bậy bạ”. Nhưng đó vẫn chưa phải là định nghĩa. Chúng ta phải xem người phương Tây họ nói gì về xạo dưới đây.

Bullshit – Xạo

Đối với chúng ta, những người mà tiếng Anh là ngôn ngữ thứ hai, thì chữ bullshit được xem là loại ngôn ngữ tục tĩu. Nói “you are bullshit” là cũng giống như nói “Anh xạo ke”, ý nghĩa không tốt. Thế nhưng trong thực tế thì bullshit là một chữ có vị trí trang trọng trong khoa học và triết học. Triết gia Harry G. Frankfurt có lẽ là người nghiên cứu sâu nhứt về xạo. Ông là người đặt nền tảng triết lí về xạo. Trong cuốn tiểu luận ngắn rất nổi tiếng, “On Bullshit”, ông nhận định rằng trong giao tiếp xã hội có những người bị thôi thúc phải nói những điều mà họ không am hiểu, và ông gọi đó là ‘bullshit’ (hay xạo). Ông xem xạo là một thứ phẩm của xã hội.

Gs Frankfurt phân biệt xạo với nói dóc. Người nói dóc biết sự thật nhưng vẫn nói dóc một cách cố ý. Người xạo thì không quan tâm đến sự thật và cũng không có ý định lừa dối ai. Giữa xạo và nói dóc thì xạo nguy hiểm hơn vì nó làm lu mờ sự thật.

Gs Frankfurt nhận định thêm rằng chúng ta đang sống trong một thế giới bị thống trị bởi xạo. Mà, có lẽ đúng như vậy, vì hầu như ngày nào cũng ta cũng đọc được hay nghe thấy những bản tin về đột phá trong khoa học, cùng với những phát hiện mà có vẻ quá tốt và quá hay. Những cái tựa đề như “Nghiên cứu đột phá có thể cách mạng trong điều trị ung thư“, “Cuộc vận động của Trump dẫn đến 30000 ca nhiễm COVID-19 và 700 cái chết” gây ấn tượng mạnh mẽ. Chúng ta còn bị dội bom thông tin nào là “Dữ liệu Lớn”, là “Học Máy” sẽ cách mạng bất cứ lãnh vực gì, từ chẩn đoán bệnh tật đến … hành nghề luật sư! Tuy nhiên, điều phiền phức là tất cả những lời khẳng định đó đều không đúng, hay nói thẳng ra là ‘xạo’. Đúng như tác giả Bergstrom và West mở đầu cuốn sách rằng “Thế giới này đang bị ngập ngụa với những điều xạo, và chúng ta đang bị chết đuối trong biển xạo“.

Trong “Calling Bullshit”, hai tác giả Bergstrom và West còn đi xa hơn Harry Frankfurt ở định nghĩa về xạo như sau:

Xạo là hành vi dùng sử dụng ngôn ngữ, biểu đồ, dữ liệu thống kê, và các hình thức thể hiện khác nhằm thuyết phục hoặc gây ấn tượng để đánh lạc hướng hay áp đảo hay đe doạ khán giả, nhưng không quan tâm đến sự thật hay tính hợp lí của thông tin.” (Trang 40).

Theo định nghĩa này, xạo là hành vi xuyên tạc dữ liệu thống kê và chữ nghĩa nhằm xao lãng và áp đảo khán giả nhưng không quan tâm đến sự thật. Xạo do đó có thể xem là một ‘process‘ hơn là một sản phẩm.

Bergstrom và West triển khai và mở rộng định nghĩa đó thành 9 chương sách. Những chương sách chánh bao gồm suy luận nhân quả (Chương 4), diễn giải số liệu (Chương 5), những thiên lệch trong nghiên cứu khoa học (Chương 6), hiển thị dữ liệu (Chương 7), Big Data (Chương 8). Trong hai chương cuối, tác giả cung cấp một số hướng dẫn và công cụ để phát hiện và bác bỏ những điều xạo.

Xạo trong nghiên cứu khoa học

Một điều đáng buồn là rất nhiều xạo xuất phát từ các nghiên cứu khoa học. Năm 2005, Giáo sư John Ioannidis (Đại học Stanford) gây sốc thế giới qua bài báo nổi tiếng trên PLoS Medicine. Trong bài báo đó, bằng cách dùng lí giải Bayes, Ioannidis chứng minh rằng đa số các phát hiện được công bố trên các tập san khoa học là sai. Tổng biên tập của tập san y khoa lừng danh Lancet là Richard Horton cũng đồng ý với Ioannidis, nhưng với một phát biểu ít gây sốc hơn: “Đa phần y văn và khoa văn, có lẽ phân nửa, là sai.” Rất nhiều nghiên cứu trong những năm sau đó cho thấy đúng như Ioannidis và Horton nhận định, đa số (có thể lên đến 95%) các phát hiện được báo cáo trên các tập san khoa học là sai. Nói theo ngôn nhữ bình dân là đa số nghiên cứu khoa học là … xạo.

Lãnh vực nghiên cứu càng ‘nóng’ thì xạo càng nhiều, tức là hiện tượng Proteus. Lí do cho những kết luận xạo thì rất nhiều, nhưng bao gồm những yếu tố như giả thuyết sai, cỡ mẫu nghiên cứu không đủ, thiên lệch trong thiết kế thí nghiệm, mức độ ảnh hưởng thấp, kiểm định nhiều giả thuyết, tra tấn dữ liệu, lạm dụng trị số P, và mâu thuẫn lợi ích. Tất cả những lí do này dều được lí giải trong Xạo kèm theo những ví dụ minh hoạ rất sinh động và thực tế.

Xạo do sai lệch trong nghiên cứu khoa học

Thiên lệch hay sai lệch (Bias) trong nghiên cứu là một trong những nguyên nhân của quá nhiều xạo trong khoa học. Thiên lệch là khái niệm không dễ hiểu, nhưng có thể giải thích đơn giản như sau: đó là sự sai lệch giữa sự thật và quan sát. Nếu mối liên quan giữa (chẳng hạn như) hành vi dễ mến và sự hấp dẫn không hiện hữu, nhưng nếu một nghiên dựa trên một mẫu chọn lọc phát hiện ra mối liên quan thì đó là một sự thiên lệch. Nếu chiều cao của thanh niên Việt Nam là 170 cm, nhưng nếu một nghiên cứu trên 100 người cho ra kết quả 172 cm, thì đó là sai lệch (2 cm). Sự sai lệch này là do cách chọn mẫu nghiên cứu, còn gọi là “Selection Bias” trong nghiên cứu dịch tễ học. Chương 6 của cuốn sách giải thích rất hay và dễ hiểu về khái niệm thiên lệch.

Source: www.callingbullshit.org/case_studies/case_study_musician_mortality.html

Một trong những câu chuyện tâm đắc trong cuốn sách phản ảnh sự thiên lệch là tuổi thọ của các nhạc sĩ (trang 126-129). Câu chuyện bắt đầu với một bài báo đình đám cho rằng các nhạc sĩ, nam cũng như nữ, thuộc dòng nhạc Metal, Rap và Hip Hop chết ở tuổi rất trẻ (khoảng 30 tuổi) so với các nhạc sĩ thuộc dòng nhạc Blues, Country, và Jazz (tuổi trung bình khi chết là 60-65). Phát hiện này rất giật gân và gây ấn tượng mạnh. Có giả thuyết cho rằng các nhạc sĩ dòng nhạc Metal, Rap và Hip chết sớm là do lối sống buông thả và đó cũng là dòng nhạc … nguy hiểm!

Tuy nhiên, hai tác giả Bergstrom và West, với kinh nghiệm khoa học thống kê, nhận ra ngay đó là một kết luận … xạo. Dòng nhạc Blues, Country và Jazz đã hiện hữu rất lâu (cả trăm năm), và những nhạc sĩ thuộc dòng nhạc này tương đối cao tuổi, và họ qua đời ở tuổi tương đối cao là điều có thể hiểu được. Còn dòng nhạc như Metal và Rap thì chỉ mới xuất hiện gần đây, và các nhạc sĩ thuộc dòng nhạc này cũng còn trẻ. Họ còn trẻ và chết ở độ tuổi ‘hưởng dương’ là điều không quá ngạc nhiên. Vấn đề là đa số các nhạc sĩ dòng nhạc Metal và Rap vẫn còn sống, và chúng ta chưa biết … chừng nào họ chết. Do đó, nếu chỉ phân tích những người ĐÃ qua đời và so sánh 2 nhóm thì là một sự sai lệch (bias) vì thời gian theo dõi của nhóm nhạc trẻ chưa đầy đủ. Trong dịch tễ học, sai lệch này được gọi là “Right Censored Bias”. Rất nhiều các phân tích sống còn (survival analysis) trong y văn đều sai vì bias này nhưng ngay cả tác giả cũng không biết. Họ xạo.

Những thiên lệch như thế cũng giải thích tại sao những tài tử điện ảnh chiếm giải Oscars thuờng có xu hướng sống lâu hơn những diễn viên không có giải thưởng danh giá đó, hay các giám mục có vẻ chết ở tuổi khá cao so với các linh mục. Thật ra, đó chính là biểu hiện của hiện tượng có tên là “immortal bias” (sai lệch bất tử). Sai lệch bất tử còn giải thích sự khác biệt về tuổi thọ giữa giáo sư và giảng viên, giữa chánh án và trạng sư, giữa tướng lãnh và sĩ quan cấp tá. Nói chung, bề ngoài thì người có cấp bậc cao thường ‘chết trễ’ hơn người có cấp bậc thấp hơn, nhưng thực chất thì không có khác nhau. Sự khác biệt là do sai lệch bất tử. Do đó, những khẳng định như thế được em là … xạo.

Xạo từ Big Data, Machine Learning

Dữ liệu Lớn, ‘Học Máy’ (?) và Trí năng Nhân tạo cũng là nguồn gốc của rất nhiều xạo trong thời gian gần đây (trang 201-203). Một trong những xạo lớn nhứt về Dữ liệu Lớn là mô hình dự báo bộc phát cúm mùa được công bố trên tập san Nature vào năm 2009 [2]. Theo nhóm tác giả, mô hình đó có thể dự báo chính xác sự bộc phát của dịch bệnh, chỉ cần dựa vào những từ khoá mà người sử dụng internet dùng Google (như “fever”, “headache”, “flu symptoms”, và “pharmacies near me”). Kết quả làm cho cả thế giới hào hứng và nhiều dự đoán tương lai được dịp bay bổng. Các chuyên gia IT trịnh trọng tuyên bố rằng thế giới sẽ thay đổi vĩnh viễn với ứng dụng Dữ liệu Lớn. Có người thậm chí còn đi xa hơn, tuyên bố rằng Phương pháp Khoa học sẽ không cần thiết, giả thuyết khoa học cũng không cần thiết. Dịch tễ học sẽ hết thời. Bác sĩ sẽ mất việc.

Tuy nhiên, những kiểm định độc lập sau đó cho thấy mô hình của Google càng lúc càng sai. Mức độ sai cứ tăng theo thời gian, đến nổi Google phải huỷ bỏ mô hình. Sau này, khi các chuyên gia dịch tễ học phân tích lại mới thấy là mô hình có thể biết người ta tìm các từ khoá, nhưng không biết lí do đi tìm những từ khoá đó. Ngay từ đầu, nghiên cứu này chẳng có gì để có thể nói là ‘nghiên cứu khoa học’, vì không có giả thuyết và cũng chẳng có lí thuyết làm cơ sở cho mô hình. Tất cả chỉ để cho máy tính và mô hình thống kê làm việc. Sự thất bại ngoạn mục của mô hình Google là một lời nhắc nhở rằng máy móc và dữ liệu không thể thay thế suy luận của con người, và rằng nếu đầu vào là rác rưởi thì đầu ra cũng là rác rưởi (‘garbage in, garbage out’).

Một dạng xạo khác được sản xuất bởi những quảng cáo rùm beng về Machine Learning. Một trường hợp tiêu biểu được hai tác giả đề cập trong cuốn sách là mô hình nhận dạng những tội phạm (trang 44-47). Câu chuyện bắt đầu với bài báo “Automated Inference on Criminality Using Face Images” [3] của 2 tác giả Xiaolin Wu và Xi Zhang kết luận rằng mô hình machine learning chỉ cần dựa vào hình bán thân (phần đầu) là có thể tiên lượng ai là tội phạm với mức độ chính xác 90%. Thật ấn tượng. Báo chí loan tin với những dự báo ứng dụng mô hình tuyệt vời này.

Khi hai tác giả Bergstrom và West xem lại phương pháp thì thấy bài báo sai ngay từ căn bản. Hai tác giả Wu và Zhang chọn hơn 1800 bức hình người gốc Hoa, tuổi 18-55, những người này không có đặc điểm gì đáng chú ý về tóc, sẹo hay xăm mình. Khoảng 1100 hình lấy từ mạng (các trang truyền thông xã hội) với giả định là họ không phải tội phạm, và 700 hình là tội phạm do sở cảnh sát cung cấp. Không cần phải chuyên gia, các bạn cũng có thể thấy ngay rằng hình trên các trang mạng là hình quảng cáo do chính đương sự hay công ti chọn để có hình ảnh tích cực, còn hình tội phạm là do cảnh sát chọn và chụp nên có những thiên kiến. Sai lầm thứ hai là chọn những hình của người ĐÃ được tuyên án, chớ không phải có xu hướng phạm tội. Nói cách khác, đây là 2 sai lầm về “Selection Bias” rất cơ bản. Qua một thí nghiệm đơn giản thực hiện ngay trong lớp học, Bergstrom và West dễ dàng bác bỏ mô hình của Wu và Zhang, và đi đến kết luận rằng những đặc điểm có xu hướng liên quan đến tội phạm hơn là phán quyết của toà án. West và Bergstrom kết luận rằng mô hình của Wu và Zhang là … xạo.

Xạo thống kê

Lạm dụng mô hình thống kê, đặc biệt là lạm dụng trị số P, cũng sản xuất ra rất nhiều tuyên bố xạo trong khoa học và báo chí phổ thông. Trị số P là một sáng kiến của Giáo sư Ronald Fisher, một thiên tài góp phần sáng lập ra Khoa học Thống kê hiện đại. Trị số P là một chỉ số dùng để lọc tín hiệu từ nhiễu trong các thí nghiệm khoa học. Fisher đề nghị dùng ngưỡng 0.05 cho trị số P để phân biệt giữa những phát hiện có thể là tín hiệu và những thông tin nhiễu. Ông còn viết thêm rằng có thể bỏ qua những phát hiện với P > 0.05. Trong 100 năm sau đó, giới khoa học theo lời khuyến cáo này một cách trung thành, mà ít ai chất vấn tại sao lấy ngưỡng 0.05!

Có thể nói rằng ngưỡng P < 0.05 đã trở thành một loại sổ thông hành cho công bố khoa học. Bởi vì công bố khoa học dẫn đến tài trợ, đề bạt, giải thưởng, và uy danh, nên giới nghiên cứu khoa học rất dễ bị cám dỗ bởi trị số này, và họ có thể làm tất cả để có P < 0.05. Những ‘thủ thuật’ họ có thể làm bao gồm tra tấn dữ liệu (data torture) và P-hacking. P-hacking là một thuật ngữ tương đối mới (do Simmons dùng lần đầu vào năm 2011 [4]) chỉ hành vi phân tích chọn lọc và nhiều lần cho đến khi đạt được trị số P như mong muốn. Cứ 100 dữ liệu hoàn toàn ‘âm tính’, nhưng với P-hacking giới khoa học có thể biến 60 dữ liệu thành ‘dương tính’. Trong thực tế, P-hacking rất ư phổ biến trong khoa học nhưng không ai muốn đề cập đến (do mắc cỡ) và do đó sản suất rất nhiều kết luận sai và xạo.

Xạo khoa học

Chương 9 bàn về sự mẫn cảm của khoa học (Susceptibility of Science) cũng là chương đáng đọc cho những độc giả chưa quen với nghiên cứu và xuất bản khoa học. Bergstrom và West đề cập đến tập san dỏm như là những trạm thông tin làm ô nhiễm khoa học vì những thông tin xạo của họ.

Tại sao giới khoa học công bố trên tập san dỏm? Tại vì, theo West và Bergstrom, có nhu cầu và thị trường. Khi giới khoa học đánh giá với nhau qua số bài báo công bố thì một thị trường sẽ ra đời cho các tập san công bố những bài báo chất lượng thấp (trang 235). Thị trường đó là các trạm xuất bản dỏm đã ngốn hàng trăm triệu USD từ cộng đồng khoa bảng. Những nhà nghiên cứu công bố trên các tập san dỏm không chỉ góp phần làm ô nhiễm môi trường khoa học mà còn lan toả những thông tin xạo đến công chúng.

Trong 2 chương cuối của sách, Bergstrom và West cung cấp một số mẹo và công cụ để phát hiện và bác bỏ những thông tin xạo và kẻ xạo. Một trong những mẹo là học theo cách làm việc của kí giả. Đối với kí giả, nguồn thông tin rất quan trọng, và họ luôn hỏi 3 câu (trang 243):

  • người cung cấp thông tin này là ai?
  • làm sao người này biết sự việc?
  • người này muốn ‘bán’ điều gì?

Qui luật chung là nếu thông tin hay lời khẳng định quá tuyệt vời — hay quá xấu — để có thể tin là thật, thì có lẽ đó là xạo (trang 249). Không bao giờ tin bất cứ điều gì quá khẳng định, quá tốt hay quá xấu.

Nhưng Bergstrom và West cảnh báo chúng ta rằng bác bỏ xạo khó hơn nhiều so với sản xuất ra xạo. Hai tác giả đề cập đến một nguyên lí bất xứng (‘asymmetry principle’) phát kiến bởi một kĩ sư nhu liệu máy tính người Ý tên là Alberto Brandolini phát biểu rằng

Thời gian và năng lượng để bác bỏ xạo cao hơn nhiều so với thời gian và năng lượng cần thiết để tạo ra nó” (trang 11).

hay nói như blogger Uriel Fenelli là “những kẻ ngốc có thể sản xuất ra nhiều xạo hơn bất cứ ai có thể bác bỏ chúng”.

Sự việc liên quan đến vaccine MMR (bệnh sởi, quai bị, và Rubella) và bệnh tự kỉ là một minh chứng. Năm 1988, Bác sĩ Andrew Wakefield và đồng nghiệp ông công bố một ‘nghiên cứu’ trên tập san lừng danh Lancet cho rằng vaccine MMR là nguyên nhân gây ra bệnh tự kỉ. Sau khi bài báo được công bố, số trẻ em được tiêm ngừa MMR giảm hẳn, và tạo ra một phong trào chống vaccine trên thế giới. Nhưng đó là một nghiên cứu … xạo. Phải cần đến 16 năm và hàng trăm nghiên cứu khác để có đủ dữ liệu để chứng minh rằng bài báo của Wakefield là xạo, là sai. Trường hợp này cho thấy Nguyên lí bất xứng của Brandolini là đúng: sản xuất ra thông tin xạo dễ hơn là bác bỏ thông tin xạo.

***

Cuốn sách Xạo hay Calling Bullshit thật ra là sản phẩm của một khoá học do Jevin West và Carl Bergstrom phát triển tại Đại học Washington (Seattle). Khoá học này có tên là ‘Calling bullshit on big data’ [5] (Xạo về Dữ liệu Lớn), và sau này trở nên rất phổ biến không chỉ ở ĐH Washington mà còn các đại học ngoài Mĩ. Tôi cũng muốn thêm rằng West và Bergstrom cũng chính là tác giả sáng chế ra chỉ số “Eigenfactor” dùng để đánh giá tầm ảnh hưởng của tập san khoa học. Cuốn sách được viết bằng một văn phong lôi cuốn và dí dỏm, kèm theo những câu chuyện hay, làm cho cuốn sách rất dễ đọc và thấu hiểu.

Đây không phải là một cuốn sách khoa học phổ thông bình thường. Cuốn sách được viết bằng một văn phong lôi cuốn và dí dỏm, cùng với những ví dụ minh hoạ có thể nói là ‘thông minh’. Do đó, cuốn sách không chỉ dễ đọc đối với công chúng ngoài khoa học, mà còn có thể dùng như là một nguồn tham khảo để giảng dạy các khoá học về dịch tễ học và phương pháp luận trong nghiên cứu khoa học cho sinh viên.

Những ai làm khoa học có lẽ không xa lạ gì với những xạo trong hội nghị và tập san khoa học. Công dân bị dội bom xạo hàng ngày qua các hình thức thông tin xuyên tạc, thông tin giả, thuyết âm mưu, và thậm chí dối trá không chỉ trong hệ thống truyền thông đại chúng mà còn trên mạng xã hội. Trong môi trường như thế, không ngạc nhiên khi người ta cảm thấy như bị chết đuối trước biển xạo. Cuốn sách này không chỉ có giá trị giải trí mà còn trang bị những kiến thức và kĩ năng thống kê rất cần thiết để tạo hệ miễn dịch xạo cho cộng đồng công dân toàn cầu.

PS: Bản tiếng Anh của bài điểm sách này có tại: https://tuanvnguyen.medium.com/reading-calling-bullshit-by-carl-bergstrom-and-jevin-west-c0279e71b226

***

[1] http://ftp.iza.org/dp12282.pdf

[2] https://www.nature.com/articles/nature07634

[3] https://emilkirkegaard.dk/en/wp-content/uploads/Automated-Inference-on-Criminality-using-Face-Images.pdf

[4] https://pubmed.ncbi.nlm.nih.gov/22006061

[5] https://pcc.uw.edu/education/quarterly-climate-courses/calling-bullshit-in-the-age-of-big-data

Giới thiệu sách mới “Mô hình hồi qui và khám phá khoa học”

Tôi rất hân hạnh giới thiệu đến các bạn một cuốn sách mới có tựa đề là “Mô hình hồi qui và khám phá khoa học” (có thể dịch sang tiếng Anh là “Regression models for discoveries“) do Nhà xuất bản TPHCM mới xuất bản. Tôi tin rằng các bạn sinh viên, nghiên cứu sinh, nhà nghiên cứu khoa học sẽ tìm thấy ở cuốn sách một số ý tưởng và phương pháp có ích cho việc làm phong phú và nâng cao chất lượng nghiên cứu của các bạn.

Đa số những ai làm nghiên cứu khoa học cũng đều biết đến hay nghe qua mô hình hồi qui tuyến tính. Đó là một mô hình rất phổ biến trong nghiên cứu khoa học, và ý tưởng bắt nguồn từ thế kỉ 19 khi nhà khoa học trứ danh Francis Galton muốn định lượng mối liên quan giữa chiều cao và yếu tố di truyền. Kể từ đó đến nay, mô hình hồi qui tuyến tính đã được phát triển và ứng dụng trong nhiều chuyên ngành khoa học. Trong cuốn sách này, bạn đọc không chỉ học về mô hình hồi qui tuyến tính, mà còn làm quen với những mô hình hồi qui ít được đề cập trong các sách giáo khoa căn bản như mô hình hồi qui logistic, hồi qui Cox, hồi qui nhị phân, hồi qui Poisson, v.v. Mỗi mô hình hồi qui thích hợp cho một tình huống cụ thể, và biết qua những ý tưởng đằng sau của mỗi mô hình giúp cho việc định lượng hoá những câu hỏi nghiên cứu tốt hơn.

Trong thời gian gần đây, những thuật ngữ mới như ‘data science‘ (khoa học dữ liệu), ‘machine learning‘ (máy hoá mô hình), ‘artificial intelligence‘ (trí năng nhân tạo), v.v. xuất hiện ngày càng dày đặc trong thế giới khoa học. Nhưng ít ai biết hay ghi nhận rằng một phần lớn đằng sau các danh từ ‘hào nhoáng’ đó là các mô hình hồi qui, lí thuyết và phương pháp thống kê học. Tuy nhiên, những cách tiếp cận vừa kể làm cho ứng dụng của các mô hình hồi qui thêm phong phú. Trong sách này, một số mô hình hồi qui cũng được triển khai theo mô thức của machine learning, và bạn đọc sẽ hiểu hơn về các khái niệm như calibrationdiscrimination.

Cuốn sách bao gồm 23 chương được chia thành 3 phần. Phần 1 bao gồm những vấn đề cơ bản như qui luật xác suất, hiển thị dữ liệu (data visualization), kiểm định giả thuyết và ngôn ngữ R. Phần 2 bao gồm 11 chương liên quan đến mô hình hồi qui tuyến tính, từ ý tưởng, cách ước tính đến các mô hình hồi qui đa thức và hồi qui ‘robust’. Phần 3 là những chương viết về các mô hình hồi qui logistic, Cox, Poission, và phân tích sống còn. Mỗi mô hình được minh hoạ bằng một dữ liệu nghiên cứu thực tế cùng các mã máy tính (dùng ngôn ngữ R) để bạn đọc có thể thực hành ngay. Một phần quan trọng trong mỗi chương là hướng dẫn cách diễn giải kết quả phân tích để bạn đọc cảm nhận được ý nghĩa đằng sau của mỗi phương pháp.

Tôi vẫn cho rằng mô hình là một cách suy nghĩ (mà có người gọi là ‘tư duy’) và đặt câu hỏi. Đó là những suy nghĩ về kiểm định giả thuyết, về lượng giá các mối tương quan, và về dự báo tương lai. Ở cấp độ định tính, chúng ta có thể suy nghĩ về câu hỏi có hay không có mối liên quan. Ở mức độ định lượng, chúng ta quan tâm đến mức độ liên quan là bao nhiêu. Ở mức độ chuyên sâu hơn, chúng ta hỏi mức độ liên quan có độc lập với các yếu tố khác trong qui luật tự nhiên. Các mô hình trình bày trong cuốn sách này giúp cho bạn đọc suy nghĩ và đặt câu hỏi chuyên sâu hơn cách suy nghĩ đơn giản.

Tiêu đề của cuốn sách là khám phá, và tôi nghĩ cần có đôi lời giải thích. Khám phá là niềm hân hoan của người làm khoa học. Thử tưởng tượng sau nhiều năm miệt mài nghiên cứu, bạn tạo ra được một bộ dữ liệu với hàng triệu biến thể gen, và phát hiện được biến thể nào có liên quan đến tuổi thọ phải nói là một khám phá có ý nghĩa. Để đi đến phát hiện đó, các mô hình hồi qui sẽ giúp cho bạn sàng lọc những tín hiệu từ dữ liệu lớn. Các mô hình hồi qui không chỉ là một phương tiện khám phá, mà còn một phương pháp dự báo rất hữu hiệu. Do đó, hiểu được những ý tưởng, và nắm vững những kĩ năng liên quan đến mô hình hồi qui là một nhu cầu không thể thiếu được trong nghiên cứu khoa học.

Tôi nghiệm ra rằng cách học phương pháp mới tốt nhứt là học từ các vấn đề thực tế qua những câu chuyện. Do đó, cuốn sách này được soạn thảo theo phong cách kể chuyện. Những câu chuyện được kể trong sách bao gồm câu chuyện về sự ra đời của ý tưởng tương quan (correlation) và mô hình hồi qui tuyến tính, những câu chuyện đằng sau các công trình nghiên cứu thú vị mà các mô hình hồi qui giúp giải đáp.

Đây là một cuốn sách tôi đã có ý soạn từ lâu, vì qua hàng trăm chương trình tập huấn ở Việt Nam trong thời gian 20 năm qua tôi nhận ra nhu cầu cho một cuốn sách thể loại này. Nhưng mãi đến khi đại dịch Covid-19 xảy ra, và tôi phải làm việc từ nhà, nên mới có thời gian viết cuốn sách. Nhân dịp này tôi trân trọng cảm ơn Tiến sĩ Trần Sơn Thạch (Viện nghiên cứu Garvan, Úc) và Tiến sĩ Hà Tấn Đức (Bệnh viện Đa khoa Trung ương Cần Thơ) đã giúp tôi thực hiện các chương trình tập huấn trong thời gian qua. Tiến sĩ Thạch đã đọc bản thảo đầu tiên và cho nhiều góp ý để cải tiến cuốn sách. Tôi cũng cảm ơn biên tập viên La Lan (Nhà xuất bản Tổng Hợp) đã chịu khó đọc, kiểm tra từng công thức và dàn trang cho cuốn sách. Tuy nhiên, nếu sách có sai sót, và tôi nghĩ chắc chắn có, thì trách nhiệm sau cùng là của tôi. Nếu tìm thấy sai sót, bạn đọc có thể viết email cho tôi để lần sau tái bản hoàn chỉnh hơn. Xin chân thành cám ơn các bạn trước.

Mỗi cuốn sách có thể ví von như là một người bạn thầm lặng. Tôi mong muốn cuốn sách “Mô hình hồi qui và khám phá khoa học” là một người bạn khoa học âm thầm bên cạnh bạn và các nghiên cứu của các bạn, hay nói theo Tiên điền tiên sinh, là mua vui cũng được một vài trống canh.

Có thể xem video giới thiệu tại:

Thông tin về sách:

Nhà xuất bản TPHCM

Số trang: 326 trang, khổ 18 x 25 cm

Giá bán: 150,000 đồng

Có thể mua tại nhiều nhà sách, kể cả trực tuyến và tại:

Các chủ đề được đề cập trong sách

  • Mô hình hồi qui tuyến tính, logistic, binomial, Poission, và Cox
  • Mô hình đa thức, spline, và robust regression
  • Hồi qui hồi qui logistic đa thức (polytomous logistic regression)
  • Hoán chuyển dữ liệu (data transformation)
  • Phân chia dữ liệu (data splitting)
  • Phương pháp tìm mô hình tối ưu
  • Phương pháp calibration, discrimination
  • Phương pháp bootstrap, k-fold cross-validation
  • LASSO, Ridge, Bayesian Model Averaging

Dữ liệu thực hành có thể download từ trang web sau đây:

https://github.com/tuanvnguyen/Regression-Book

Hiệu quả vaccine 90% có nghĩa là gì?

Hôm 9/11/2020 là một ngày làm nô nức cư dân toàn cầu khi tập đoàn Pfizer tuyên bố rằng vaccine mRNA phòng chống SARS-Cov-2 của họ có hiệu quả 90% [1]. Nhưng có vài người, ngay cả trong giới y khoa, hiểu sai về con số 90%. Tôi xin có đôi dòng chia sẻ và giải thích.

Hiệu quả của vaccine được đo lường bằng chỉ số gọi là ‘Vaccine Efficacy’ (VE). Chỉ số này được tính toán như sau [2]:

VE = 1 – (Rx / R0);

trong đó Rx là xác suất nhiễm trong nhóm được tiêm vaccine, và R0 là xác suất nhiễm trong nhóm chứng. Theo như thông cáo báo chí thì VE = 0.90 hay 90%.

Con số 90% đó thường được hiểu là cứ 10 người được tiêm, thì chỉ có 1 người bị nhiễm. Tức là vaccine ngăn ngừa nhiễm cho 9 người. Nhưng cách hiểu này sai.

Tại sao sai? Tại vì đơn vị để xác định VE không phải là số ca nhiễm (người), mà là nguy cơ (tức xác suất) nhiễm. Con số VE = 90% có nghĩa là so với nhóm chứng, vaccine giảm 90% nguy cơ nhiễm. Nó hoàn toàn không có nghĩa là ngăn ngừa 90% số ca nhiễm.

Vậy câu hỏi kế tiếp là: nguy cơ nhiễm là bao nhiêu?

Nghiên cứu của Pfizer đã ghi danh 43,538 tình nguyện viên. Số tình nguyện viên được chia ngẫu nhiên thành 2 nhóm theo tỉ số 50:50, tức là 21769 được tiêm vaccine và 21769 trong nhóm chứng. Theo thông cáo báo chí, trong thời gian theo dõi, họ ghi nhận 94 ca nhiễm Covid-19. Như vậy, có thể đoán rằng số ca nhiễm trong nhóm vaccine là 8 người, và trong nhóm chứng là 86 người. Nói cách khác, nguy cơ nhiễm trong nhóm vaccine là 0.037% và nhóm chứng là 0.395%.

Các bạn có thể kiểm tra xem sự khác biệt trên có ý nghĩa thống kê. Nhưng ở đây tôi muốn trả lời câu hỏi: cần phải tiêm bao nhiêu người để giảm 1 ca nhiễm? Câu trả lời là khoảng 280 người.

Tóm lại, hiệu quả 90% không có nghĩa là cứ 10 người được tiêm vaccine thì có 9 người không bị nhiễm; nó có nghĩa là nhóm được tiêm vaccine có xác suất nhiễm thấp hơn nhóm chứng 90%.

Nói cách khác nữa, nếu 10,000 người tiêm vaccine thì sẽ có ~4 người bị nhiễm, còn nếu không tiêm vaccine thì số ca nhiễm sẽ là khoảng 40. Do đó, 1 – 4/40 = 90%. Hiểu như vậy để nói thật với công chúng.

Nhưng đây là mô hình nghiên cứu adaptive RCT [3], nên con số 90% đó có thể thay đổi trong tương lai vì nghiên cứu chưa xong. Họ vẫn phải phân tích thêm 2-3 lần nữa khi dữ liệu được thu thập theo đề cương đề ra. Con số sau cùng có thể cao hơn 90%, nhưng kinh nghiệm của tôi thì con số sau cùng lúc nào cũng thấp hơn con số ban đầu.

Miễn dịch cộng đồng?

Có vaccine phòng chống dịch Covid-19 là một thành tựu đáng chú ý. Thành tựu này quay lại vấn đề miễn dịch cộng đồng (herd community) mà nhiều người đã thảo luận ngay từ lúc dịch mới bộc phát.

Chúng ta biết rằng những người bình phục sau một lần bị nhiễm bởi một virus, thì sau này họ không (hay ít) bị nhiễm virus đó nữa. Lí do miễn nhiễm là vì người đó đã xây dựng được một hệ miễn dịch có thể chống lại virus đó trong tương lai.

Một cách khác để cơ thể có hệ thống miễn dịch mạnh hơn là tiêm vaccine. Chẳng những vaccine không gây bệnh mà còn kích thích hệ thống miễn dịch để sản sinh kháng thể tiêu diệt virus. Do đó, đứng trên quan điểm dịch tễ học, tạo ra miễn nhiễm từ vaccine là chiến lược tương đối an toàn.

Câu hỏi quan trọng là xác định tỉ lệ tiêm chủng phải cao bao nhiêu để đủ ‘nội lực’ cộng đồng chống trả lại dịch bệnh. Vấn đề này trở thành vấn đề của mô hình dịch tễ. Mô hình này học rất đơn giản, và có thể tóm tắt bằng phương trình như sau:

[Dịch bệnh bộc phát] + [Tiêm vaccine P người] = [Bảo vệ cộng đồng]

Tỉ lệ tiêm chủng (tạm gọi là P) tùy thuộc vào mức độ lây lan của dịch. Mức độ lây lan của dịch có thể mô tả bằng hệ số lây nhiễm R0. Từ đó, ngưỡng ‘tối ưu’ của miễn dịch cộng đồng, kí hiệu là T, có thể ước tính bằng công thứ sau đây:

T = 1 – 1/R0.

Trong đó, T là phần trăm trong cộng đồng cần được tiêm ngừa để ngăn chận sự lây lan của dịch bệnh; R0 là hệ số lây lan. Dĩ nhiên, công thức trên dựa vào một giả định rất quan trọng là tiêm vaccine có thể bảo vệ tuyệt đối (100%). Nhưng trong thực tế thì mức độ hiệu quả của đa số vaccine không có cao như 100%, mà thường là 50-80% hay cao lắm là 90% như Pfizer báo cáo vài ngày trước [1]. Do đó, ngưỡng tối ưu T cần phải được hiệu chỉnh cho mức độ hiệu quả của vaccine (tạm kí hiệu là VE):

Tc = T / VE

Chúng ta biết rằng vaccine của Pfizer có hiệu quả VE = 90%. Chúng ta cũng biết rằng hệ số lây lan R0 tính từ nhiều nghiên cứu là 3.17 [3]. Từ đó, số người cần được tiêm vaccine để tạo cộng đồng miễn dịch là:

Tc = (1 – 1/3.17) / 0.90 = 0.76

Như vậy, chúng ta cần phải tiêm cho 76% dân số để tạo miễn dịch cộng đồng.

Dĩ nhiên, không thể một sớm chiều mà đạt được con số 76%; cần một thời gian ít nhứt là một năm. Giả dụ như hiệu quả của vaccine được duy trì trong vòng 2 năm (cái này cần phải nghiên cứu mới biết) thì số người được tiêm ngừa phải cao hơn con số 76%, phải cỡ 85%.

Tóm lại, thông tin về hiệu quả của vaccine mRNA là một tin vui trong việc khống chế đại dịch Covid-19. Dù hiệu quả sau cùng (có thể cao hay thấp hơn 90% chút ít) thì đây cũng là một ‘đột phá’ quan trọng. Đột phá này có thể giúp tạo ra một hệ miễn dịch cộng đồng với điều kiện 70-85% dân số được tiêm vaccine.

***

[1] https://www.cdc.gov/csels/dsepd/ss1978/lesson3/section6.html

[2] https://www.pfizer.com/news/press-release/press-release-detail/pfizer-and-biontech-announce-vaccine-candidate-against

[3] https://pfe-pfizercom-d8-prod.s3.amazonaws.com/2020-11/C4591001_Clinical_Protocol_Nov2020.pdf

[4] Dong et al. A Meta Analysis for the Basic Reproduction Number of COVID-19 with Application in Evaluating the Effectiveness of Isolation Measures in Different Countries. Journal of Data Science 18 (3), 496–510.

PS: Xin mời đọc bài của tôi trên medium:

https://tuanvnguyen.medium.com/the-real-meaning-of-90-efficacy-for-pfizer-vaccine-77499dec6e1c

và bình luận trên vnexpress:

https://vnexpress.net/vaccine-pfizer-hieu-qua-nhu-the-nao-4191234.html

Cần thay đổi gì trong việc xét duyệt chức danh giáo sư?

Qua quan sát những vấn đề được nêu lên trong lần xét duyệt công nhận chức danh giáo sư năm nay, tôi thấy cần phải có một số thay đổi về tiêu chuẩn liên quan đến công bố khoa học.

Đề nghị 1: xác định tập san chánh thống

Vấn đề hiện nay là sự lẫn lộn giữa tập san “dỏm” (còn gọi là tập san “săn mồi” — predatory journals) và tập san chánh thống. Tập san dỏm được định nghĩa hay hiểu là những trạm xuất bản giả danh tập san khoa học chuyên xuất bản những bài báo lừa bịp để lấy tiền. Các tập san này không thuộc bất cứ hiệp hội khoa học nào, và không có cơ chế bình duyệt nghiêm chỉnh, bởi vì họ không quan tâm đến khoa học mà chỉ là lợi nhuận. Trên thế giới có hơn 12,000 tập san “săn mồi”, và mỗi năm họ công bố hơn 400,000 bài báo, với thị trường hơn 74 triệu USD (số liệu 2014).

Sau vài ngày lùm xùm, Hội đồng chức danh giáo sư ngành y đã quyết định lấy các tập san trong danh mục Web of Science (WoS), Scopus, Pubmed và ESCI (Emerging Scources Citation Index) là “tập san uy tín”. Các ứng viên có bài trên các tập san trong các danh mục này sẽ được xét công nhận chức danh giáo sư.

Tôi cho rằng quyết định đó có thể dẫn đến sai lầm trong việc xét duyệt công nhận chức danh giáo sư.

Vấn đề là các danh mục như Scopus, Pubmed và ESCI đều có những tập san dỏm. Kết quả của nhiều nghiên cứu cho thấy số tập san dỏm trong danh mục Scopus và Pubmed lên đến hàng trăm, và ESCI cũng có hàng chục tập san dỏm. Thật ra, có ước tính cho rằng tỉ lệ tập san dỏm trong danh mục ESCI là 0.61%, Scopus là 0.25%, nhưng WoS thì thấp nhất (0.1%). Chỉ riêng ngành thần kinh học, có hơn 10% các tập san trong chuyên ngành này trong Pubmed được giới chuyên gia đánh giá là dỏm. Do đó, dựa vào các danh mục này một cách vô điều kiện là dễ dẫn đến sai lầm.

Tôi đề nghị một cách phân loại tập san chánh thống và ‘phi chánh thống’. Tập san chánh thống là những tập san:

  • do các hiệp hội khoa học chánh thống làm chủ quản và xuất bản bởi các nhà xuất bản học thuật; hoặc/và
  • do các nhà xuất bản học thuật (như Elsevier, Springer-Nature, Wiley, Sage, Taylor & Francis, Routledge, Oxford, Cambridge, Harvard, MIT, Academic Press, v.v.) lập ra nhưng được công nhận bởi cộng đồng khoa học.

Tiêu biểu cho nhóm tập san thứ 1 là JAMA (thuộc hiệp hội y khoa Hoa Kì), BMJ (hiệp hội y khoa Anh), New England Journal of Medicine (thuộc hiệp hội y khoa bang Massachusetts), JCEM (Hiệp hội Nội tiết Hoa Kì), v.v. Nhóm 2 bao gồm các tập san thuộc nhóm Lancet, Nature.

Cách phân nhóm như thế đã tự động loại bỏ các tập san dỏm. Cũng không cần có trong Scopus hay WoS như là một tiêu chuẩn. Một tập san mới thuộc một hiệp hội khoa học có thể chưa có trong Scopus hay Clarivate, nhưng là tập san chánh thống. Ví dụ như Journal of Endocrine Society, Osteoporosis and Sarcopenia, JBMR Plus, v.v. tuy chưa có trong danh mục Clariavate hay Scopus, nhưng người trong chuyên ngành ai cũng biết là tập san chánh thống. Người ngoài ngành có thể không biết và không am hiểu đủ để đánh giá các tập san này.

Đề nghị 2: xem xét đến uy tín của tập san khoa học

Trên thế giới, có hơn 50,000 tập san khoa học tạm xem là ‘chánh thống’, và các tập san này nằm trong 2 danh mục chánh là WoS (28560 tập san) và Scopus (37535 tập san). Một số tập san nằm trong cả 2 danh mục. Dĩ nhiên, có những tập san trong Scopus cũng có trong WoS. Riêng ngành y, tỷ lệ trùng hợp giữa hai danh mục là 46%. Nhìn chung, danh mục Clarivate mang tính chọn lọc hơn là Scopus, vì Scopus có xu hướng thu nhập những tập san có phẩm chất thấp và cả tập san dỏm.

Điều đó có nghĩa là các tập san khoa học không có uy tín như nhau. Chẳng hạn một tập san chuyên khoa nội tiết (Journal of Clinical Endocrinology and Metabolism) và tập san New England Journal of Medicine, tuy thuộc nhóm Q1 nhưng uy tín và chất lượng khoa học thì rất khác nhau. Tập san Journal of Clinical Endocrinology and Metabolism có tỉ lệ từ chối khoảng 20%, nhưng New England Journal of Medicine có tỉ lệ từ chối lên đến 90%. Do đó, cũng là công bố trên “tập san quốc tế”, nhưng không thể xem giá trị khoa học của bài báo như nhau.

Vấn đề hiện nay là Hội đồng chức danh giáo sư xem công bố trên các tập san ‘quốc tế’ có điểm tương đương nhau! Thậm chí một bài báo trên một chuyên san trong nước (ví dụ như Tạp chí Y học Thực hành) lại có điểm y chang như một bài báo trên New England Journal of Medicine Journal of Clinical Endocrinology and Metabolism! Theo tôi đó là một sự vô lí.

Sự vô lí này không chỉ làm sai lệch cách đánh giá ứng viên cho chức danh giáo sư, mà còn vô hình chung khuyến khích làm nghiên cứu có chất lượng thấp. Người ta sẽ nghĩ cần gì phải gian khổ làm nghiên cứu đẳng cấp New England Journal of Medicine, chỉ cần làm nghiên cứu phù hợp với tập san trong nước là cũng có đủ điểm.

Tôi đề nghị tạm thời lấy hệ số ảnh hưởng (impact factor) và chỉ số H để xếp hạng tập san cho mỗi chuyên ngành. Dù biết rằng hệ số ảnh hưởng có khiếm khuyết (thậm chí bị phản đối), nhưng trong thực tế hầu hết các đại học và hội đồng đề bạt chức vụ khoa bảng đều lấy hệ số ảnh hưởng làm thước đo để đánh giá uy tín của một tập san. Ứng viên có bài trên các tập san hàng đầu trong mỗi chuyên ngành phải được đánh giá cao và ưu tiên hơn ứng viên công bố nhiều bài trên các tập san ‘làng nhàng’.

Đề nghị 3: phải phân biệt thể loại bài báo khoa học

Một vấn đề khác nữa là khái niệm ‘bài báo khoa học’. Hiện nay, tiêu chuẩn để công nhận chức danh giáo sư là 5 bài, còn phó giáo sư là 3 bài. Nhưng qui định không nói bài báo đó là gì. Theo tôi, đó là một thiếu sót nghiêm trọng.

Trong thực tế, có nhiều loại bài báo khoa học và giá trị của các bài báo cũng không tương đương nhau:

  • Bài nguyên gốc (original contribution), có nghĩa là bài từ nghiên cứu nghiêm chỉnh, có giả thuyết, có phương pháp phân tích, và dữ liệu là dữ liệu gốc lần đầu được công bố;
  • Bài case report (báo cáo ca lâm sàng), không phải là bài báo khoa học nguyên gốc, vì chẳng có giả thuyết hay mục tiêu gì cả, mà chỉ là mô tả;
  • Bài tổng quan (review), tức là một dạng ‘đọc báo dùm bạn’, điểm qua y văn từ những bài đã công bố trước đây. Đây không phải là nghiên cứu đúng nghĩa;
  • Bình luận, tức những “Letter to the Editor”, “Commentary”, “Debate”, “Editorial”. Đây là những ý kiến cá nhân, cũng không thể xem là nghiên cứu.

Hiện nay, bài báo loại nào cũng được xem là “công bố quốc tế” và có giá trị như nhau! Nếu ứng viên có 10 bài case report được xem hơn người có 3 bài nguyên thuỷ! Đó là một sự vô lí vì trung bình hoá khoa học.

Tôi đề nghị để xét duyệt công nhận chức danh giáo sư, chỉ nên dựa vào bài nguyên gốc. Các bài báo khác (case report, tổng quan, ý kiến) không được tính, nhưng có thể dùng để đánh giá vị thế của ứng viên trong chuyên ngành.

Đề nghị 4: xem xét đến vai trò của tác giả trong bài báo khoa học

Ngày nay, nghiên cứu khoa học là một môi trường hợp tác đa ngành, và do đó mỗi bài báo có nhiều tác giả. Tính trung bình một bài báo y khoa có khoảng 5-7 tác giả. Nhưng trong thực tế cũng có những trường hợp tập đoàn khoa học mà bài báo có hơn 1000 tác giả! Do đó, vấn đề đặt ra là làm sao đánh giá được đóng góp của tác giả ứng viên trong bài báo.

Hiện nay, cách làm của Hội đồng là … trung bình hoá. Chẳng hạn như một bài có 5 tác giả (kể cả ứng viên), thì điểm của ứng viên được xem là 1/5. Đó cũng là một sự vô lí. Trong ‘văn hoá’ công bố khoa học ngành y sinh học, tác giả chánh thường là tác giả liên lạc (correspondence authors). Tác giả liên lạc có thể đứng tên tác giả đầu, nhưng thường là người đứng tên tác giả cuối.

Đề bạt chức vụ khoa bảng là một hình thức ghi nhận đóng góp cho khoa học, nên tôi đề nghị hội đồng chỉ xem xét những bài ứng viên là tác giả chánh, hoặc tác giả đầu, hoặc tác giả cuối. Một qui ước bất thành văn ở nước ngoài là ứng viên phải là tác giả chánh, tác giả đầu, và tác giả cuối của ít nhứt là 60% bài báo khoa học. Dĩ nhiên, các bài khác mà ứng viên là đồng tác giả vẫn được tính, nhưng đó không phải là những bài quyết định.

Đề nghị 5: hãy bỏ sự lệ thuộc vào con số bài báo

Hiện nay, qui định về số bài báo khoa học rất cứng nhắc và thấp. Chẳng hạn như qui định rằng “ứng viên PGS phải có ít nhất 2 bài báo quốc tế, GS phải có 3 bài báo quốc tế” là thấp và chưa rõ ràng. Nghiên cứu sinh ngày nay khi tốt nghiệp cũng có thể công bố ít nhất 2 bài báo khoa học trên các tập san trong danh mục WoS. Và, nếu nghiên cứu sinh qua giai đoạn hậu tiến sĩ 3 năm thì số bài báo khoa học tối thiểu là 6. Do đó, ứng viên giáo sư mà chỉ có 3 bài thì khó thuyết phục các nghiên cứu sinh hậu tiến sĩ.

Theo tôi, không nên qui định về số bài báo khoa học, vì số lượng không nói lên chất lượng. Ngoài ra, sự lệ thuộc này rất dễ bị lạm dụng bằng cách công bố những nghiên cứu nhỏ và không quan trọng. Tôi đề nghị dùng chỉ số H để đánh giá. Ứng viên có chỉ số H bằng 10 có nghĩa là ứng viên đó đã công bố 10 bài báo khoa học, với số lần trích dẫn tối thiểu là 10. Do đó, chỉ số H phản ảnh cả số lượng và chất lượng, và được các hội đồng đề bạt chức danh giáo sư nước ngoài sử dụng rất phổ biến.

Trong trường hợp Việt Nam, có thể lấy số liệu về chỉ số H cho cấp phó giáo sư ngành y là 5, và cấp giáo sư là 15 làm điểm tham khảo tối thiểu. Cần nói thêm rằng ở Mĩ, ứng viên phó giáo sư y thường có chỉ số H trung bình là 10, và giáo sư là 22.

Tiến tới chuẩn quốc tế

Ở các các đại học phương Tây, mục tiêu của việc đề bạt (hay ‘công nhận’) giáo sư là nhằm nhận dạng nhân tài trong khoa bảng, nhận dạng người có khả năng lãnh đạo. Lãnh đạo thể hiện qua đa vai trò của ứng viên đó: là học giả, là nhà nghiên cứu, là thành viên của cộng hoà học thuật, là người có thẩm quyền, và là người phản biện xã hội. Một người chỉ có công bố khoa học mà thiếu những hình ảnh kia thì vẫn chưa thể là giáo sư.

Dựa trên nguyên lí đó, người ta đề ra 3 trụ cột về các tiêu chuẩn: nghiên cứu khoa học; giảng dạy và đào tạo; và phục vụ cho chuyên ngành, xã hội, và tư cách lãnh đạo. Nghiên cứu khoa học được thể hiện qua quá trình nghiên cứu và công bố khoa học, phẩm chất khoa học, và tầm ảnh hưởng. Không phải có hàng chục bài trên Nature hay Science hay có nhiều trích dẫn là tự động được bổ nhiệm giáo sư; người ta phải xét toàn diện quá trình nghiên cứu.

Giảng dạy và đào tạo được thể hiện qua các hoạt động như phụ trách các course học, thể hiện sự cách tân trong giảng dạy, kèm theo chứng cớ đánh giá của sinh viên. Giảng dạy còn bao gồm cả soạn sách giáo khoa (mặc dù tiêu chuẩn này không quan trọng cho giáo sư ngạch nghiên cứu). ‘Giảng dạy’ ở đây cũng có nghĩa là hướng dẫn sinh viên hậu đại học như nghiên cứu sinh, và hướng dẫn nghiên cứu sinh hậu tiến sĩ.

Phục vụ qua các hoạt động chuyên ngành, xã hội, và lãnh đạo bao gồm rất nhiều tiêu chuẩn về đóng góp cho chuyên ngành; đóng góp cho quốc gia nói chung; và vai trò lãnh đạo về tri thức và khoa học. Lãnh đạo tri thức và khoa học (‘intellectual leadership’ và ‘scientific leadership’) rất quan trọng, đặc biệt ở cấp giáo sư thực thụ. Lãnh đạo thể hiện qua các vai trò lãnh đạo trong hiệp hội và tập san khoa học. Lãnh đạo khoa học còn thể hiện qua các bài xã luận và bình luận được các tập san mời viết. Lãnh đạo khoa học còn thể hiện qua các giải thưởng, các fellowship danh giá, và chức danh danh dự từ các đại học khác.

Do đó, để đề bạt giáo sư theo chuẩn mực quốc tế, thì cần phải soạn lại qui chuẩn. Bộ tiêu chuẩn về công bố khoa học phải phản ảnh sự khác biệt và công bằng giữa 2 ngạch giáo sư chuyên về nghiên cứu khoa học và giáo sư chuyên về giảng dạy. Điều quan trọng là giáo sư không phải chỉ là người công bố khoa học hay giảng dạy, mà còn phải có đóng góp cho xã hội (qua phản biện xã hội) cho chuyên ngành.

Tóm lại, những qui định về công bố khoa học trong việc xét duyệt công nhận chức danh giáo sư còn nhiều khiếm khuyết. Dựa vào các danh mục như Scopus và Pubmed hay ESCI một cách vô điều kiện dễ dẫn đến sai lầm về việc đánh giá và nhận dạng tập san dỏm. Ngay cả với tập san chánh thống, việc đánh giá theo ‘trung bình chủ nghĩa’ không chỉ vô lí mà còn gián tiếp khuyến khích nghiên cứu chất lượng thấp. Sự lệ thuộc vào số lượng bài báo làm lu mờ chất lượng là một khiếm khuyết dẫn đến sự bất công giữa các ứng viên. Những 5 đề nghị trình bày trong bài này nhằm khắc phục những thiếu sót đó và giúp việc xét duyệt chức danh giáo sư gần hơn với tiêu chuẩn ở các nước tiên tiến.

TB: Bài đã đăng trên báo Tuổi Trẻ Cuối Tuần 8/11/2020

Trò chuyện đầu tuần: Đăng bài trên tập san “dỏm” và đạo đức công bố

Tôi hân hạnh giới thiệu một bài phỏng vấn tôi về vấn đề tập san dỏm. Đây là bài trong mục “Trò chuyện đầu tuần” của báo Người lao động chung quanh vấn đề một số ứng viên chức danh giáo sư được cho là đã công bố trên những tập san dỏm. Người ta cho rằng đó là “gian lận”, nhưng tôi không nghĩ vậy; tôi nghĩ vấn đề là vi phạm qui ước về publication ethics mà thôi.

https://nld.com.vn/giao-duc-khoa-hoc/gs-nguyen-van-tuan-dang-bai-tren-tap-san-dom-la-vi-pham-dao-duc-cong-bo-20201101213730725.htm

Theo GS Nguyễn Văn Tuấn, Viện Garvan (Úc), công bố bài báo khoa học trên tập san “dỏm” không phải là “tội”, mà là vi phạm đạo đức công bố (publication ethics). Ở Việt Nam, các trường ĐH không có huấn luyện về đạo đức công bố

.Phóng viên: Giáo sư (GS) từng chia sẻ đã cảnh báo về “kỹ nghệ” xuất bản bài báo khoa học “dỏm” cách đây 5 năm nhưng không được quan tâm. Đó có phải lý do mà năm trước khi thấy có ứng viên GS, phó giáo sư (PGS) có bài báo công bố trên những tập san phi chính thống ông đã không quyết liệt lên tiếng?

– GS NGUYỄN VĂN TUẤN: Kỹ nghệ xuất bản khoa học dỏm bắt đầu từ hơn 10 năm trước. Lúc đó (tức khoảng năm 2010 – 2012) các ĐH bên Úc đã từng lúng túng trong việc xử lý các hồ sơ đề bạt chức danh GS và đơn xin tài trợ cho nghiên cứu khoa học, vì ứng viên có những bài báo mà tên tập san rất “lạ”, người trong chuyên ngành không biết đến. Đó chính là những “predatory journal” hay “tập san săn mồi”, chứ không phải là những tập san khoa học chính thống.

Là người hay ngồi trong các hội đồng xét duyệt hồ sơ cho chức danh GS, tôi sớm nhận ra vấn đề này có thể sẽ ảnh hưởng đến các đồng nghiệp trong nước. Năm 2014, tôi viết bài đầu tiên về tiêu chí để nhận dạng tập san dỏm. Mấy năm sau đó, năm nào tôi cũng viết một hay 2 bài trên các tạp chí khoa học hay báo phổ thông trong nước để cảnh báo rằng kỹ nghệ xuất bản “dỏm” sẽ đến Việt Nam.

Nhưng dạo đó, công bố khoa học chưa là tiêu chuẩn để xét duyệt công nhận chức danh GS. Do đó, những cảnh báo của tôi chẳng ai quan tâm và chẳng ai chú ý. Tuy nhiên, các bạn trẻ và những người được đào tạo ở nước ngoài thì hiểu rõ những gì tôi cảnh báo. Năm ngoái, tôi cũng thấy vài ứng viên có bài trên các tập san “dỏm” và tôi nghĩ hội đồng ngành y sẽ báo cho ứng viên biết nhưng rất tiếc là việc đó không xảy ra.

Năm nay, từ tháng 9-2020, tôi đã nhận được vài thư của bạn đọc cho biết có nhiều ứng viên ngành y công bố trên tập san “dỏm” và tôi cũng nghĩ hội đồng sẽ báo cho ứng viên biết. Thế nhưng một lần nữa, việc đó không xảy ra.

.Nhiều ứng viên GS, PGS đang bị nghi ngờ gian dối vì đăng bài báo khoa học trên những tập san mở Open Access (OA). Tuy nhiên, GS lại cho rằng OA không phải là những tập san “dỏm”, ông có thể giải thích rõ hơn về điều này?

– Trước hết, tôi không nghĩ các ứng viên gian dối. Họ báo cáo đầy đủ những bài báo họ công bố theo đúng cái mẫu đơn của hội đồng, họ không giấu giếm gì cả, nên không thể nói họ gian dối được.

Để tôi nói thế này cho dễ hiểu: 100% các tập san “dỏm” OA nhưng 50% (tôi đoán) các tập san OA là chính thống. Do đó, không thể nói bài báo công bố dưới dạng OA là “dỏm” được. Để biết “dỏm” hay thật, phải biết tập san đó là chính thống hay phi chính thống.

Ví dụ, Osteoporosis International là tập san chính thống (thuộc Hiệp hội Loãng xương thế giới) cho phép tác giả công bố bài báo bằng mô thức truyền thống hay OA. Nếu tác giả chọn mô thức truyền thống thì ấn phí chừng 500 USD nhưng bản quyền thuộc về nhà xuất bản, độc giả phải trả tiền (chừng 30-50 USD) để đọc bài báo. Nếu tác giả chọn mô thức OA thì ấn phí là khoảng 1.500 USD nhưng bản quyền thuộc về tác giả và tất cả công chúng trên thế giới đều có thể truy cập được mà không cần phải trả chi phí.

Còn các tập san “dỏm” thì như nói trên tất cả đều là OA. Chính vì điều này mà nhiều người ngộ nhận rằng bài báo trên tập san OA là “dỏm”!

Nói cách khác, ứng viên công bố trên tập san OA không phải là cái “tội”. Công bố trên tập san “dỏm” cũng không phải là “tội”, mà là vi phạm đạo đức công bố (publication ethics). Cũng cần nói thêm rằng ở Việt Nam, các trường ĐH không có huấn luyện về đạo đức công bố, nên cũng khó có thể trách ứng viên.

.Nếu quan điểm của GS cho rằng các ứng viên GS, PGS không gian đối, vậy chúng ta sẽ ứng xử thế nào với những bài báo vi phạm đạo đức công bố?

– Rất dễ giải quyết: Không công nhận bất cứ bài báo nào trên các tập san “dỏm” hay tập san phi chính thống. Làm như vậy sẽ không chỉ đem lại công bằng cho các ứng viên khác công bố trên tập san chính thống, mà còn góp phần nâng cao phẩm chất nghiên cứu khoa học.

.Có ý kiến cho rằng việc mua bài để được công nhận chức danh đã có từ lâu chứ không phải đến nay. GS nghĩ sao về tiêu cực này?

– Có lẽ đúng như vậy. Ở bên Trung Quốc có những công ty truyền thông chuyên làm “nghiên cứu salon” (tức là dùng dữ liệu của người khác mà chẳng tự mình làm nghiên cứu thực nghiệm) sản xuất ra nhiều bài báo cho đủ thứ chuyên ngành. Họ bán bài báo cho người có nhu cầu nhưng họ chỉ lấy tiền (giá từ 5.000 đến 10.000 USD) khi bài báo được công bố. Bài báo trên tập san có hệ số IF càng cao thì giá càng cao. Có khi họ bán một bài báo cho nhiều “khách hàng”.

Ở Việt Nam cũng có thị trường bán bài báo kiểu này. Họ quảng cáo trên mạng về dịch vụ phân tích mướn và viết mướn. Họ thường tập trung vào các bài báo loại “case report” (báo cáo ca lâm sàng) và “meta-analysis” (phân tích tổng hợp) vì những bài báo loại này dễ thực hiện mà chẳng tốn công sức gì đáng kể, chỉ cần ngồi nhà cũng làm được.

.Quyết định 37 của Thủ tướng Chính phủ dù đã có nhiều đổi mới nhưng có vẻ vẫn chưa đủ thực chất và khiến người ta có thể dễ dàng “lách luật” như đã thấy. Làm thế nào để việc xét công nhận chức danh GS, PGS thực chất, không còn xu hướng công bố bài báo trên các “tập san săn mồi”?

– Tôi nghĩ Quyết định 37 có những thay đổi nhưng chưa đủ và có phần chưa thuyết phục. Chẳng hạn như quy định rằng “ứng viên PGS phải có ít nhất 3 bài báo quốc tế, GS phải có 5 bài báo quốc tế” là thấp và chưa rõ ràng. Nghiên cứu sinh ngày nay khi tốt nghiệp cũng có thể công bố ít nhất 2 bài báo khoa học trên các tập san trong danh mục ISI. Và, nếu nghiên cứu sinh qua giai đoạn hậu tiến sĩ 3 năm thì số bài báo khoa học tối thiểu là 6. Ấy vậy mà ứng viên PGS quy định chỉ có 3 bài thì khó thuyết phục.

Theo tôi, không nên quy định về số bài báo khoa học, vì số lượng không nói lên chất lượng. Đề bạt GS phải đặt nặng chất lượng chứ không phải chỉ đơn thuần số lượng. Có một chỉ số phản ánh cả số lượng và chất lượng, gọi là chỉ số H và đó mới là tiêu chuẩn tối thiểu để công nhận chức danh GS.

Ngoài ra, quy định không nói rõ thế nào là “bài báo quốc tế”. Đó là bài báo trên tập san nào? Đó là bài báo thuộc thể loại nào? Báo cáo ca lâm sàng, hay tổng quan, bình luận? Đây chính là một trong những lý do mà ứng viên có thể “lách” bằng cách công bố những bài đơn giản và chất lượng thấp trên tập san phi chính thống.

Tôi nghĩ vấn đề loại bỏ các tập san phi chính thống không khó. Tôi đề nghị trước hết chỉ công nhận các tập san trong danh mục Clarivate (tức ISI trước đây) vì đây là danh mục chọn lọc hơn Scopus. Cần nói thêm rằng danh mục Scopus có nhiều tập san đáng ngờ và “dỏm” và mỗi năm họ phải loại bỏ hàng 500 tập san vì gian lận về trích dẫn và… dỏm. Kế đến là chỉ dành ưu tiên cho các tập san do các hiệp hội khoa học chủ quản, hoặc/và xuất bản bởi các nhà xuất bản học thuật nổi tiếng như Elsevier, Springer-Nature, Wiley, Sage, Taylor & Francis, Routledge, Oxford, Cambridge, Harvard, MIT, Academic Press…

Cần soạn lại quy chuẩn đề bạt

Theo GS Nguyễn Văn Tuấn, để đề bạt GS theo chuẩn mực quốc tế thì cần phải soạn lại quy chuẩn. Chẳng hạn như phải phân biệt 2 ngạch GS: chuyên về nghiên cứu và chuyên về giảng dạy. Bộ tiêu chuẩn về công bố khoa học phải phản ánh sự khác biệt và công bằng giữa 2 ngạch. GS không phải chỉ là người công bố khoa học hay giảng dạy, mà còn phải có đóng góp cho xã hội (qua phản biện xã hội) cho chuyên ngành. GS còn phải chứng tỏ là một lãnh đạo tri thức được thể hiện qua các thước đo cụ thể. Do đó, tôi đề nghị 3 “trụ cột” tiêu chuẩn: nghiên cứu khoa học, giảng dạy và đóng góp cho xã hội và chuyên ngành.

Có thể sai lầm nếu xét công nhận giáo sư dựa vào Scopus, Pubmed

Xác định tập san khoa học chánh thống là trọng tâm trong việc xét duyệt công nhận chức danh giáo sư ở Việt Nam. Hội đồng giáo sư ngành y dựa vào danh mục Pubmed, Scopus, và Web of Science (WOS) là một tiến bộ. Nhưng tôi nghĩ vẫn tồn tại vấn đề, đặc biệt là danh mục Pubmed, Scopus và ESCI vẫn có những tập san phi chánh thống hoặc “tập san dỏm”.

“Tập san dỏm” được định nghĩa hay hiểu là những trạm xuất bản giả danh tập san khoa học chuyên xuất bản những bài báo lừa bịp để lấy tiền [1]. Các tập san này không thuộc bất cứ hiệp hội khoa học nào, và không có cơ chế bình duyệt nghiêm chỉnh, bởi vì họ không quan tâm đến khoa học mà chỉ là lợi nhuận. Các trạm xuất bản này còn được biết đến cái tên “Predatory Journals” hay “tập san săn mồi”. Hiện nay, trên thế giới có hơn 12,000 “tập san săn mồi”, mỗi năm công bố hơn 400,000 bài báo, và thị trường của họ hơn 74 triệu USD (số liệu 2014) [1].

‘Mồi’ của các tập san này là các nhà khoa học thường ở các nước phát triển. Nhưng ngay cả các nhà khoa học ở các nước tiên tiến cũng có khi trở thành ‘mồi’ của các tập san dỏm. Có nhiều lí do để người ta công bố trên tập san dỏm: áp lực công bố khoa học để giữ vị trí hay biên chế; tập san có công bố những bài hợp với nội dung bài báo của tác giả; vì nghiên cứu có chất lượng nghiên cứu thấp nên không thể công bố trên các tập san khác; vì bị các tập san khác (chánh thống?) từ chối. Khoảng 35% những người trả lời cho biết họ đã nộp bài báo cho một tập san chánh thống và bị từ chối, trước khi nộp cho tập san dỏm; vì được tập san dỏm mời công bố; và 41% cho biết họ chọn vì qua các email quảng cáo.

Ở Việt Nam, theo quan sát của chúng tôi, đã có ít nhứt 500 bài báo trên các tập san dỏm trong thời gian 10 năm qua. Hiện tượng công bố trên tập san dỏm đã xảy ra lâu, và ngay cả năm ngoái cũng có ứng viên chức danh công bố trên tập san dỏm.

Tập san dỏm chánh thống

Bên cạnh tập san dỏm là tập san tạm gọi là “chính thống”. Trên thế giới có hơn 100.000 tập san khoa học chính thống, nhưng chỉ có một số ít được công nhận. Công nhận ở đây hiểu theo nghĩa được chấp nhận đưa vào các danh mục như Web of Science (WoS, thuộc Công ty Clariavate Analytics), Scopus (thuộc tập đoàn xuất bản Elsevier), ESCI (Emerging Scources Citation Index, thuộc Công ty Clarivate Analytics), và Pubmed (thuộc Thư viện Quốc gia Mỹ).

Danh mục WoS được khởi động từ năm 1997, nhưng lịch sử hình thành thì đã có từ lúc công ti này thuộc Viện thông tin khoa học (ISI) do Eugene Garfield thành lập vào thập niên 1960. Các tập san được thu nạp vào danh mục WoS phải trải qua một quá trình tuyển chọn 3 bước và tương đối nghiêm ngặt. Hiện nay, số tập san trong WoS là 28.560, nhưng chỉ có 20.219 là còn hoạt động thường xuyên. Nhìn chung, các tập san trong WoS được cộng đồng khoa học và y khoa đánh giá cao.

Vì sự xuất hiện và tăng trưởng của mô thức xuất bản Mở (Open Access), năm 2015 Clarivate thành lập một danh mục khác có tên là ESCI. Như tên gọi, các tập san trong danh mục ESCI được xem là ‘mới nổi’ và vẫn còn trong giai đoạn ‘thách thức’ để được thu nạp vào WoS. Hiện nay, theo Clarivate số tập san trong danh mục ESCI là trên 7800, nhưng con số này tăng hàng năm.

Danh mục Scopus được tập đoàn xuất bản Elsevier thành lập vào năm 2004 như là một cạnh tranh với WoS của Clarivate. Số liệu năm 2019 cho thấy danh mục Scopus có 37.535 tập san, chỉ có 23.793 (tức 63%) là còn hoạt động thường xuyên [2].

Dĩ nhiên, có những tập san trong Scopus cũng có trong WoS. Riêng ngành y, tỷ lệ trùng hợp giữa hai danh mục là 46% [2]. Nhiều tập san y khoa trong Scopus không có trong WoS, nhưng tất cả tập san y khoa trong WoS thì đều có trong Scopus.

Vấn đề của danh mục Scopus

Nhìn chung, các tập san trong chuyên ngành y sinh học thuộc danh mục WoS chọn lọc hơn Scopus. Những con số trên cũng gián tiếp xác định điều đó. Lý do là WoS có những tiêu chuẩn nghiêm ngặt hơn Scopus để thu nạp tập san vào danh mục. Một tập san khoa học phải đạt 28 tiêu chuẩn về chất lượng, ban biên tập, cơ chế bình duyệt, tầm ảnh hưởng ,v.v. của WoS. Không chỉ đạt 28 tiêu chuẩn mà còn phải qua 3 bước, và đa số tập san bị từ chối ở bước đầu.

Tiêu chuẩn để vào danh mục Scopus có phần dễ dãi hơn WoS, và bao gồm: Có cơ chế bình duyệt rõ ràng; bài vở mang tính đa dạng địa phương (tức tác giả đến từ nhiều quốc gia); có đóng góp học thuật vào chuyên ngành; bản tóm tắt (abstract) rõ ràng; tuân thủ theo quy định về chất lượng và nội dung học thuật; bài báo dễ đọc và theo quy chuẩn chung; có trích dẫn các tập san trong Scopus; ban biên tập gồm những nhà khoa học danh tiếng; trang web có đầy đủ thông tin về đạo đức công bố và chi phí.

Chất lượng của tập san khoa học gắn liền với uy tín và tầm ảnh hưởng. Uy tín và tác động của một tập san có thể đo qua nhiều chỉ số, gồm: hệ số ảnh hưởng (impact factor, IF), chỉ số eigenfactor (EF), chỉ số H [3]. Tất cả đều ít hay nhiều dựa vào số lần các tác giả trích dẫn bài báo. Trong mỗi chuyên ngành, tập san nào có nhiều trích dẫn hay chỉ số IF cao thì đó là tín hiệu cho thấy nó có uy tín cao.

Vì các tập san có uy tín khác nhau, người ta phải tìm một cách phân nhóm. Nhóm SCImago dùng dữ liệu của Scopus và có sáng kiến phân nhóm theo tứ phân vị (quartile). Trong mỗi chuyên ngành, SCImago dùng số lần trích dẫn trong 3 năm, rồi chia các tập san trong chuyên ngành đó thành 4 nhóm: Q1 (quartile 1) bao gồm các tập san có trích dẫn cao top 25%; Q2 là các tập san nhóm 25-50%; Q3 là nhóm 75%; và Q4 là tứ phân vị 75-100% (thấp nhất).

Thường các tập san dỏm được xếp vào nhóm Q4 hay Q3, nhưng cũng có tập san leo lên nhóm Q2. Thậm chí, có tập san mới ra đời 2-3 năm được xếp vào nhóm Q1. Điều này cho thấy cách phân nhóm có vấn đề. Không đại học nào ở Australia dùng cách phân nhóm tập san của SCImago để đánh giá ứng viên.

Một sự thật ít người chú ý đến là nhiều tập san dỏm và phi chính thống có thể được “kết nạp” vào danh mục Scopus. Các tập san này cố gắng đạt tiêu chuẩn của Scopus, nhưng sau khi đã được thu nạp thì người ta mới phát hiện họ làm việc không theo đúng các quy ước về đạo đức công bố (publication ethics).

Những vi phạm về đạo đức công bố của các tập san dỏm thường là ban biên tập “ma”, tức không có người thật hay người giả mạo; cơ chế bình duyệt không nghiêm chỉnh; mưu mẹo để có trích dẫn và tăng impact factor; khuynh đảo học thuật có tổ chức. Có một số tập san được thu nhận vào Scopus nhưng chất lượng ban biên tập, bình duyệt, bài báo và nhất là quá trình phát triển về trích dẫn của tập san này (chủ yếu từ các tác giả Ấn Độ) rất đáng ngờ đối với dân trong chuyên ngành.

Số lượng tập san dỏm hay phi chính thống trong Scopus có thể nói là nhiều nhất so với các danh mục khác, và do đó thường bị loại khỏi danh mục. Chẳng hạn năm 2017, có hơn 600 tập san bị loại khỏi danh mục Scopus. Theo một phân tích, khoảng 46% tập san trong nhóm Q4, 41% trong nhóm Q3, 10% trong nhóm Q2 và 3% trong nhóm Q1 bị loại [4]. Ngoài ra, một phân tích trên 944 tập san được xác định là dỏm, thì có đến 56 tập san có trong danh mục Scopus [5].

Nhưng mỗi năm cũng có vài trăm tập san được thu nạp vào Scopus. Nói cách khác, sự “chu chuyển” của các tập san trong danh mục Scopus là khá cao. Nhưng điều quan trọng là số tập san dỏm trong Scopus nhiều đến mức độ phải xem xét tiểu chuẩn về chất lượng. Đó chính là lý do cộng đồng khoa học không bao giờ đánh giá xếp hạng theo Q1-Q4 là đáng tin cậy [4].

Vấn đề của danh mục Pubmed

Pubmed thực chất không phải là danh mục mà là thư viện trực tuyến cho chuyên ngành y sinh học. Pubmed do Thư viện Quốc gia Mỹ quản lý. Nói là thư viện của Mỹ, nhưng thật ra đó là thư viện y sinh học toàn cầu, là nơi các bác sĩ, nhân viên y tế, nhà khoa học tham khảo hàng ngày. Tính trung bình mỗi ngày có hơn 2,5 triệu người trên khắp thế giới sử dụng Pubmed.

Số tập san trong thư viện Pubmed khoảng 7.000, nhưng con số này tăng mỗi năm. Số bài báo khoa học trong thư viện Pubmed khoảng 27 triệu và tăng mỗi ngày. Một số bài báo trong Pubmed được lưu trữ dưới dạng miễn phí (tức Pubmed Central hay PMC).

Nhưng Pubmed ngày càng có vấn đề. Trong vài năm gần đây, bất cứ ai có kinh nghiệm sử dụng Pubmed đều thấy những “tập san lạ” mà người trong chuyên ngành chưa bao giờ biết đến hay thuộc bất cứ hiệp hội khoa học nào. Nói thẳng đó là những tập san dỏm hay phi chính thống, vì chỉ cần đọc vài bài trên các tập san đó là người trong ngành nhanh chóng nhận ra những bài báo bậy bạ. Có những bài quảng bá cho những liệu pháp điều trị nguy hiểm.

Do đó, giới y khoa rất quan tâm đến chất lượng của Pubmed và họ đã cảnh báo nhiều lần. Theo giáo sư Franca Deriu, người từng nghiên cứu về tập san dỏm trong Pubmed, đã có hơn 200 tập san dỏm trong lĩnh vực y sinh học trong Pubmed. Trong một bài bình luận trên Lancet [6], giáo sư Deriu và đồng nghiệp đã cảnh báo tình trạng này và yêu cầu Pubmed phải có những tiêu chuẩn tốt hơn nữa để sàng lọc tập san dỏm.

Chỉ chuyên ngành thần kinh học, có hơn 10% các tập san trong chuyên ngành này trong Pubmed được giới chuyên gia đánh giá là dỏm [7]. Một nghiên cứu khác cho thấy các danh mục như Scopus thậm chí còn có nhiều tập san dỏm hơn Pubmed [8].

Vấn đề của danh mục ESCI

Như đề cập trên, ESCI là một danh mục bao gồm những tập san khoa học mới ra đời, nhưng chủ yếu là Open Access. Thường, những tập san này mang tính địa phương, nhưng có tiềm năng trở thành những tập san đáng tin cậy.

Tuy nhiên, vì tiêu chuẩn thu nạp các tập san này có phần dễ dãi (so với WoS), nên một số tập san dỏm cũng len lỏi vào. Chẳng hạn như một phân tích trên Medical Archives [5] năm 2020 phát hiện 28 tập san dỏm (trong số 944) được thu nạp vào ESCI! Như vậy số tập san dỏm trong ESCI chỉ kém hơn Scopus, nhưng tỉ lệ tập san dỏm trong ESCI có thể cao hơn 2 lần so với Scopus [9].

Sự thật này cho thấy các hội đồng xét duyệt chức danh giáo sư phải rất cẩn thận với những ứng viên có công bố trên các tập san trong danh mục ESCI.

Chọn tập san nào cho việc xét duyệt chức danh giáo sư?

Bảng dưới đây tóm tắt và so sánh qui mô của sự hiện diện của các tập san dỏm trong các danh mục WoS, Scopus, Pubmed và ESCI. Những dữ liệu thực tế trong bảng cho thấy rõ ràng rằng Scopus, Pubmed và ESCI có vấn đề về tiêu chuẩn chọn tập san khoa học.

Qua những phân tích và sự thật trên, rất dễ thấy quyết định của Hội đồng Giáo sư Nhà nước dựa vào cách xếp hạng tập san trong danh mục theo Q1-Q4 (của SCImago), Pubmed, và ESCI là có vấn đề. Dựa vào 3 danh mục này một cách vô điều kiện, theo tôi có thể dẫn đến sai lầm và bất công. Khả năng sai lầm là vì tập san A năm nay được công nhận (theo quy định của hội đồng) nhưng năm sau bị loại ra, và như thế là gây bất công cho các ứng viên khác.

Tôi đề nghị một cách phân loại tập san chính thống và phi chính thống. Tập san chính thống do các hiệp hội khoa học chính thống làm chủ quản và xuất bản bởi các nhà xuất bản học thuật; hoặc do các nhà xuất bản học thuật (như Elsevier, Springer-Nature, Wiley, Sage, Taylor & Francis, Routledge, Oxford, Cambridge, Harvard, MIT, Academic Press) lập ra nhưng được công nhận bởi cộng đồng khoa học. Chỉ chấp nhận tập san trong danh mục WoS hoặc/và do hiệp hội khoa học quản lý vì tuyển chọn theo tiêu chuẩn tương đối nghiêm ngặt.

Tiêu biểu cho nhóm tập san thứ nhất là JAMA (thuộc Hiệp hội Y khoa Mỹ), BMJ (Hiệp hội Y khoa Anh), New England Journal of Medicine (thuộc Hiệp hội Y khoa bang Massachusetts – Mỹ), JCEM (Hiệp hội Nội tiết Mỹ). Nhóm hai bao gồm các tập san thuộc nhóm Lancet, Nature, eLife, PLoS Medicine, v.v. Không cần phân nhóm Q1-Q4 theo cách làm của SCImago bởi các tiêu chuẩn tôi nói ở trên đã tự động loại bỏ các tập san dỏm và phi chính thống.

Ngoài ra, cần lưu ý có những tập san mới thuộc các hiệp hội khoa học có thể chưa có trong Scopus hay WoS, nhưng là chính thống. Ví dụ Journal of Endocrine Society, Osteoporosis and Sarcopenia, JBMR Plus. Những tập san này nên được công nhận. Dĩ nhiên, chỉ có người có kinh nghiệm trong chuyên ngành mới có thể đánh giá chính xác tập san dỏm và chính thống.

Vấn đề đạo đức công bố

Tôi nghĩ vấn đề cấp bách hiện nay là đạo đức công bố. Theo một nghiên cứu tìm hiểu tại sao các nhà khoa học công bố trên tập san dỏm [10], các tác giả đưa ra 3 nhóm lý do: thể chế, kiến thức và chất lượng khoa học.

Lý do thể chế ở đây là đại học gây áp lực lên nhà khoa học về công bố khoa học, nhưng đại học lại không có chính sách về công bố khoa học và không có hình phạt những người công bố trên tập san dỏm. Thứ hai là bản thân nhà khoa học kém kiến thức về đạo đức công bố, không phân biệt được tập san dỏm và chính thống. Thứ ba là những người biết rõ tập san dỏm nhưng vẫn chọn công bố vì bài báo của họ có chất lượng thấp hoặc/và bị các tập san chính thống từ chối công bố.

Theo một khảo sát, khoảng 35% người trả lời cho biết đã nộp bài báo cho một tập san chính thống và bị từ chối, trước khi nộp cho tập san dỏm vì được tập san dỏm mời công bố; và 41% cho biết chọn vì qua các email quảng cáo [10].

Kỹ nghệ xuất bản dỏm làm vẩn đục khoa học, nhưng công bố trên những tập san dỏm không phải là gian lận khoa học, mà là vi phạm quy ước về đạo đức công bố (publication ethics). Đạo đức công bố bao gồm những điều lệ và quy ước giúp nhà khoa học phân biệt được tập san chính thống và phi chính thống và không công bố trên tập san dỏm.

Các đại học Việt Nam chưa có quy ước về đạo đức công bố. Do đó, tôi nghĩ các trường có thể tham khảo quy chuẩn về đạo đức công bố ở nước ngoài (như Đại học UNSW chúng tôi) để có chính sách rõ ràng về công bố khoa học và phải minh định rằng công bố trên tập san dỏm sẽ không chấp nhận. Những lớp tập huấn về đạo đức công bố dành cho tất cả nghiên cứu sinh, giảng viên và giáo sư là rất cần thiết. Làm được như vậy thì các tập san dỏm sẽ khó có cơ hội xâm nhập khoa học ở Việt Nam.

Tham khảo:

[1] Nguyễn Văn Tuấn. “Cẩm nang nghiên cứu khoa học: Từ ý tưởng đến công bố“. Nhà xuất bản Tổng Hợp TPHCM, 2017. Tái bản 2018, 2019, 2020 (trang 352-367).

[2] Texas A&M University Libraries. Web of Science versus Scopus: Journal Coverage Overlap Analysis.

[3] Nguyễn Văn Tuấn. Những thước đo để đánh giá tập san khoa học. Tạp chí Khoa học và Phát triển 28/4/2018.

[4] Cortegianiaet al. Inflated citations and metrics of journals discontinued from Scopus for publication concerns: the GhoS(t)copus Project. bioRxiv preprint doi: https://doi.org/10.1101/2020.03.26.007435.

[5] Nguyen Minh Duc, et al. Predatory Open Access Journals are Indexed in Reputable Databases: a Revisiting Issue or an Unsolved Problem. Med Arch 2020; 74(4): 318-322.

[6] Manca et al. PubMed should raise the bar for journal inclusion. Lancet 2017;390:734-5.

[7] Fiorini et al. Towards PubMed 2.0. eLife 2017; 6: e28801.

[8] Manca et al. Predatory Open Access in Rehabilitation. Archives of Physical Medicine and Rehabilitation 2017;98:1051-6.

[9] Somoza-Fernández et al. Presence of alleged predatory journals in bibliographic databases: analysis of Beall’s list. Melcior de Palau, 140. 08014 Barcelona.

[10] Cobey et al. Knowledge and motivations of researchers publishing in presumed predatory journals: a survey. BMJ Open 2019;9:e026516.

Phiên bản trên VNexpress

https://vnexpress.net/co-the-sai-lam-neu-xet-cong-nhan-giao-su-dua-vao-scopus-pubmed-4184968.html