Điểm sách “Nhiễu – sai sót trong phán quyết của con người”

Trong mùa dịch này tôi đọc vài cuốn sách hay. Hôm nay, tôi muốn giới thiệu đến các bạn một cuốn sách có tựa đề là ‘Noise: A Flaw in Human Judgment’ (Nhiễu: sai sót trong phán quyết của con người) [1]. Tôi tin rằng cuốn sách này sẽ làm cho chúng ta nhìn lại những phán xét cá nhân trong quá khứ, và giúp cho chúng ta sống tốt hơn và làm việc tốt hơn.

Chuyện tương đối thời sự. Cuộc tháo chạy của công nhân nghèo từ các khu công nghiệp ở Sài Gòn, Bình Dương, Đồng Nai, Long An, v.v. về quê làm nổi bật sự khác biệt về chủ trương giữa các tỉnh đối với cư dân mình. Có nơi thì tuyên bố nhận dân mình về, có nơi thì không. Có nơi hôm trước thì hùng hồn nói rằng sẽ cho xe đón bà con về quê, nhưng hôm sau thì quay ngược 180 độ. Có nơi đề ra những qui định phức tạp mà hậu quả là làm khổ người dân. Lại có nơi tỏ ra tàn ác đến độ tiêu diệt đến 16 con chó và mèo. Người ta phải ngao ngán thốt lên rằng đại dịch này làm lộ rõ 62 sứ quân.

Ngay cả cấp cầm quyền cao nhứt cũng trước sau bất nhứt. Hôm thì tuyên bố rằng công nhân không được về quê, ai ở đâu thì ở yên đó. Hôm sau lại tuyên bố rằng bà con về quê là chính đáng, và các tỉnh không nên ngăn chận họ. Sự thay đổi như chong chóng đó làm cho người dân không biết đường đâu mà mò. Và, hậu quả là những thay đổi và bất nhứt đó làm xói mòn niềm tin của người dân.

Một cuốn sách mới xuất bản (Nhiễu – sai sót trong phán quyết của con người) có thể giúp chúng tahiểu hơn về những thay đổi và bất nhứt đó, ít ra là về mặt tâm lí con người. Cuốn sách dài hơn 400 trang chỉ để luận về … nhiễu. Nói theo tiếng Anh, nhiễunoise. Đây là một đề tài rất quan trọng, nhưng ít khi nào được bàn đầy đủ bằng một văn phong và công chúng ngoài khoa học có thể hiểu được. Nhưng ba tác giả (cũng là ba giáo sư nổi tiếng) DanielKahneman (Giải Nobel kinh tế 2002), Olivier Sibony và Cass R. Sunstein đã làm được cái việc đó.

1. Nhiễu là gì?

Những ai làm nghiên cứu y khoa hay học về dịch tễ học và thống kê học, thì chắc chắn không lạ gì khái niệm nhiễu. Đối với thống kê học, nhiễu là những khác biệt ngẫu nhiên mà chúng ta quan sát hàng ngày. Hôm nay, chúng ta lái xe trên con đường quen thuộc với tốc độ 60 km/giờ, nhưng hôm sau thì 62 hay 55 km/giờ dù điều kiện đường xá không khác nhau. Nếu bạn đo huyết áp nhiều lần và mỗi lần cách nhau vài phút, kết quả sẽ là một dãy số huyết áp dao động chung quanh một con số nào đó. Ví dụ như 10 giá trị dao động chung quanh con số trung bình 120 mmHg:

Giá trị quan sát:

118, 121, 120, 119, 120, 117, 122, 118, 121, 121

Sai lệch từ trung bình 120 mmHg:

-2,  1,  0, -1,  0, -3,  2, -2,  1,  1

Những khác biệt hai sai lệch giữa mỗi giá trị quan sát từ con số trung bình được gọi là error hay sai sót (hay nói theo thuật ngữ khoa học là sai số). Nhiễu là một thành tố của sai sót, và chúng ta sẽ quay lại phát biểu này trong phần dưới đây.

Tính đặc thù của nhiễu là ngẫu nhiên. Vì là ngẫu nhiên, nên nhiễu không tuân theo qui luật nào cả, và do đó chúng ta không thể tiên đoán được. Nhưng trong cuốn sách này, ba tác giả khai thác chủ đề nhiễu qua lăng kính của tâm lí – xã hội học, và kết quả là một khai sáng cho tất cả chúng ta.

Nhiễu, đối với tâm lí học, là gì? Tác giả lấy một ví dụ về án phạt (trang 14-15) để minh hoạ cho định nghĩa về nhiễu. Hai người [không có tiền sử tội phạm] dùng tiền giả, một người dùng tiền giả trị giá 58.4 USD bị phạt 15 năm tù; còn người dùng tiền giả trị giá 35.2 USD bị phạt tù 30 ngày. Một trường hợp so sánh khác cũng thú vị không kém: hai người cùng phạm tội biển thủ với số tiền tương đương nhau, nhưng người thì bị phạt 17 ngày tù, còn người kia thì 20 năm tù.

Chúng ta kì vọng rằng nếu những phạm nhân phạm một tội và hoàn cảnh giống nhau, thì hình phạt cũng tương đương nhau. Nhưng trong thực tế, như thấy trên, các phạm nhân có tội gần giống nhau và hoàn cảnh cũng giống nhau, nhưng phán quyết của chánh án thì quá khác nhau. Sự khác biệt về mức độ án phạt đó được xem là nhiễu.

Nhiễu rất phổ biến trong nền công lí, và nó làm xói mòn uy tín và niềm tin vào công lí. Ở Việt Nam, chúng ta đã quá quen thuộc với những bản án ‘trời ơi’. Một thanh niên ở Kiên Giang với tội ăn trộm 1 con vịt về nhậu, và anh ta bị Tòa án nhân dân huyện Châu Thành (Tỉnh Kiên Giang) xử phạt 7 năm tù giam. Ở Trà Vinh, một thanh niên ăn trộm 1 con gà và 1 con vịt trị giá chưa tới 200,000 đồng, và anh ta bị phạt 2 tháng tù giam. Ở Khánh Hoà, 2 thanh niên cũng phạm tội ăn trộm 3 con vịt trị giá 360,000 đồng, và họ bị phạt tổng cộng 15 tháng tù. Những cái nhiễu trong án phạt như thế làm cho công chúng không tin vào nền công lí Việt Nam.

Nhiễu không chỉ ảnh hưởng đến công lí, mà còn gây tác động tiêu cực đến hầu như bất cứ khía cạnh nào trong xã hội. Những thay đổi về chủ trương chống dịch, những sự bất nhứt về cách đối xử với làn sóng công nhân nghèo về quê mà tôi đề cập trên cũng chính là nhiễu. Chúng ta ngao ngán trước sự nhiễu loạn về quyết định của các giới chức, nhưng chúng ta ít khi nào để tâm suy nghĩ về nguồn gốc và ý nghĩa của nhiễu. Giới thống kê học xem nhiễu là ngẫu nhiên, và xem thế là … xong. Do đó, nhiễu rất ít được nghiên cứu bài bản. Cuốn sách này lấp vào khoảng trống tri thức đó.

2. Bias là gì ?

Nhiễu có liên hệ với một khái niệm khác được định danh là bias. Nhưng nhiễu khác với bias. Chữ bias (có thể hiểu và dịch là sai lệch) có nhiều nghĩa trong thống kê học, dịch tễ học, và tâm lí học.

Theo nghĩa thống kê học và dịch tễ học, bias là giá trị quan sát bị lệch từ giá trị thật. Tôi không biết mật độ xương thật của bạn là bao nhiêu, nhưng tôi có thể dùng phương tiện vật lí để đo, và giá trị từ thước đo đó chỉ là giá trị quan sát, nó có thể khác với giá trị thật, và mức độ khác biệt đó được gọi là bias. Ngoài ra, bias còn có thể hiểu là mức độ sai lệch giữa một ước số từ mẫu và tham số từ quần thể. Chẳng hạn như chiều cao thật của nam thanh niên Việt Nam là 170 cm, nhưng ước số từ mẫu nghiên cứu là 168 cm, thì bias được định lượng là 2 cm. Đa số những ai học dịch tễ học đều biết rằng bias là xuất phát từ thiết kế nghiên cứu, thu thập dữ liệu, đo lường, phân tích dữ liệu, diễn giải dữ liệu dẫn đến kết luận sai lệch so với sự thật.

Trong tâm lí học, bias được định nghĩa là xu hướng hay thiên kiến đối với một cá nhân hay sự việc, và do đó có thể dịch là thiên lệch hay thiên kiến. Một loại thiên lệch quan trọng trong tâm lí học là cognitive bias (thiên lệch về nhận thức), là sự thiên lệch chống lại một cá nhân, một nhóm người, sự vật, và thường thường là không công bằng. Chẳng hạn như chúng ta có xu hướng sàng lọc thông tin sao cho phù hợp với niềm tin của chúng ta. Do đó, thiên lệch là một xu hướng tự nhiên, là sản phẩm của bản chất con người. Thiên lệch có thể ảnh hưởng đến các quyết định của chúng ta.

3.  Sai sót = Thiên lệch + Nhiễu

Cả ba định nghĩa về bias trong thống kê học, dịch tễ học, và tâm lí học trên đều nói lên một mẫu số chung: bias là sai sót (error). Nói đúng ra là bias là một phần của sai sót (error). Trong Noise Daniel Kahneman, Cass Sunstein, và Olivier Sibony lí giải rằng sai sót bao gồm sai lệch và nhiễu:

Error = Bias + Noise

Trong quá khứ (và cho đến nay), công chúng thường nghe đến thiên lệch, rất ít ai nghe đến nhiễu vốn là một địa hạt của giới khoa học.

Nhưng làm sao chúng ta có thể đo lường sai sót? Tác giả chỉ ra rằng thiên lệch và nhiễu là hai nguồn sai sót, và hai nguồn này độc lập với nhau. Nói theo ngôn ngữ thống kê học, nhiễu và thiên lệch là orthogonal. (Trong bài này, tôi dùng hai chữ đó, sai lệch và thiên lệch, với nghĩa như nhau).

Chúng ta còn nhớ Định lí Pythagoras được học từ thời trung học về tam giác vuông: bình phương cạnh huyền bằng tổng bình phương của hai cạnh góc vuông. Tương tự, các tác giả lập luận rằng bình phương của sai sót bằng bình phương của thiên lệch cộng với bình phương của nhiễu:

Error2 = Bias2 + Noise2

Nói cách khác, chúng ta phạm phải sai sót là do thiên lệch và nhiễu. Phân tích và hiểu được 2 yếu tố này có thể giúp chúng ta điều chỉnh hành vi và quyết định sao cho bớt sai sót trong tương lai.

4.  Nhiễu hệ thống và nhiễu ngẫu nhiên

Các tác giả phân tách thêm rằng nhiễu có thể chia thành 2 bậc: level noisepattern noise. Trong trường hợp toà án và hình phạt, level noise phản ảnh sự khác biệt về giá trị trung bình giữa các chánh án, và do đó nó cũng phản ảnh sự thiên lệch hay bias. Còn pattern noise phản ảnh sự khác biệt giữa các bản án trong mỗi chánh án. Nói theo ngôn ngữ thống kê (phân tích phương sai), level noise là between-judge variation và pattern noise là within-judge variation. Theo tôi, có thể dịch level noise là ‘nhiễu có hệ thống‘ và pattern noise là ‘nhiễu ngẫu nhiên‘.

Thật ra, cách phân tách này không mới. Hơn 100 năm trước, nhà thống kê học thiên tài Ronald Fisher đã nghĩ đến cách phân tách này, và ông sáng chế ra phương pháp phân tích phương sai (Analysis of Variance). Fisher cũng là người dùng thuật ngữ ‘mean square error‘ (sau này là mean squared error) như là một thước đo về nhiễu. Trong một bài luận về di truyền học năm 1905, Fisher viết:

“[…] the amount of variability may be measured, as errors of observation are habitually measured, by the mean of the squares of the deviations of different individuals from the mean, this mean square deviation being strictly comparable to the mean square error used in astronomy and in all physical science.”

Trong thực tế, MSE là phương sai của sai sót. Theo cách phân tích của tác giả, MSE bao gồm 2 nguồn: bias (sai lệch) và noise (nhiễu).

MSE = bias + noise

Nhiễu được chia thành 2 nguồn: level noise (nhiễu hệ thống) và nhiễu pattern noise (nhiễu ngẫu nhiên). Nhiễu ngẫu nhiên được chia thành 2 nguồn nhỏ: stable pattern noise và occasional noise. Nguồn: tác giả.

Tác giả lí giải rằng nhiễu ngẫu nhiên bàng bạc trong những phán xét của con người, và loại nhiễu này thường cao hơn nhiễu hệ thống. Chẳng hạn như quyết định đề bạt nhân viên của các chủ doanh nghiệp, quyết định của bác sĩ có nên cho nhập viện, các công ti bảo hiểm xác định tiền niên liễm, quyết định chấp nhận hay từ chối bài báo khoa học, v.v. tất cả đều phản ảnh nhiễu ngẫu nhiên. Nó xuất phát từ sự lệch lạc của mỗi cá nhân từ xu hướng chung của cá nhân đó.

Nhiễu ngẫu nhiên có thể chia thành 2 nguồn độc lập: stable pattern noise occasional noise. Tác giả giải thích rằng stable pattern noise là nhiễu xuất phát từ các yếu tố ‘nội tại’ như cá tánh của một cá nhân. Còn occasional noise là nhiễu do các yếu tố ngoại cảnh như thời tiết và các yếu tố lệ thuộc vào thời gian của quyết định.

Nhiễu trong y khoa

Ở Chương 22, tác giả dành ra khá nhiều trang để bàn về nhiễu trong y khoa. Có thể xem việc chẩn đoán bệnh là một hình thức judgment – phán đoán. Đối với nhiều bệnh lí, việc chẩn đoán là tương đối máy móc, theo đó những qui định và qui trình được đặt ra để giảm thiểu nhiễu. Chẳng hạn như bác sĩ có thể chẩn đoán gãy cổ xương đùi một cách dễ dàng và ít có nhiễu trong trường hợp này. Hay như chẩn đoán loãng xương, bác sĩ chỉ cần dựa vào mật độ xương và một tính toán để xác định bệnh nhân bị hay không bị loãng xương, vì qui định rất rõ ràng. Vào những ngày đầu tiên của dịch Covid-19, các bác sĩ phải dựa vào triệu chứng để chẩn đoán, và rất nhiều sai sót đã xảy ra. Nhưng sau này thì có các phương tiện xét nghiệm như PCR nên sai sót trong chẩn đoán ít hơn. 

Nhưng một số không ít các trường hợp phải dựa vào phán đoán của bác sĩ, và trong các trường hợp này thì nhiễu xảy ra. Đã có rất nhiều nghiên cứu về sự khác biệt trong chẩn đoán bệnh viêm phổi giữa các bác sĩ quang tuyến. Đa số những khác biệt này là do kĩ năng lâm sàng của bác sĩ. Theo một nghiên cứu, khoảng 44% các khác biệt về chẩn đoán giữa các bác sĩ là do khác biệt về kĩ năng. Điều này có nghĩa là để giảm sai sót hay nhiễu, cần phải có chương trình nâng cao kĩ năng cho bác sĩ hơn là dựa vào những phác đồ chẩn đoán.

Trong y khoa, những khác biệt về chẩn đoán và đánh giá giữa các bác sĩ được gọi là inter-rater reliability, và được định lượng bằng chỉ số thống kê có tên là kappa statistic. Giá trị kappa càng gần 1 có nghĩa là mức độ nhiễu càng thấp. Chẩn đoán mức độ nghiêm trọng của bệnh thoái hoá khớp gối có chỉ số kappa chỉ cỡ 0.6, nói lên rằng sự khác biệt giữa các bác sĩ rất lớn. Và, mức độ nhiễu này có thể ảnh hưởng đến quyết định điều trị cho bệnh nhân. Với bác sĩ A, bệnh nhân có thể không cần dùng thuốc, nhưng với bác sĩ B thì bệnh nhân có thể phải dùng thuốc.

Trong Chương 22, tác giả đưa ra hàng loạt những nghiên cứu về nhiễu trong việc chẩn đoán các bệnh như tim mạch, ung thư, tâm thần, v.v. Họ cũng chỉ ra rằng giới y khoa đã có nhiều nỗ lực làm giảm nhiễu trong chẩn đoán bằng cách xây dựng các phác đồ chẩn đoán và điều trị, bằng các mô hình thống kê, và qua hội chẩn.

Làm gì để giảm nhiễu?

Nhiễu cũng có nguồn gốc từ tâm lí. Câu hỏi đặt ra là chúng ta có thể thay thế sự phán xét của con người bằng máy? Chúng ta có nên lấy nhiều phán xét và trung bình hoá để giảm nhiễu? Quan điểm từ nhiều người tốt hơn quan điểm của một cá nhân? Các tác giả không nghĩ vậy, và cảnh báo chúng ta nên cẩn thận. Chúng ta hay thấy trong các buổi họp, người đầu tiên phát biểu thường ảnh hưởng kết cục, vì những người khác có xu hướng theo người phát biểu đầu tiên. Do đó, chưa chắc tập thể tốt hơn cá nhân.

Cuốn sách này không chỉ dành cho giới chuyên môn (tâm lí học, xã hội học, dịch tễ học, thống kê học), mà người ngoài khoa học vẫn có thể tìm thấy nhiều thông tin và khá niệm liên quan. Hiểu và phân biệt được nguồn gốc của nhiễu và sai lệch giúp cho công chúng tự đánh giá quyết định và các mối tương tác hàng ngày. Tác giả làm cho chúng ta ghi nhận sự bất định và tự mâu thuẫn trong mỗi chúng ta. Cá nhân tôi phục vụ trong vai trò chair, biên tập và chuyên gia bình duyệt trong các hội đồng, hiệp hội khoa học, tập san y khoa, v.v. phải nhìn lại những quyết định của mình trong quá khứ. Cuốn sách này giúp cho tôi nhận ra sự yếu ớt và bất định của cá nhân mình.

Điều làm tôi thấy tâm đắc trong cuốn sách là tác giả chỉ ra rằng các mô hình thống kê tuy nhìn vào thì có vẻ máy móc nhưng lại đưa ra những ‘phán xét’ tốt hơn hẳn con người. Chẳng hạn như trước một bệnh nhân loãng xương, bác sĩ thường đánh giá sai nguy cơ gãy xương và tử vong, nhưng các mô hình thống kê thì lại cho ra những tiên lượng chẳng những nhứt quán và còn chính xác. Trong tương lai, các mô hình AI (trí năng nhân tạo) có thể giúp cho con người đánh giá chính xác hơn trong những tình huống phức tạp.

Tuy nhiên, các tác giả cũng nhấn mạnh rằng các mô hình thống kê hay thuật toán không thể nào thay thế phán xét của con người một cách vô điều kiện. Nhưng trong điều kiện nào thì mô hình và thuật toán có thể thay thế con người thì chưa biết, và đặt ra câu hỏi về vai trò của con người trong tương lai. Cuốn sách này sẽ làm thay đổi cách mà chúng ta suy nghĩ về quyết định của con người, và cách chúng ta sử dụng máy móc trong đời sống.

Học được gì từ cuốn sách?

Gấp lại cuốn sách, tôi tự hỏi mình học được gì từ cuốn sách này? Thành thật mà nói, tôi không học được nhiều, và ước gì tác giả có thể cho ra một tác phẩm đầy đủ hơn. Tác giả cho biết nhiễu rất phổ biến trong đời sống, nhưng có lẽ chúng ta phải sống chung với nhiễu như bao nhiêu vấn đề bất tiện khác. Những phân tích về nhiễu của tác giả không phải là phát kiến mới, bởi vì những bộ óc vĩ đại về thống kê học đã phân tích nhiều rồi và đã hơn 100 năm. Ấy vậy mà tác giả ví von những phân tích của họ như là một khám phá về một lục địa mới (“discovered a new continent”)! Có lẽ hơi quá đáng, vì trong quá khứ chủ đề này đã được ‘khám phá’ và phân tích nhiều rồi. Điều đáng tiếc là cuốn sách không đề cập đến Ronald Fisher, Fischer Black và William Deming, những người đã viết nhiều về nhiễu.

Ronald Fisher, người đầu tiên nghĩ ra khái niệm variation (mà tác giả gọi là noise), nhưng tác giả không đề cập đến Fisher trong cuốn sách.
Một bài luận nổi tiếng của Fischer Black về nhiễu cũng không được đề cập đến trong sách của Kahnenam, Sibony, and Sunstein.

Ngoài ra, tác giả cũng tỏ ra không am hiểu thống kê học. Họ xem ‘between-variation’ là ảnh hưởng tương tác (interaction effect) là một sự hiểu sai rất đáng tiếc. Khái niệm interaction rất khác với dao động giữa các nhóm. Họ còn tỏ ra hiểu sai về tương quan (correlation) và nhân quả (causation): họ viết “while correlation does not imply causation, causation does imply correlation. Where there is a causal link, we should find a correlation” (tương quan không ám chỉ mối liên hệ nhân quả, nhưng mối liên hệ nhân quả ám chỉ tương quan. Khi có một mối liên hệ nhân quả thì chúng ta sẽ tìm ra mối tương quan). Cái sai là ở câu thứ hai, bởi vì trong thực tế, có những liên hệ nhân quả nhưng không thể hiện qua tương quan, nhứt là trong điều kiện sai lệch và mối liên quan phi đơn điệu (non-monotonic relationship).

Tôi nghĩ cuốn sách này là một tái khám phá về một khái niệm rất cũ trong thống kê học, nhưng tác giả ‘đóng gói’ thành một phiên bản khác dưới lăng kính tâm lí – xã hội học. Kết quả là một lí giải dễ hiểu cho công chúng, và do đó tôi vẫn nghĩ cuốn sách này quan trọng vì nó giúp cho công chúng biết về nhiễu và sai lệch (và thiên kiến) trong cuộc sống. Những lí giải về nhiễu từ cái nhìn tâm lí xã hội đối với tôi rất thú vị. Tôi xem cuốn sách là một tài nguyên quí báu cho giảng dạy về phương pháp nghiên cứu và dịch tễ học.

Khoảng 10 năm trước (2012), tôi từng đọc được cuốn sách “Thinking, fast and slow” (Nghĩ nhanh, nghĩ chậm) của Giáo sư Daniel Kahneman, và có viết một bài điểm sách tương đối dài [2]. Một nhóm bạn ở Việt Nam đã dịch cuốn sách này sang tiếng Việt, và tôi hân hạnh viết lời giới thiệu. Nay, tôi muốn giới thiệu một cuốn sách có giá trị khác của Kahneman và 2 đồng nghiệp Sibony và Sunstein về một đề tài rất đáng được để tâm suy nghĩ: nhiễu và phán xét của chúng ta. Tôi hi vọng rằng sẽ có một nhóm dịch cuốn sách này sang tiếng Việt để nó hiện diện trong tủ sách của các bạn.

Bản tiếng Anh: https://tuanvnguyen.medium.com/reading-noise-a-flaw-in-human-judgment-by-daniel-kahneman-olivier-sibony-and-cass-sunstein-6cbb6d395ec5

____

[1] https://readnoise.com. Kahneman, D., Sibony, O., & Sunstein, C. R. (2021). Noise: A Flaw in Human Judgement. New York, NY: Little, Brown and Company.

[2] https://thesaigontimes.vn/nghi-nhanh-nghi-cham

Daniel Kahneman là Giáo sư Tâm lí học của ĐH Princeton, Giáo sư Công vụ (Public Affairs), và khôi nguyên Nobel Kinh tế 2002. Ông còn là viện sĩ Viện hàn lâm Nghệ thuật và Khoa học Hoa Kì, viện sĩ Hiệp hội Tâm lí học Hìa Kì, viện sĩ Hiệp hội Kinh tế lượng.

Olivier Sibony là Giáo sư Chánh sách Thương mại thuộc HEC, Paris. Ông từng là ‘Senior Partner’ của Tập đoàn McKinsey & Company. Chuyên môn của ông là lí thuyết quyết định. Ông tốt nghiệp tiến sĩ từ Đại học Khoa học và Nhân văn Paris.

Cass R. Sunstein là Giáo sư Đại học thuộc Đại học Harvard, và Giám đốc Chương trình Hành vi Kinh tế và Chánh sách công. Ông từng phục vụ như là Quản trị gia về Thông tin và Sự vụ cho Toà Bạch Cung từ  2013 đến 2014 (dưới thời Tổng thống Obama). Ông được trai giải Holberg của Na Uy vào năm 2018.