Kiểm định giả thuyết
mắm tôm và vi khuẩn tả
Nguyễn Văn Tuấn
Dù chưa có cơ sở khoa học, các giới chức y tế hiện nay khẳng định mắm tôm là nguồn bộc phát bệnh tả. Tiêu biểu cho quan điểm này là phát biểu của một quan chức cao cấp trong ngành y tế: “mặc dù chưa khẳng định được nguồn gốc của khuẩn”, nhưng “khẳng định vi khuẩn tả xuất phát từ thực phẩm, không chỉ mắm tôm mà bất cứ thực phẩm nào”. Chúng ta hãy tạm thời gọi đây là“giả thuyết mắm tôm – vi khuẩn tả”. Đã là giả thuyết thì cần phải được kiểm định một cách nghiêm chỉnh. Nếu kết quả kiểm định phù hợp với bằng chứng thì chúng ta chấp nhận giả thuyết đó; nếu không, chúng ta có lí do để bác bỏ giả thuyết đó.
Trong một một bài viết hôm qua, chúng tôi đã trình bày các bằng chứng sinh học để cho thấy rằng mắm tôm không thể là môi trường thuận lợi cho phát triển của vi khuẩn tả V. cholerae. Cụ thể hơn, vi khuẩn tả không thể tồn tại trong môi trường nồng độ muốn lên đến 15-30% trong mắm tôm hay môi trường “yếm khí” (thiếu không khí) của mắm tôm. Ngoài ra, ngay cả nếu vi khuẩn tả V. cholerae “may mắn” sống sót đến tay người ăn thịt chó, thì với một lát chanh thì vi khuẩn cũng không sống nổi. Nói tóm lại, bằng chứng sinh học cho thấy mắm tôm không thể hàm chứa vi khuẩn tả.
Nhưng đó là bằng chứng mang tính lí thuyết. Chúng ta cần bằng chứng xét nghiệm thực tế. Chúng ta không biết lượng mắm tôm ngoại cộng đồng bị nhiễm là bao nhiêu. Nhưng chúng ta có thể lấy mẫu để xét nghiệm và từ đó suy luận cho cộng đồng / quần thể. May mắn thay, các cơ quan y tế đã làm việc này. Kết quả có thể tóm lược như sau:
- Ở Hà Nội, Viện Vệ sinh dịch tễ Trung ương đã xét nghiệm 50 mẫu mắm tôm lấy từ nhiều nơi, và kết quả 50 mẫu đều âm tính với vi khuẩn tả V. cholerae.
- Một cách độc lập, ở Thành phố Hồ Chí Minh, Trung tâm Y tế dự phòng xét nghiệm 24 mẫu mắm tôm, mắm nêm bán tại siêu thị, các chợ và các quán ăn trên địa bàn thành phố, và tất cả đều có kết quả âm tính với vi khuẩn tả V. cholerae.
- Nói tóm lại, hai lần xét nghiệm độc lập nhau đều cho ra một kết quả: 100% các mẫu mắm tôm đều âm tính. Nói cách khác, 100% mẫu mắm tôm đều không có nhiễm vi khuẩn gây bệnh tả.
Những kết quả này cung cấp cho chúng ta tín hiệu gì? Nếu mắm tôm bị nhiễm vi khuẩn tả (hãy tạm thời cho rằng tỉ lệ nhiễm là 0,15 hay 15%), thì xác suất mà chúng ta quan sát được ít nhất một mẫu mắm tôm có kết quả dương tính trong số 74 mẫu xét nghiệm là 0,9999. Điều này, có nghĩa là nếu 15% mắm tôm ngoài cộng đồng bị nhiễm, thì có thể nói rằng trong số 74 mẫu phải có ít nhất 1 mẫu có kết quả dương tính.
Lật lại vấn đề: nếu thật sự trong cộng đồng có 15% lượng mắm tôm bị nhiễm vi khuẩn tả, thì chúng ta cần xét nghiệm bao nhiêu mẫu để có thể quan sát ít nhất 1 mẫu có kết quả dương tính? Câu trả lời là 30 mẫu (chứ không cần đến 74 mẫu)!
Ngoài ra, có thể ứng dụng mô hình phản nghiệm (falsificationism) để kiểm định giả thuyết về mối liên quan giữa mắm tôm và vi khuẩn tả. Cụ thể hơn, nếu giả thuyết (của Bộ Y tế) cho rằng mắm tôm bị nhiễm khuẩn là đúng thì câu hỏi đặt ra là xác suất mà chúng ta quan sát 0/74 kết quả dương tính là bao nhiêu.
Xin nhắc lại: chúng ta không biết bao nhiêu mẫu mắm tôm bị nhiễm khuẩn tả. Chúng ta chỉ có thể lấy mẫu, xét nghiệm, và suy luận cho quần thể. Câu hỏi định lượng đặt ra là: nếu Bộ Y tế tin rằng 15% lượng mắm tôm ở Việt Nam nhiễm khuẩn, thì xác suất mà chúng ta có kết quả 0% dương tính với vi khuẩn tả là bao nhiêu. Theo qui ước khoa học, nếu xác suất này thấp hơn 5%, chúng ta bác bỏ giả thuyết mắm tôm – vi khuẩn tả.
Để trả lời câu hỏi này, Gọi p là tỉ lệ mắm tôm nhiễm khuẩn ngoài cộng đồng. hãy tạm thời cho p = 0,15 (tức 15%). Câu hỏi trên có thể giải bằng cách ứng dụng luật phân phối nhị phân (binomial probability distribution). Theo luật phân phối này, xác suất mà chúng ta quan sát k kết quả dương tính trong số n mẫu được xét nghiệm với xác suất p là:
Tuy công thức mới nhìn qua thì có vẻ “đe dọa”, nhưng kì thật rất đơn giản. Có thể tính toán bằng Excel hay R rất dễ dàng. Trong trường hợp của ta, p = 0,15, n = 74, và k = 0. Do đó, công thức trên đơn giản thành:
Nói cách khác, nếu quả thật 15% lượng mắm tôm bị nhiễm vi khuẩn tả, thì xác suất mà chúng ta quan sát 0 kết quả dương tính rất thấp, chỉ 6 phần triệu! Do đó, bằng chứng về kết quả xét nghiệm bác bỏ giả thuyết mắm tôm – khuẩn tả một cách dễ dàng.
Chúng ta có thể tính xác suất 0/74 dương tính cho từng giá trị (giả thuyết) của p. Bảng sau đây cung cấp cho chúng ta xác suất quan sát 9 kết quả dương tính cho từng giá trị của p. Ngay cả nếu p = 0,05 (tức 5% lượng mắm tôm trong cộng đồng bị nhiễm khuẩn tả), xác suất mà chúng ta có kết quả 0 dương tính cũng chỉ 0.022 hay 2,2%. Nói cách khác, giả thuyết mắm tôm – khuẩn tả không phù hợp với bằng chứng thực tế.
Nếu tỉ lệ nhiễm khuẩn trong mắm tôm ngoài cộng đồng (p) là |
Thì xác suất mà chúng ta quan sát k=0 kết quả dương tính từ n=74 mẫu là |
0,05 |
0,022 |
0,10 |
0,000411 |
0,20 |
0,000006 |
0,30 |
0,00000017 |
0,40 |
0,(16 số 0)67 |
Yếu tố Bayes. Một cách khác để kiểm định giả thuyết mắm tôm – vi khuẩn tả là tính yếu tố Bayes (còn gọi là Bayes Factor, hay BF). Một cách đơn giản, BF là tỉ số của hai hàm số khả dĩ (likelihood function) cho hai giả thuyết. Gọi
- H0 là giả thuyết mắm tôm không bị nhiễm vi khuẩn tả (p = 0)
- H1 là giả thuyết mắm tôm không bị nhiễm vi khuẩn tả (p = 0,10 hay 0,15, hay bất cứ giá trị nào lớn hơn 0)
Chúng ta đặt câu hỏi: nếu H0 đúng, xác suất mà chúng ta quan sát 0 kết quả dương tính từ 74 lần xét nghiệm là bao nhiêu? Tương tự, nếu H1 đúng, xác suất mà chúng ta quan sát 0 kết quả dương tính từ 74 lần xét nghiệm là bao nhiêu? Viết theo ngôn ngữ toán:
Trong đó P(data | p=0)có nghĩa là đáp số cho câu hỏi thứ nhất, và P(data | p>0) là đáp số cho câu hỏi thứ hai. Nếu BF = 1, chúng ta có thể nói số liệu (bằng chứng) chẳng nghiêng về giả thuyết nào cả; nếu BF > 1, chúng ta có thể nói bằng chứng thực tế nghiêng về giả thuyết H0; và nếu BF < 1, bằng chứng thực tế nghiêng về giả thuyết H1.
Bây giờ, chúng ta thử ứng dụng lí thuyết BF trên vào số liệu mà các quan chức y tế thu thập được. Xin nhắc lại, trong số n = 74 xét nghiệm, k = 0 kết quả dương tính. Do đó:
và với giả thuyết H1, chúng ta tạm thời cho p = 0,1 (10% mẫu nhiễm vi khuẩn tả):
Do đó:
Tức là, bằng chứng thực tế (0/74 dương tính) nghiêng về giả thuyết H0 (mằm tôm không nhiễm vi khuẩn tả) đến 2432 lần! Chúng ta có thể tính BF cho các xác suất theo giả thuyết H1 khác nhau trong bảng sau đây:
Nếu giả thuyết mắm tôm bị nhiễm vi khuẩn tả với p là |
Thì bằng chứng thực tế (0/74 dương tính) nghiêng về giả thuyết H0 (mắm tôm không nhiễm vi khuẩn tả) là: |
0,01 |
2,1 |
0,05 |
44,5 |
0,10 |
2432 |
0,20 |
14.836.825 |
0,30 |
290.231.829.160 |
0,40 |
Không cần tốn thì giờ tính tiếp! |
Nói tóm lại, dù tính bằng phương pháp kiểm định giả thuyết hay bằng yếu tố Bayes, bằng chứng thực tế cho thấy giả thuyết mắm tôm bị nhiễm vi khuẩn tả là giả thuyết không tưởng (hay không có khả năng xảy ra).
Tuy nhiên, các quan chức y tế cho rằng vì kĩ thuật xét nghiệm ở Việt Nam chưa tốt, nên họ muốn gửi các mẫu mắm tôm đến một cơ sở xét nghiệm “tiên tiến” hơn. Chúng ta phải hỏi tại sao lại tập trung nhân lực và tiền bạc vào việc truy tìm vi khuẩn tả trong mắm tôm, trong khi bằng chứng sinh học và số liệu thực tế cho thấy giả thuyết mắm tôm – vi khuẩn tả là không tưởng.
(Cách làm việc này làm tôi liên tưởng đến chính phủ Mĩ trong cuộc chiến xâm lăng Iraq vừa qua. Mĩ tố cáo Iraq có vũ khí hủy diệt hàng loạt; Iraq chối không có. Mĩ đòi vào khám xét, nhưng vẫn không tìm thấy vũ khí. Không có thì phải tìm cho có: Mĩ quyết định tấn công Iraq, và vẫn không tìm thấy vũ khí hủy diệt hàng loạt, nhưng thay vào đó là hàng trăm ngàn người dân bỏ mạng.)
Nếu xem vi khuẩn tả là “vũ khí”, cuộc truy tìm vi khuẩn tả trong mắm tôm của các quan chức y tế có xu hướng giống như Mĩ tìm vũ khí hủy diệt hàng loạt ở Iraq. Ban đầu họ “tố cáo” mắm tôm có “vũ khí”, nhưng mắm tôm không nói được. Họ quyết định kéo mắm tôm ra xét nghiệm, vẫn không thấy “vũ khí”. Mắm tôm vì không nói được nên vẫn … chịu trận. Nay họ đòi đem mắm tôm ra ngoài Việt Nam để tìm cho được “vũ khí”. Nếu kết quả ở Iraq là một bài học gián tiếp nào đó, thì giới sản xuất, phân phối, và tiêu dùng mắm tôm sẽ chịu thiệt thòi một thời gian.
Đã đến lúc chúng ta nên sử dụng bằng chứng khoa học, thay vì ý chí, trong vấn đề mắm tôm và vi khuẩn tả. Bằng chứng khoa học nói cho chúng ta biết cần làm sạch nguồn nước, vệ sinh gia đình và môi trường, và tiêm chủng cho những đối tượng cho nguy cơ cao mắc bệnh tả (như trẻ em và người già đang sống trong vùng lũ lụt) mà Tổ chức Y tế Thế giới đã khuyến cáo.
Bản hiệu đính 15/11/07
Ghi thêm:
[1] Trong R, chúng ta có thể sử dụng hàm dbinorm(k, n, p) để tính xác suất quan sát được k kết quả dương tính trong số n mẫu xét nghiệm với tỉ lệ [theo giả thuyết] nhiễm là p. Chẳng hạn như để tính BF cho Bảng 2, chúng ta chỉ đơn giản lệnh:
dbinom(0, 74, 0)/dbinom(0, 74, 0.05)
[2] Thật ra, các ước tính trên đây vẫn còn … cao. Trong thực tế, không phải 74/74 đều có kết quả âm tính với vi khuẩn tả, mà là 32 mẫu mắm tôm ở Thanh Hóa và 35 mẫu mắm tôm ở Hải Phòng, Hải Dương, Hà Nội, Nghệ An và Thanh Hoá cũng đều có kết quả âm tính với các vi khuẩn Salmonella, Staphylococcus Aureus, E.Coli, Vibrio Cholera, Vibrio Parahomoliticus. Tính chung, đã có 138/138 mẫu đều không có nhiễm vi khuẩn tả. Thiết tưởng với một kết quả như thế, chúng ta không cần phải tốn thêm thời gian và tiền bạc để đi tìm cái không thể tìm được vì xác suất mà vi khuẩn tồn tại là 0.