Tiên lượng bệnh Alzheimer bằng protein expression ?
Nguyễn Văn Tuấn
Một bạn đọc ykhoanet.com gửi email đến tôi hỏi ý kiến về một bản tin trên Vietnamnet nói về một “khám phá” thuật tiên lượng ai sẽ mắc hay không mắc bệnh Alzheimer [1]. Thấy đề tài thú vị nên tôi cũng mượn câu hỏi để bàn ngắn gọn về nghiên cứu đáng chú ý này. Xin nói ngay rằng tôi không phải là một chuyên gia về thần kinh học; tất cả những ý kiến sau đây chỉ là ý kiến cá nhân và đứng trên quan điểm lâm sàng dịch tễ học và phương pháp học.
Phương pháp tiên lượng bệnh (prognosis) bằng công nghệ sinh học ra đời từ khi kĩ thuật microarray ra đời trên dưới 10 năm. Kĩ thuật này có thể phân tích hàng chục, thậm chí hàng trăm ngàn, và nay là hàng triệu markers của các gien một lượt. Người ta kì vọng rằng qua phân tích “gene expression” (tạm dịch là biểu thị gien) y học có thể tiên đoán chính xác ai sẽ (hay đang) mắc bệnh. Cha đẻ của kĩ thuật này tuyên bố trong một cuốn sách rằng: “Tất cả bệnh tật đều có thể nghiên cứu qua phân tích gien và mục tiêu tối hậu của dự án này là phát triển các phương pháp điều trị dứt bệnh cho mỗi con người trên hành tinh này vào năm 2050” [2].
Kể từ khi kĩ thuật microarray ra đời, đã có hơn 200 công trình nghiên cứu tiên đoán nhiều bệnh, nhưng cho đến nay, chưa một công trình nào có thể đưa vào ứng dụng lâm sàng. Nói ngắn gọn, bệnh Alzheimer là bệnh mất trí nhớ. Người bệnh thường không nhớ việc làm của mình hay sự việc chung quanh, thậm chí không nhớ tên tuổi mình, và cũng rất khó khăn tiếp nhận thông tin mới. Cựu tổng thống Mĩ Ronald Reagan từng mắc bệnh Alzheimer một thời gian khá dài trước khi qua đời. Vấn đề đặt ra là làm sao có thể tiên đoán ai mắc bệnh (hay sẽ mắc bệnh) một cách chính xác để can thiệp sớm. Vì Alzheimer là bệnh một phần có nguồn gốc từ đột biến gien, và “sản phẩm” của gien là protein, cho nên giả thuyết đặt ra là có thể phân tích biểu thị protein để tiên đoán khả năng mắc bệnh. Công trình nghiên cứu mà tôi đang đề cập được thực hiện để kiểm định giả thuyết đó.
Tóm lược công trình nghiên cứu
Các nhà nghiên cứu bên Mĩ (Đại học Stanford, California) chọn 85 người mắc bệnh Alzheimer (tuổi trung bình: 76) và 79 người không mắc bệnh (còn gọi là nhóm chứng, (tuổi trung bình: 71). Mối đối tượng, họ lấy máu và đo lường độ biểu thị (expression level) của 120 proteins mà họ nghĩ là có liên quan đến bệnh Alzheimer.
Bước kế tiếp, họ ngẫu nhiên chia các đối tượng thành hai nhóm: nhóm tập huấn (training set) và nhóm kiểm chứng (validation set). Nhóm tập huấn gồm có 83 đối tượng, trong đó 43 người mắc bệnh Alzheimer và 40 người không mắc bệnh Alzheimer. Nhóm kiểm chứng có 81 người, gồm 42 người mắc bệnh Alzheimer và 39 người không mắc bệnh Alzheimer.
Họ bắt đầu phát triển mô hình bằng cách sử dụng số liệu của nhóm tập huấn. Họ áp dụng một mô hình thống kê rất phức tạp có tên là SAM (Significance Analysis of Microarray) để tìm xem trong số 120 proteins bao nhiêu có ý nghĩa thống kê. Kết quả cho thấy có 19 proteins mà mức độ biểu hiện khác biệt giữa hai nhóm đối tượng. Dựa vào 19 proteins họ phát triển một mô hình tiên đoán cũng bằng một mô hình thống kê, và mô hình này có tên là PAM (Predictive Analysis of Microarray) để ước tính nguy cơ mắc bệnh cho từng người. Họ đối chiếu kết quả tiên đoán với kết quả chẩn đoán lâm sàng để xem mô hình tiên đoán chính xác cỡ nào. Kết quả đối chiếu này có thể tóm lược trong Bảng 1. Trong số 43 người mắc bệnh Alzheimer, mô hình tiên đoán đúng 41 người và sai 2 người; do đó, độ nhạy là 95.3%. Trong số 40 người không mắc bệnh Alzheimer, mô hình tiên đoán đúng 33 người, và độ đặc hiệu là 82.5%.
Bảng 1. Kết quả phân tích trong nhóm tập huấn (training set) |
||
Tiên đoán từ mô hình 19 proteins |
Tình trạng bệnh |
|
Alzheimer |
Không Alzheimer |
|
Alzheimer |
41 |
7 |
Không Alzheimer |
2 |
33 |
Sensivity = 0.953, Specificity = 0.825
Sau khi đã có một mô hình tiên đoán được phát triển nhóm tập huấn, họ áp dụng mô hình này để tiên đoán cho nhóm kiểm chứng. Kết quả phân tích trong nhóm kiểm chứng có thể mô tả trong Bảng 2 sau đây. Trong số 42 người mắc bệnh Alzheimer, mô hình tiên đoán đúng 38 người, và độ nhạy là 90.5%. Ngược lại, trong số 39 người không mắc bệnh, mô hình tiên đoán đúng 34 người, và độ đặc hiệu là 87.2%.
Bảng 2. Kết quả phân tích trong nhóm kiểm chứng (validation set) |
||
Tiên đoán từ mô hình 19 proteins |
Tình trạng bệnh |
|
Alzheimer |
Không Alzheimer |
|
Alzheimer |
38 |
5 |
Không Alzheimer |
4 |
34 |
Sensivity = 0.905, Specificity = 0.872
Để thẩm định độ tin cậy của mô hình tiên đoán các nhà nghiên cứu phân tích một nhóm đối tượng khác gồm 47 người, những người này có thể xem là tiền-Alzheimer (tức chưa mắc bệnh, nhưng có triệu chứng nhẹ), mà thuật ngữ y khoa gọi là mild cognitive impairment (MCI). Họ theo dõi những bệnh nhân này từ 2 đến 6 năm. Trong thời gian theo dõi, có 22 bệnh nhân được chẩn đoán mắc bệnh Alzheimer, 8 người không mắc bệnh (tức tốt hơn lúc ban đầu), và 17 người vẫn không thay đổi, tức vẫn còn trong tình trạng MCI. Kết quả tiên đoán từ mô hình này (Bảng 3) cho thấy trong số 22 người phát sinh bệnh, mô hình tiên đoán đúng 20 người (độ nhạy = 90.9%). Trong số 8 người không phát sinh bệnh, mô hình tiên đoán chính xác 100%. Nhưng trong nhóm 17 người mà bệnh trạng không thay đổi, mô hình tiên đoán 7 người mắc bệnh và 10 người không mắc bệnh.
Bảng 3. Kết quả phân tích trong nhóm MCI theo dõi trong vòng 6 năm
|
|||
Tiên đoán từ mô hình 19 proteins |
Chẩn đoán bệnh trong thời gian theo dõi |
||
Alzheimer |
Không Alzheimer |
MCI |
|
Alzheimer |
20 |
0 |
7 |
Không Alzheimer |
2 |
8 |
10 |
Sensivity = 0.909, Specificity = 1.00
Bình luận
Thông cáo báo chí từ trường Stanford và công ti chuyên phân tích protein, như chúng ta có thể đoán được, đưa ra toàn những tin rất hấp dẫn. Những bản tin giật gân như “Simple blood test 90% accurate in predicting Alzheimer’s” (Một xét nghiệm máu đơn giản có tiên đoán bệnh Alzheimer chính xác 90%) được truyền đi khắp thế giới, và báo chí trong nước cũng dịch theo với một tiêu đề thi vị hơn như “’Lắng nghe’ tế bào để phát hiện bệnh Alzheimer” (Vietnamnet). Cần biết rằng Tiến sĩ Tony Wyss-Coray chủ trì công trình nghiên cứu này cũng chính là giám đốc công ti mà ông mới thành lập chuyên phân tích proteins để tiên đoán bệnh Alzheimer. Do đó, chúng ta cần phải xem xét dữ liệu một cách khách quan, thay vì tin theo những gì các thông cáo báo chí và bản tin truyền thông quốc tế.
Đánh giá thế nào về công trình nghiên cứu này? Công trình này có ý nghĩa quan trọng, vì hiện nay việc chẩn đoán bệnh Alzheimer tương đối phức tạp và không mấy chính xác; do đó, nếu quả thật có một mô hình mà chỉ cần lấy mẫu máu, phân tích proteins, và áp dụng mô hình thống kê để tiên đoán chính xác bệnh thì quả là một bước tiến quan trọng trong y học hiện đại. Có lẽ nhận thức được ý nghĩa này, nên bài báo từ khi nộp cho đến khi được chấp nhận cho công bố chỉ 4 tháng!
Một điểm son khác mà tôi cần nhấn mạnh ở đây là tính minh bạch của nghiên cứu. Thông thường các bài báo chỉ tóm lược số liệu hay kết quả phân tích cho độc giả, nhưng ở đây các tác giả công bố tất cả các số liệu thô (raw data) và tất cả chi tiết phân tích trên internet để bất cứ ai muốn kiểm tra đều có thể tải về máy và phân tích lại. Tất cả các mô hình tiên đoán được phát triển bằng ngôn ngữ R (mà tôi đã có dịp giới thiệu trước đây trong một cuốn sách của tôi). Bạn đọc nào muốn biết thêm về mô hình SAM và PAM có thể vào trang nhà của giáo sư Tibshirani (Đại học Stanford) để có thêm thông tin: http://www-stat.stanford.edu/~tibs/SAM hay http://www-stat.stanford.edu/~tibs/PAM.
Về mặt thiết kế, đây là một nghiên cứu tương đối tiêu biểu về tiên lượng, tức có nhóm tập huấn và nhóm kiểm chứng. Tuy nhiên, số bệnh nhân còn tương đối thấp (chỉ 164 người), và họ phải chia thành hai nhóm tập huấn và kiểm chứng, nên có thể các thông số ước tính từ nhóm tập huấn không ổn định.
Về kết quả, có lẽ không ngạc nhiên khi thấy mô hình này tiên đoán tốt khả năng mắc bệnh cho cả hai nhóm tập huấn và kiểm chứng. Lí do đơn giản là họ phân tích số liệu trên quần thể đối tượng (n = 164), phát hiện 19 proteins, rồi sau đó mới phát triển mô hình để tiên đoán bằng cách ngẫu nhiên chọn 83 người trong quần thể đó, và áp dụng mô hình cho một nhóm gồm 81 người cũng xuất từ quần thể đó. Do đó, không ngạc nhiên khi mô hình tiên đoán rất tốt.
Có bằng chứng cho thấy mô hình tiên đoán không chính xác cho khả năng phát bệnh trong tương lai, như số liệu từ bảng 3 gợi ý. Có lẽ vì mô hình chỉ cho giá trị nhị phân (có hay không có bệnh), mà không tiên lượng được những trường hợp mà tình trạng bệnh không thay đổi. Nếu gộp nhóm MCI vào nhóm “không Alzheimer”, mô hình có độ đặc hiệu là 72% (18 / 25), và tỉ lệ dương tính giả lên đến 28%. Một xét nghiệm với tỉ lệ dương tính giả 28% chưa thể xem là có lợi ích trong lâm sàng được.
Nhưng báo cáo này chỉ mới cung cấp cho chúng ta độ tin cậy của mô hình tiên đoán, chứ chưa cho biết sự hữu dụng của mô hình trong việc chẩn đoán một cá nhân. Câu hỏi đặt ra là: nếu một người được xét nghiệm máu và mô hình cho ra kết quả dương tính (tức tiên đoán bị Alzheimer), xác suất mà người đó thật sự mắc bệnh Alzheimer là bao nhiêu? Để trả lời câu hỏi này, chúng ta cần một thông số khác: đó là tỉ lệ mắc bệnh trong cộng đồng. Theo một nghiên cứu ở Mĩ, ở những người trên 65 tuổi, khoảng 10% người được xem là có triệu chứng bệnh Alzheimer (probable Alzheimer's disease) [3]. Nhưng tỉ lệ này thay đổi tùy theo độ tuổi. Nếu độ nhạy là 90% và độ đặc hiệu là 87.2% (Bảng 2), và nếu tỉ lệ lưu hành là 10%, thì xác suất một người [với kết quả xét nghiệm dương tính] mắc bệnh Alzheimer là khoảng 44% (bạn đọc có thể kiểm tra con số này của tôi). Nói cách khác, xác suất vẫn còn khá thấp để có thể khẳng định một chẩn đoán. Nói tóm lại, ngay cả mô hình này có độ nhạy lên đến 90% thì việc áp dụng cho một cá nhân vẫn chưa khả quan.
Mô hình này có thể áp dụng trong thực hành lâm sàng hay không? Theo tôi, câu trả lời là “không”. Cần nhắc lại rằng mô hình này chưa được kiểm chứng trong một quần thể hoàn toàn độc lập, thì chúng ta vẫn có lí do để hoài nghi sự hữu dụng của nó. Bài học về chẩn đoán ung thư bằng phân tích gien (microarray) vẫn đáng được nhắc lại ở đây. Năm 2004, một công trình nghiên cứu phân tích gien để chẩn đoán ung thư được công bố trên tập san New England Journal of Medicine cho thấy phân tích gien có thể tiên đoán chính xác đến 95% các trường hợp ung thư và không ung thư. Tiếp theo sau là những bình luận từ các chuyên gia, giáo sư, tiến sĩ (nhiều người rất nổi tiếng) cho rằng công nghệ gien có thể cho chúng ta biết mắc bệnh gì, kể cả ung thư, ngay từ lúc mới chào đời! Một năm sau, khi mô hình đó được kiểm chứng ở một quần thể độc lập khác, mô hình đó tiên đoán ung thư không tốt hơn việc búng một đồng xu (tức không quá 50%)! Thật vậy, 7 nghiên cứu kiểm chứng trong những năm sau đó cho thấy mô hình hoàn toàn vô dụng [4].
Do đó, cho đến khi mô hình tiên đoán bệnh Alzheimer được kiểm chứng trong nhiều (chứ không phải một) quần thể khác, chúng ta vẫn xem phát hiện trong nghiên cứu này mang tính gợi ý, hay ít ra là gợi ý về một phương pháp chẩn đoán hiện đại. Trong thời đại sinh học phân tử và công nghệ sinh học, những khám phá thật sự có thể đem lại lợi ích cho người bệnh hay cho một quần thể lớn vẫn còn là một thách thức lớn. Kĩ thuật phân tích gien và phân tích proteins cho đến nay chưa thành công để tiên đoán bất cứ một bệnh phức tạp nào. Công trình nghiên cứu này [1] thể hiện sự thành công về kĩ thuật, phương pháp, nhưng chưa thể nói là một khám phá hay một thành tựu y học.
Tài liệu tham khảo:
[1] Ray S, et al. Classification and prediction of clinical Alzheimer diagnosis based on plasma signaling proteins. Nature Medicine 14/10/2007; doi: 10.1038/nm1653.
[2] Schena M. Microarray analysis. Nhà xuất bản Wiley-Liss, New York (2003), trang 21.
[3] Evans DA, et al. Prevalence of Alzheimer's disease in a community population of older persons. Higher than previously reported. JAMA 1989; 262; 10/11/1989.
[4] Ioannidis JAP. Microarray and molecular research: noise or discovery. Lancet 2005; 365:454-5.
TB. Cũng nhân dịp này xin trả lời chung các bạn hỏi về trang web nguyenvantuan.com của tôi. Trang web đó, chẳng hiểu lí do kĩ thuật gì, đã không còn vận hành được nữa. Các anh trong ykhoa.net đang cố gắng phục hồi, nhưng chắc cần nhiều thời gian, vì bài vở thì tôi chẳng biết chúng đang ở đâu. Thôi thì tôi mời các bạn thử ghé qua trang blog của tôi để trao đổi thêm. Xin nói trước rằng đây là trang blog, chứ không phải website, nên cách tôi “nói” trong đó không mang tính nghiêm nghị như trong website. Mấy vụ ồn ào về blog gần đây làm tôi cũng ngại lắm, nhưng các bạn ykhoa.net và đồng nghiệp thì tôi tin là sẽ không có những câu chữ trong các trang blog của giới phóng viên mà mới nhìn qua thấy rất khó đọc. Địa chỉ blog: http://tuanvannguyen.blogspot.com