|
Tiên lượng bệnh
Alzheimer bằng protein expression ?
Nguyễn Văn Tuấn
Một bạn đọc ykhoanet.com gửi email đến tôi
hỏi ý kiến về một bản tin trên Vietnamnet nói về một “khám phá”
thuật tiên lượng ai sẽ mắc hay không mắc bệnh Alzheimer [1].
Thấy đề tài thú vị nên tôi cũng mượn câu hỏi để bàn ngắn gọn về
nghiên cứu đáng chú ý này. Xin
nói ngay rằng tôi không phải là một chuyên gia về thần
kinh học; tất cả những ý kiến sau đây chỉ là ý kiến cá nhân và
đứng trên quan điểm lâm sàng dịch tễ học và phương pháp học.
Phương pháp tiên lượng bệnh (prognosis) bằng
công nghệ sinh học ra đời từ khi kĩ thuật microarray ra đời trên
dưới 10 năm. Kĩ thuật này có thể phân tích hàng chục, thậm chí
hàng trăm ngàn, và nay là hàng triệu markers của các gien một
lượt. Người ta kì vọng rằng qua phân tích “gene expression”
(tạm dịch là biểu thị gien) y học có thể tiên đoán chính
xác ai sẽ (hay đang) mắc bệnh. Cha đẻ của kĩ thuật này tuyên bố
trong một cuốn sách rằng: “Tất cả bệnh tật đều có thể nghiên
cứu qua phân tích gien và mục tiêu tối hậu của dự án này là phát
triển các phương pháp điều trị dứt bệnh cho mỗi con người trên
hành tinh này vào năm 2050” [2].
Kể từ khi kĩ thuật microarray ra
đời, đã có hơn 200 công trình nghiên cứu tiên đoán nhiều bệnh,
nhưng cho đến nay, chưa một công trình nào có thể đưa vào ứng
dụng lâm sàng. Nói ngắn gọn, bệnh Alzheimer là bệnh mất trí
nhớ. Người bệnh thường không nhớ việc làm của mình hay sự việc
chung quanh, thậm chí không nhớ tên tuổi mình, và cũng rất khó
khăn tiếp nhận thông tin mới. Cựu tổng thống Mĩ Ronald Reagan
từng mắc bệnh Alzheimer một thời gian khá dài trước khi qua
đời. Vấn đề đặt ra là làm sao có thể tiên đoán ai mắc bệnh (hay
sẽ mắc bệnh) một cách chính xác để can thiệp sớm. Vì Alzheimer
là bệnh một phần có nguồn gốc từ đột biến gien, và “sản phẩm”
của gien là protein, cho nên giả thuyết đặt ra là có thể phân
tích biểu thị protein để tiên đoán khả năng mắc bệnh. Công
trình nghiên cứu mà tôi đang đề cập được thực hiện để kiểm định
giả thuyết đó.
Tóm lược công trình nghiên cứu
Các nhà nghiên cứu bên Mĩ (Đại học Stanford,
California) chọn 85 người mắc bệnh Alzheimer (tuổi trung bình:
76) và 79 người không mắc bệnh (còn gọi là nhóm chứng, (tuổi
trung bình: 71). Mối đối tượng, họ lấy máu và đo lường độ
biểu thị (expression level) của 120 proteins mà họ nghĩ là
có liên quan đến bệnh Alzheimer.
Bước kế tiếp, họ ngẫu nhiên chia các đối tượng
thành hai nhóm: nhóm tập huấn (training set) và nhóm kiểm chứng
(validation set). Nhóm tập huấn gồm có 83 đối tượng,
trong đó 43 người mắc bệnh Alzheimer và 40 người không mắc bệnh
Alzheimer. Nhóm kiểm chứng có 81 người, gồm 42 người mắc
bệnh Alzheimer và 39 người không mắc bệnh Alzheimer.
Họ bắt đầu phát triển mô hình bằng cách sử dụng
số liệu của nhóm tập huấn. Họ áp dụng một mô hình thống kê rất
phức tạp có tên là SAM (Significance Analysis of Microarray) để
tìm xem trong số 120 proteins bao nhiêu có ý nghĩa thống kê.
Kết quả cho thấy có 19 proteins mà mức độ biểu hiện khác biệt
giữa hai nhóm đối tượng. Dựa vào 19 proteins họ phát triển một
mô hình tiên đoán cũng bằng một mô hình thống kê, và mô hình này
có tên là PAM (Predictive Analysis of Microarray) để ước tính
nguy cơ mắc bệnh cho từng người. Họ đối chiếu kết quả tiên đoán
với kết quả chẩn đoán lâm sàng để xem mô hình tiên đoán chính
xác cỡ nào. Kết quả đối chiếu này có thể tóm lược trong Bảng
1. Trong số 43 người mắc bệnh Alzheimer, mô hình tiên đoán đúng
41 người và sai 2 người; do đó, độ nhạy là 95.3%. Trong số 40
người không mắc bệnh Alzheimer, mô hình tiên đoán đúng 33 người,
và độ đặc hiệu là 82.5%.
|
Bảng 1. Kết quả phân tích trong
nhóm tập huấn (training set) |
|
Tiên đoán từ mô hình 19 proteins |
Tình trạng bệnh |
|
Alzheimer |
Không Alzheimer |
|
Alzheimer |
41 |
7 |
|
Không Alzheimer |
2 |
33 |
Sensivity =
0.953, Specificity = 0.825
Sau khi đã có một mô hình tiên đoán được phát triển nhóm tập
huấn, họ áp dụng mô hình này để tiên đoán cho nhóm kiểm chứng.
Kết quả phân tích trong nhóm kiểm chứng có thể mô tả trong
Bảng 2 sau đây. Trong số 42 người mắc bệnh Alzheimer, mô
hình tiên đoán đúng 38 người, và độ nhạy là 90.5%. Ngược lại,
trong số 39 người không mắc bệnh, mô hình tiên đoán đúng 34
người, và độ đặc hiệu là 87.2%.
|
Bảng 2. Kết quả phân tích trong
nhóm kiểm chứng (validation set) |
|
Tiên đoán từ mô hình 19 proteins |
Tình trạng bệnh |
|
Alzheimer |
Không Alzheimer |
|
Alzheimer |
38 |
5 |
|
Không Alzheimer |
4 |
34 |
Sensivity =
0.905, Specificity = 0.872
Để thẩm định độ tin cậy của mô hình tiên đoán các nhà nghiên cứu
phân tích một nhóm đối tượng khác gồm 47 người, những người này
có thể xem là tiền-Alzheimer (tức chưa mắc bệnh, nhưng có triệu
chứng nhẹ), mà thuật ngữ y khoa gọi là mild cognitive impairment
(MCI). Họ theo dõi những bệnh nhân này từ 2 đến 6 năm. Trong
thời gian theo dõi, có 22 bệnh nhân được chẩn đoán mắc bệnh
Alzheimer, 8 người không mắc bệnh (tức tốt hơn lúc ban đầu), và
17 người vẫn không thay đổi, tức vẫn còn trong tình trạng MCI.
Kết quả tiên đoán từ mô hình này (Bảng 3) cho thấy trong
số 22 người phát sinh bệnh, mô hình tiên đoán đúng 20 người (độ
nhạy = 90.9%). Trong số 8 người không phát sinh bệnh, mô hình
tiên đoán chính xác 100%. Nhưng trong nhóm 17 người mà bệnh
trạng không thay đổi, mô hình tiên đoán 7 người mắc bệnh và 10
người không mắc bệnh.
|
Bảng 3. Kết quả phân tích trong
nhóm MCI theo dõi trong vòng 6 năm
|
|
Tiên đoán từ mô hình 19 proteins |
Chẩn đoán bệnh trong thời gian theo dõi |
|
Alzheimer |
Không Alzheimer |
MCI |
|
Alzheimer |
20 |
0 |
7 |
|
Không Alzheimer |
2 |
8 |
10 |
Sensivity =
0.909, Specificity = 1.00
Bình luận
Thông cáo báo chí từ trường Stanford và công ti chuyên phân tích
protein, như chúng ta có thể đoán được, đưa ra toàn những tin
rất hấp dẫn. Những bản tin giật gân như “Simple blood test 90%
accurate in predicting Alzheimer’s” (Một xét nghiệm máu đơn giản
có tiên đoán bệnh Alzheimer chính xác 90%) được truyền đi khắp
thế giới, và báo chí trong nước cũng dịch theo với một tiêu đề
thi vị hơn như “’Lắng nghe’ tế bào để phát hiện bệnh Alzheimer”
(Vietnamnet).
Cần biết rằng Tiến sĩ Tony Wyss-Coray chủ trì công trình nghiên
cứu này cũng chính là giám đốc công ti mà ông mới thành lập
chuyên phân tích proteins để tiên đoán bệnh Alzheimer. Do đó,
chúng ta cần phải xem xét dữ liệu một cách khách quan, thay vì
tin theo những gì các thông cáo báo chí và bản tin truyền thông
quốc tế.
Đánh giá thế nào về công trình nghiên cứu này? Công trình này
có ý nghĩa quan trọng, vì hiện nay việc chẩn đoán bệnh Alzheimer
tương đối phức tạp và không mấy chính xác; do đó, nếu quả thật
có một mô hình mà chỉ cần lấy mẫu máu, phân tích proteins, và áp
dụng mô hình thống kê để tiên đoán chính xác bệnh thì quả là một
bước tiến quan trọng trong y học hiện đại. Có lẽ nhận thức được
ý nghĩa này, nên bài báo từ khi nộp cho đến khi được chấp nhận
cho công bố chỉ 4 tháng!
Một
điểm son khác mà tôi cần nhấn mạnh ở đây là tính minh bạch của
nghiên cứu. Thông thường các bài báo chỉ tóm lược số liệu hay
kết quả phân tích cho độc giả, nhưng ở đây các tác giả công bố
tất cả các số liệu thô (raw data) và tất cả chi tiết phân tích
trên internet để bất cứ ai muốn kiểm tra đều có thể tải về máy
và phân tích lại. Tất cả các mô hình tiên đoán được phát triển
bằng ngôn ngữ R (mà tôi đã có dịp
giới thiệu trước đây trong một cuốn sách của tôi). Bạn đọc
nào muốn biết thêm về mô hình SAM và PAM có thể vào trang nhà
của giáo sư Tibshirani (Đại học Stanford) để có thêm thông tin:
http://www-stat.stanford.edu/~tibs/SAM hay
http://www-stat.stanford.edu/~tibs/PAM.
Về
mặt thiết kế, đây là một nghiên cứu tương đối tiêu biểu về tiên
lượng, tức có nhóm tập huấn và nhóm kiểm chứng. Tuy nhiên, số
bệnh nhân còn tương đối thấp (chỉ 164 người), và họ phải chia
thành hai nhóm tập huấn và kiểm chứng, nên có thể các thông số
ước tính từ nhóm tập huấn không ổn định.
Về
kết quả, có lẽ không ngạc nhiên khi thấy mô hình này tiên đoán
tốt khả năng mắc bệnh cho cả hai nhóm tập huấn và kiểm chứng.
Lí do đơn giản là họ phân tích số liệu trên quần thể đối tượng
(n = 164), phát hiện 19 proteins, rồi sau đó mới phát triển mô
hình để tiên đoán bằng cách ngẫu nhiên chọn 83 người trong quần
thể đó, và áp dụng mô hình cho một nhóm gồm 81 người cũng xuất
từ quần thể đó. Do đó, không ngạc nhiên khi mô hình tiên đoán
rất tốt.
Có bằng chứng cho thấy mô hình tiên đoán không chính xác cho khả
năng phát bệnh trong tương lai, như số liệu từ bảng 3 gợi ý. Có
lẽ vì mô hình chỉ cho giá trị nhị phân (có hay không có bệnh),
mà không tiên lượng được những trường hợp mà tình trạng bệnh
không thay đổi. Nếu gộp nhóm MCI vào nhóm “không Alzheimer”, mô
hình có độ đặc hiệu là 72% (18 / 25), và tỉ lệ dương tính giả
lên đến 28%. Một xét nghiệm với tỉ lệ dương tính giả 28% chưa
thể xem là có lợi ích trong lâm sàng được.
Nhưng báo cáo này chỉ mới cung cấp cho chúng ta độ tin cậy của
mô hình tiên đoán, chứ chưa cho biết sự hữu dụng của mô hình
trong việc chẩn đoán một cá nhân. Câu hỏi đặt ra là: nếu một
người được xét nghiệm máu và mô hình cho ra kết quả dương tính
(tức tiên đoán bị Alzheimer), xác suất mà người đó thật sự mắc
bệnh Alzheimer là bao nhiêu? Để trả lời câu hỏi này, chúng ta
cần một thông số khác: đó là tỉ lệ mắc bệnh trong cộng đồng.
Theo một nghiên cứu ở Mĩ, ở những người trên 65 tuổi, khoảng 10%
người được xem là có triệu chứng bệnh Alzheimer (probable
Alzheimer's disease) [3]. Nhưng
tỉ lệ này thay đổi tùy theo độ tuổi. Nếu độ nhạy là 90% và
độ đặc hiệu là 87.2% (Bảng 2), và nếu tỉ lệ lưu hành là 10%, thì
xác suất một người [với kết quả xét nghiệm dương tính] mắc bệnh
Alzheimer là khoảng 44% (bạn đọc có thể kiểm tra con số này của
tôi). Nói cách khác, xác suất vẫn còn khá thấp để có thể khẳng
định một chẩn đoán. Nói tóm lại, ngay cả mô hình này có độ nhạy
lên đến 90% thì việc áp dụng cho một cá nhân vẫn chưa khả quan.
Mô
hình này có thể áp dụng trong thực hành lâm sàng hay không?
Theo tôi, câu trả lời là “không”. Cần nhắc lại rằng mô hình này
chưa được kiểm chứng trong một quần thể hoàn toàn độc lập, thì
chúng ta vẫn có lí do để hoài nghi sự hữu dụng của nó. Bài học
về chẩn đoán ung thư bằng phân tích gien (microarray) vẫn đáng
được nhắc lại ở đây. Năm 2004, một công trình nghiên cứu phân
tích gien để chẩn đoán ung thư được công bố trên tập san New
England Journal of Medicine cho thấy phân tích gien có thể
tiên đoán chính xác đến 95% các trường hợp ung thư và không ung
thư. Tiếp theo sau là những bình luận từ các chuyên gia, giáo
sư, tiến sĩ (nhiều người rất nổi tiếng) cho rằng công nghệ gien
có thể cho chúng ta biết mắc bệnh gì, kể cả ung thư, ngay từ lúc
mới chào đời! Một năm sau, khi mô hình đó được kiểm chứng ở một
quần thể độc lập khác, mô hình đó tiên đoán ung thư không tốt
hơn việc búng một đồng xu (tức không quá 50%)! Thật vậy, 7
nghiên cứu kiểm chứng trong những năm sau đó cho thấy mô hình
hoàn toàn vô dụng [4].
Do đó, cho đến khi mô hình tiên đoán bệnh Alzheimer được kiểm
chứng trong nhiều (chứ không phải một) quần thể khác, chúng ta
vẫn xem phát hiện trong nghiên cứu này mang tính gợi ý, hay ít
ra là gợi ý về một phương pháp chẩn đoán hiện đại. Trong thời
đại sinh học phân tử và công nghệ sinh học, những khám phá
thật sự có thể đem lại lợi ích cho người bệnh hay cho một
quần thể lớn vẫn còn là một thách thức lớn. Kĩ thuật phân tích
gien và phân tích proteins cho đến nay chưa thành công để tiên
đoán bất cứ một bệnh phức tạp nào. Công trình nghiên cứu này
[1] thể hiện sự thành công về kĩ thuật, phương pháp, nhưng chưa
thể nói là một khám phá hay một thành tựu y học.
Tài liệu
tham khảo:
[1] Ray S, et
al. Classification and prediction of clinical Alzheimer
diagnosis based on plasma signaling proteins. Nature Medicine
14/10/2007; doi: 10.1038/nm1653.
[2] Schena M.
Microarray analysis. Nhà xuất bản Wiley-Liss, New York (2003),
trang 21.
[3] Evans DA,
et al. Prevalence of Alzheimer's disease in a community
population of older persons. Higher than previously reported.
JAMA 1989; 262; 10/11/1989.
[4] Ioannidis
JAP. Microarray and molecular research: noise or discovery.
Lancet 2005; 365:454-5.
TB. Cũng
nhân dịp này xin trả lời chung các bạn hỏi về trang web
nguyenvantuan.com của tôi. Trang web đó, chẳng hiểu lí do kĩ
thuật gì, đã không còn vận hành được nữa. Các anh trong
ykhoa.net đang cố gắng phục hồi, nhưng chắc cần nhiều thời gian,
vì bài vở thì tôi chẳng biết chúng đang ở đâu. Thôi thì tôi mời
các bạn thử ghé qua trang blog của tôi để trao đổi thêm. Xin
nói trước rằng đây là trang blog, chứ không phải website, nên
cách tôi “nói” trong đó không mang tính nghiêm nghị như trong
website. Mấy vụ ồn ào về blog gần đây làm tôi cũng ngại lắm,
nhưng các bạn ykhoa.net và đồng nghiệp thì tôi tin là sẽ không
có những câu chữ trong các trang blog của giới phóng viên mà mới
nhìn qua thấy rất khó đọc. Địa chỉ blog:
http://tuanvannguyen.blogspot.com |