Trí tuệ Nhân tạo trong Chẩn đoán Hình ảnh: Hiện tại và Tương lai

The Current and Future State of AI Interpretation of Medical Images

AI
Medical Images
Diagnosis
CT
MRI
Author

Pranav Rajpurkar và cộng sự | Dịch và biên tập: BIODAS Team

Published

October 22, 2025

Bài tổng quan học thuật “AI in Medicine – The Current and Future State of AI Interpretation of Medical Images” do Pranav Rajpurkar, Ph.D.Matthew P. Lungren, M.D., M.P.H. thực hiện, dưới sự biên tập của Jeffrey M. Drazen, M.D. cùng hai biên tập khách mời Isaac S. Kohane, M.D., Ph.D.Tze-Yun Leong, Ph.D., được công bố trên The New England Journal of Medicine – một trong những tạp chí y khoa uy tín hàng đầu thế giới.

Hướng nghiên cứu tập trung vào hiện trạng và tương lai của trí tuệ nhân tạo (AI) trong diễn giải hình ảnh y khoa, một lĩnh vực phát triển nhanh với tác động sâu rộng đến chẩn đoán, điều trị, và ra quyết định lâm sàng. BIODAS Team hân hạnh giới thiệu và chia sẻ nội dung bài viết nhằm giúp cộng đồng y khoa hiểu rõ hơn về vai trò, tiềm năng và thách thức của AI trong phân tích hình ảnh y học, từ đó mở ra một góc nhìn toàn diện về cách công nghệ đang tái định hình thực hành y khoa trong kỷ nguyên số.

1. Đặt vấn đề

Diễn giải hình ảnh y khoa là trọng tâm của thực hành chẩn đoán, truyền thống dựa vào năng lực nhận dạng mẫu và tích lũy kinh nghiệm của bác sĩ. Trong thập kỷ qua, AI (đặc biệt là học sâu) đã tạo ra bước nhảy vọt về hiệu năng trong nhiều chuyên ngành: da liễu, tim mạch (ECG), nhãn khoa, mô bệnh học, X-quang ngực, CT, MRI và siêu âm1–5. Dù đã có hàng trăm ứng dụng lâm sàng cùng nhiều thiết bị được phê duyệt, việc dịch chuyển từ “bằng chứng mô hình” sang “giá trị lâm sàng” vẫn cần vượt qua các rào cản về khả năng tổng quát hóa, tính giải thích, chứng cứ thực địaquản trị rủi ro6–14.

Bài viết NEJM tổng hợp tiến trình, ứng dụng, bằng chứng lâm sàng, thách thức triển khai và triển vọng tương lai của AI trong diễn giải hình ảnh, nhấn mạnh hai trục chính: (i) hiệu quả lâm sàng và quy trình (từ phát hiện tổn thương đến ưu tiên ca khẩn – triage), và (ii) nền tảng công nghệ (từ mô hình chuyên biệt sang mô hình nền đa nhiệm, đa phương thức).

Hình ảnh: Minh họa các ứng dụng hiện tại của trí tuệ nhân tạo (AI) trong lĩnh vực chẩn đoán hình ảnh, tập trung vào ba chức năng lâm sàng chính gồm phân loại ưu tiên (triage), phát hiện (detection) và chẩn đoán (diagnosis). Các mô-đun AI tiêu biểu bao gồm CADt (computer-aided detection for triage – phát hiện hỗ trợ máy tính để phân loại ưu tiên), CADe (computer-aided detection for characterizing abnormalities – phát hiện hỗ trợ máy tính nhằm đặc trưng hóa bất thường), và CADx (computer-aided detection for diagnosis – phát hiện hỗ trợ máy tính phục vụ chẩn đoán). Bên cạnh đó, AI còn được sử dụng trong các quy trình tái tạo hình ảnh và giảm nhiễu nhằm nâng cao chất lượng hình ảnh đầu ra. Các ứng dụng AI không liên quan trực tiếp đến hình ảnh y khoa (phi hình ảnh) không được trình bày trong hình. CT là viết tắt của chụp cắt lớp vi tính (computed tomography) (Nguồn: Rajpurkar P và cộng sự, 2023).

2. Vai trò của AI trong chẩn đoán hình ảnh

AI hỗ trợ ở nhiều cấp độ: tiền xử lý (giảm nhiễu, tái tạo CT/MR, hiệu chỉnh giả ảnh), phát hiện/khoanh vùng (lesion detection/segmentation), phân loại (benign/malignant, viêm/nhiễm…), định lượng (thể tích, mật độ, lưu lượng), và dự báo (tiên lượng biến cố, đáp ứng điều trị)6–14. Ở cấp hệ thống, AI góp phần ưu tiên ca khẩn (ví dụ: xuất huyết nội sọ, tắc mạch lớn, tràn khí màng phổi, thuyên tắc phổi), phân loại mức độ nghiêm trọng và điều phối dòng công việc (workflow)11–14,20.

  • Định lượng & chỉ dấu hình ảnh (imaging biomarkers): đo mật độ xương, mỡ nội tạng, mỡ gan; định lượng cấu trúc não, chức năng thất trái, lưu lượng mạch vành; hỗ trợ đánh giá nguy cơ mạn tính9–10.
  • Ưu tiên xử lý: mô hình triage phát hiện tổn thương cấp để đưa lên đầu danh sách đọc phim, rút ngắn thời gian đến can thiệp12,20.
  • Cải thiện chất lượng hình ảnh: học sâu cho tái tạo lát cắt và giảm liều phóng xạ/giảm thời gian chụp nhưng vẫn giữ độ chẩn đoán9.
  • Dự báo lâm sàng: từ dữ liệu hình ảnh, AI dự báo diễn tiến (ví dụ: TBI, ung thư) hoặc hướng dẫn người mới nội soi/siêu âm đạt chất lượng chẩn đoán chấp nhận được13–14.

Nhiều nghiên cứu chứng minh hiệu quả hợp tác người–máy: AI cải thiện độ nhạy/đặc hiệu, giảm thời gian đọc, chuẩn hóa đánh giá; đồng thời các mô hình “AI hỗ trợ – bác sĩ quyết định cuối” thường đạt mức tin cậy và hiệu quả cao hơn AI vận hành độc lập16–20.

3. Lợi ích lâm sàng và hệ thống

Về lâm sàng, AI có thể tăng tốcnâng độ chính xác chẩn đoán, phát hiện tổn thương nhỏ, giảm biến thiên giữa các bác sĩ và hỗ trợ tạo báo cáo có cấu trúc. Về hệ thống, AI giúp ưu tiên ca khẩn, tối ưu luồng công việc, phân bổ nguồn lực và rút ngắn thời gian đến điều trị11–14,20. Trên một số nhiệm vụ, AI còn dự báo kết cục hoặc đề xuất cần làm thêm xét nghiệm/hình ảnh, hướng đến các đường dẫn chăm sóc được cá nhân hóa1–5,10.

  • Hiệu quả đọc & chất lượng: hỗ trợ bác sĩ phát hiện bất thường (nút phổi nhỏ, vi vôi hoá, vi xuất huyết) và giảm bỏ sót16–20.
  • Chuẩn hóa thực hành: giảm sai khác giữa chuyên gia/đơn vị; tăng khả năng tái lập kết quả16,19.
  • Hỗ trợ vùng tài nguyên hạn chế: siêu âm cầm tay/low-field MRI kết hợp AI mở rộng tiếp cận chẩn đoán tại tuyến cơ sở10,14.
Hình ảnh: Kiểm định khả năng tổng quát hóa của các hệ thống AI trong chẩn đoán hình ảnh. Ba thành phần cốt lõi trong việc kiểm định khả năng tổng quát hóa của các hệ thống AI trong lĩnh vực chẩn đoán hình ảnh bao gồm (1) hợp tác giữa bác sĩ và AI, (2) tính minh bạch, và (3) giám sát sau triển khai. Thứ nhất, hợp tác bác sĩ – AI nhấn mạnh sự cần thiết phải chuyển trọng tâm đánh giá từ việc chỉ xem xét hiệu năng của mô hình AI khi hoạt động độc lập sang đánh giá giá trị thực tiễn của AI như một công cụ hỗ trợ trong quy trình lâm sàng thực tế. Thứ hai, tính minh bạch đề cập đến yêu cầu tăng cường tính nghiêm ngặt trong việc công bố thông tin về mô hình AI, thông qua việc áp dụng bảng kiểm (checklists) và công khai các bộ dữ liệu hình ảnh y khoa phục vụ kiểm định và nghiên cứu. Cuối cùng, giám sát sau triển khai (postdeployment monitoring) bao gồm việc thiết lập các cơ chế thu nhận phản hồi từ bác sĩ lâm sàng và áp dụng chiến lược học liên tục (continual learning) để thường xuyên cập nhật, hiệu chỉnh mô hình, bảo đảm AI duy trì hiệu quả và an toàn trong môi trường thực tế (Nguồn: Rajpurkar P và cộng sự, 2023).

4. Thách thức trọng yếu khi triển khai

(i) Khả năng tổng quát hóa & dịch chuyển phân phối (dataset/domain shift). Mô hình có thể suy giảm hiệu năng khi áp dụng sang bệnh viện, máy chụp, dân số, giao thức khác. Cần thiết kế thử nghiệm đa trung tâm, thử nghiệm tiến cứu/ngẫu nhiên cụm, và chiến lược thích ứng miền/chuẩn hoá dữ liệu6–8,15.

(ii) Tính minh bạch & giải thích được (black box). Sự thiếu minh bạch làm giảm niềm tin và khó tích hợp vào quyết định lâm sàng. Hướng khắc phục gồm: báo cáo toàn diện (dataset statements/model cards), phương pháp giải thích địa phương/toàn cục, và thiết kế UI nhấn mạnh bất định16,21–22.

(iii) Quản trị vòng đời & drift sau triển khai. Hiệu năng mô hình thay đổi theo thời gian do thay đổi dân số/thiết bị/giao thức. Cần giám sát hiệu năng, cảnh báo drift, cập nhật/ tái huấn luyện có kiểm soát, và audit định kỳ23.

(iv) Dữ liệu, công bằng & riêng tư. Tính đại diện dữ liệu là điều kiện tiên quyết để tránh thiên lệch. Liên minh đa trung tâm, học liên kết (federated learning) và chuẩn chia sẻ siêu dữ liệu giúp mở rộng dữ liệu mà vẫn bảo vệ quyền riêng tư21–22.

(v) Quy định & chứng cứ. Cần khung pháp lý phản ánh đặc thù phần mềm y tế AI/ML, hỗ trợ phê duyệt theo chu trình (total product lifecycle) và cập nhật thích ứng (“learning” devices), đồng thời đòi hỏi chứng cứ lâm sàng tiến cứu về an toàn–hiệu quả chứ không chỉ AUROC trong huấn luyện6–8,23.

5. Hướng phát triển tương lai: Foundation & Multimodal AI

Mô hình nền (foundation models)AI đa phương thức đang dịch chuyển trọng tâm từ mô hình “hẹp–đơn nhiệm” sang AI tổng quát y khoa có khả năng xử lý đồng thời hình ảnh, ngôn ngữ tự nhiên (báo cáo, ghi chú EHR), và dữ liệu xét nghiệm/sinh tồn. Tự giám sát (self-supervised) trên kho dữ liệu chưa gán nhãn lớn giúp trích xuất biểu diễn giàu thông tin, nâng cao hiệu quả “học chuyển” cho nhiệm vụ lâm sàng cụ thể24–25.

Kết hợp mô hình ngôn ngữ lớn (LLM) với thị giác y khoa cho phép: sinh báo cáo X-quang/CT/MRI theo phong cách chuẩn, giải thích phát hiện cho bệnh nhân, trích xuất nhiệm vụ từ chỉ định lâm sàng, và hỗ trợ reasoning dựa trên bằng chứng. Các nghiên cứu gần đây cho thấy LLM mã hoá đáng kể tri thức lâm sàng và có thể hỗ trợ quyết định, với điều kiện được kiểm định chặt chẽ và thiết kế “human-in-the-loop”26–27.

Tầm nhìn thực tiễn là kiến trúc “AI cộng sự” nơi mô hình hỗ trợ bác sĩ trong phát hiện, soạn báo cáo, ưu tiên ca, dự báo rủi ro, và gợi ý đường dẫn chăm sóc. Sự thành công phụ thuộc vào đồng thiết kế với bác sĩ/chuyên gia quy trình, minh bạch dữ liệu–mô hình, và giám sát sau triển khai theo tiêu chuẩn chất lượng.

Hình ảnh: Tiềm năng của các mô hình AI tổng quát trong chẩn đoán hình ảnh. Các mô hình trí tuệ nhân tạo y khoa tổng quát (generalist medical AI models) mang lại tiềm năng to lớn trong việc chuyển đổi toàn diện lĩnh vực chẩn đoán hình ảnh. Những mô hình này có khả năng tạo ra báo cáo chẩn đoán hình ảnh hoàn chỉnh, bao gồm cả các mô tả và diễn giải lâm sàng được tổng hợp từ nhiều nguồn dữ liệu khác nhau như hình ảnh y khoa, bối cảnh lâm sàng, và các hình ảnh trước đó. Ngoài ra, các mô hình này còn có thể liên kết những vùng cụ thể trên hình ảnh với mô tả ngôn ngữ tương ứng, tùy chỉnh phản hồi theo người sử dụng, và sinh ra các kết quả chẩn đoán trong một ngữ cảnh diễn giải đầy đủ, giúp bác sĩ hiểu rõ hơn ý nghĩa lâm sàng của các phát hiện. Đáng chú ý, những mô hình tổng quát này còn được kỳ vọng có khả năng thích ứng linh hoạt với các môi trường thực hành và công nghệ mới, nhờ đó duy trì hiệu quả khi kỹ thuật hình ảnh hoặc dữ liệu thay đổi. Ngoài dữ liệu hình ảnh, các mô hình này có thể tích hợp thêm dữ liệu “omics” (bao gồm genomics, epigenomics, proteomics và metabolomics), mở ra hướng đi mới cho chẩn đoán và điều trị cá thể hóa dựa trên dữ liệu đa tầng sinh học. (Nguồn: Rajpurkar P và cộng sự, 2023).

6. Đề xuất ứng dụng cho Việt Nam

  • Ứng dụng ưu tiên, có lợi ích rõ: mô-đun triage X-quang ngực (tràn khí, xuất huyết, PE), phát hiện đột quỵ trên CT, hỗ trợ siêu âm tuyến cơ sở/di động; triển khai thí điểm tại bệnh viện tuyến trung ương rồi mở rộng.
  • Mô hình “AI made in Vietnam”: huấn luyện/tinh chỉnh trên dữ liệu Việt Nam để tăng tổng quát hoá; khuyến khích liên minh đa trung tâm và federated learning nhằm mở rộng dữ liệu nhưng vẫn đảm bảo riêng tư22.
  • Chuẩn dữ liệu & pháp lý: ban hành profile chuẩn (DICOM + metadata chuẩn hoá), yêu cầu báo cáo minh bạch (dataset/model cards), giám sát drift và hệ thống phê duyệt–cập nhật theo vòng đời23.
  • Đào tạo & vận hành: chương trình “AI for Radiologists & Sonographers” về đọc kết quả, hiểu bất định, và ra quyết định người–máy; thiết kế UI/UX hiển thị rationale mức ca.
  • Đo lường giá trị: tiêu chí kết cục lâm sàng và vận hành (thời gian đến điều trị, tỉ lệ bỏ sót, công suất đọc, chi phí), thử nghiệm tiến cứu/ngẫu nhiên cụm thay vì chỉ so sánh AUC.

7. Kết luận

AI trong chẩn đoán hình ảnh đang chuyển từ các mô hình đơn nhiệm sang nền tảng tổng quát đa phương thức, với bằng chứng ngày càng tăng về lợi ích lâm sàng và hệ thống. Tuy vậy, khả năng tổng quát hoá, minh bạchgiám sát sau triển khai là điều kiện tiên quyết để đạt giá trị bền vững. Thay vì thay thế, AI đóng vai “cộng sự” giúp bác sĩ giảm sai sót, chuẩn hoá chất lượng, và mở rộng tiếp cận chẩn đoán – đặc biệt hữu ích cho các bối cảnh tài nguyên hạn chế. Với chiến lược dữ liệu–pháp lý–đào tạo phù hợp, Việt Nam có thể “bước tắt đón đầu” để tận dụng làn sóng AI cho chuyển đổi số y tế.

8. Tài liệu tham khảo

Tổng quan NEJM

Rajpurkar P, Lungren MP, Drazen JM, Kohane IS, Leong TY. AI in Medicine — The Current and Future State of AI Interpretation of Medical Images. N Engl J Med. 2023;388:1981–1990. doi:10.1056/NEJMra2301725 .

Các tài liệu liên quan

  1. Topol EJ, et al. Artificial intelligence in health and medicine. Nat Med. 2022;28(1):31–38. doi:10.1038/s41591-021-01614-0.
  2. Jones OT, Ranmuthu CKI, Hall PN, Funston G, Walter FM. Early detection of skin cancer in the community and primary care: an integrated review. Lancet Digit Health. 2022;4(7):e466–e476. doi:10.1016/S2589-7500(22)00085-1.
  3. Siontis KC, Noseworthy PA, Attia ZI, Friedman PA. Artificial intelligence–enhanced electrocardiography in cardiovascular disease. Nat Rev Cardiol. 2021;18(7):465–478. doi:10.1038/s41569-020-00503-2.
  4. Lu MY, Chen TY, Williamson DFK, et al. Artificial intelligence–based pathology predicts origins for cancers of unknown primary. Nature. 2021;594(7861):106–110. doi:10.1038/s41586-021-03512-4.
  5. Abràmoff MD, et al. Foundational considerations for artificial intelligence using ophthalmic images. Ophthalmology. 2022;129(2S):e14–e25. doi:10.1016/j.ophtha.2021.09.015.
  6. Yuba M, Iwasaki K. Analysis of AI- and ML-based medical devices approved in the United States and Japan. Sci Rep. 2022;12(1):16874. doi:10.1038/s41598-022-21067-6.
  7. Tariq A, Purkayastha S, Chintha AR, et al. Clinical artificial intelligence in radiology: current applications and best available evidence. J Am Coll Radiol. 2020;17(11):1371–1381. doi:10.1016/j.jacr.2020.06.004.
  8. Richardson ML, et al. Non-interpretive uses of artificial intelligence in radiology. Acad Radiol. 2021;28(8):1225–1235. doi:10.1016/j.acra.2020.12.010.
  9. Wang G, Ye JC, De Man B. Deep learning for tomographic image reconstruction. Nat Mach Intell. 2020;2(12):737–748. doi:10.1038/s42256-020-00273-z.
  10. Mazurek MH, Cahn BA, Zuckerman JE, et al. Portable, low-field magnetic resonance imaging enables bedside assessment of intracerebral hemorrhage. Nat Commun. 2021;12(1):5119. doi:10.1038/s41467-021-25349-w.
  11. Brink JA, Hricak H. Radiology 2040: a vision for the future. Radiology. 2023;306(1):69–72. doi:10.1148/radiol.230089.
  12. Lee HW, Goo JM, Kim Y, et al. Effect of an artificial intelligence–based chest radiograph interpretation system on radiologists’ diagnostic performance: a multicenter randomized clinical trial. Ann Am Thorac Soc. 2022;19(10):1769–1779. doi:10.1513/AnnalsATS.202201-070OC.
  13. Narang A, Bae R, Hong H, et al. Deep learning–guided acquisition of echocardiograms enables cardiac screening by novices. JAMA Cardiol. 2021;6(5):624–632. doi:10.1001/jamacardio.2020.7422.
  14. Pokaprakarn T, et al. Estimation of gestational age from blind ultrasound sweeps using artificial intelligence. NEJM Evid. 2022;1(5):EVIDoa2200021. doi:10.1056/EVIDoa2200021.
  15. Feng Y, et al. Domain adaptation for pneumonia classification from chest X-ray images. IEEE J Biomed Health Inform. 2022;26(3):1080–1090. doi:10.1109/JBHI.2021.3114060.
  16. Langlotz CP. Will artificial intelligence replace radiologists? Radiol Artif Intell. 2019;1(3):e190058. doi:10.1148/ryai.2019190058.
  17. Park A, Chute C, Rajpurkar P, et al. Deep learning–assisted diagnosis of cerebral aneurysms using HeadXNet. JAMA Netw Open. 2019;2(6):e195600. doi:10.1001/jamanetworkopen.2019.5600.
  18. Tschandl P, Rinner C, Apalla Z, et al. Human–computer collaboration for skin cancer recognition. Nat Med. 2020;26(8):1229–1234. doi:10.1038/s41591-020-0942-0.
  19. Bien N, Rajpurkar P, Ball RL, et al. Deep-learning–assisted diagnosis for knee magnetic resonance imaging: development and retrospective validation of MRNet. PLoS Med. 2018;15(11):e1002699. doi:10.1371/journal.pmed.1002699.
  20. Ahn JS, Park SJ, Park B, et al. Effect of artificial intelligence–aided chest radiograph interpretation on efficiency and accuracy of radiologists: a randomized clinical trial. JAMA Netw Open. 2022;5(10):e2229289. doi:10.1001/jamanetworkopen.2022.29289.
  21. Seastedt KP, Cheung L, Hu JC, et al. Global healthcare fairness: we need to share more data. PLOS Digit Health. 2022;1(2):e0000102. doi:10.1371/journal.pdig.0000102.
  22. Sheller MJ, Edwards B, Reina GA, et al. Federated learning in medicine: facilitating multi-institutional collaborations without sharing patient data. Sci Rep. 2020;10(1):12598. doi:10.1038/s41598-020-69250-1.
  23. Harvey HB, Gowda V. How the FDA regulates artificial intelligence–based medical devices. Acad Radiol. 2020;27(1):58–61. doi:10.1016/j.acra.2019.09.024.
  24. Krishnan R, Rajpurkar P, Topol EJ. Self-supervised learning in medicine and healthcare. Nat Biomed Eng. 2022;6(12):1346–1352. doi:10.1038/s41551-022-00914-1.
  25. Fei N, Chen Z, Zhang H, et al. Towards artificial general intelligence via multimodal foundation models. Nat Commun. 2022;13(1):3094. doi:10.1038/s41467-022-30761-2.
  26. Singhal K, Azizi S, Tu T, et al. Large language models encode clinical knowledge. arXiv preprint arXiv:2212.13138. 2022. Link.
  27. Lee P, Bubeck S, Petro J. Benefits, limits, and risks of GPT-4 as an artificial intelligence chatbot in medicine. N Engl J Med. 2023;388(13):1233–1239. doi:10.1056/NEJMp2301605.

MỘT SỐ TIN TỨC KHÁC

Back to top