1. Giới thiệu chung
Các hướng Nghiên cứu Y sinh mới: Khoa học Dữ liệu định hình tương lai Y tế
Khoa học dữ liệu y sinh đang trở thành nền tảng của những đột phá y học hiện đại — không phải nhờ các công nghệ quá phức tạp, mà nhờ khai thác hiệu quả nguồn dữ liệu sẵn có trong hệ thống y tế. Các hướng nghiên cứu mới tập trung vào việc tích hợp dữ liệu đa nguồn, xây dựng bằng chứng từ thực tiễn lâm sàng, phát triển các chỉ số sinh học số, và ứng dụng phân tích dự báo nhằm cải thiện kết quả điều trị. Những tiến bộ này đang tạo ra những thay đổi đáng kể trong chăm sóc sức khỏe.
2. Tích hợp dữ liệu đa phương thức: Bức tranh toàn diện về sức khỏe
Hao Y, Cheng C, Li J, Li H, Di X, Zeng X, Jin S, Han X, Liu C, Wang Q, Luo B, Zeng X, Li K. Multimodal Integration in Health Care: Development With Applications in Disease Management. J Med Internet Res. 2025 Aug 21;27:e76557. doi: 10.2196/76557. PMID: 40840463; PMCID: PMC12370271.
Tích hợp dữ liệu đa phương thức (multimodal data integration) đang cách mạng hóa cách chúng ta hiểu về sức khỏe bệnh nhân, bằng cách kết hợp các nguồn dữ liệu khác nhau như hình ảnh y khoa, hồ sơ sức khỏe điện tử, dữ liệu gen (genomics) và thông tin từ thiết bị đeo. Phương pháp này cung cấp góc nhìn đa chiều về tình trạng bệnh nhân, tăng cường khả năng chẩn đoán, điều trị và quản lý bệnh lý.

Trong ung thư học, dữ liệu đa phương thức cho phép xác định đặc điểm khối u chính xác hơn và hỗ trợ xây dựng kế hoạch điều trị cá nhân hóa. Một nghiên cứu cho thấy việc kết hợp các loại dữ liệu này có thể dự đoán chính xác đáp ứng điều trị bằng Anti–Human Epidermal Growth Factor Receptor 2 (Anti-HER2) với AUC = 0,91. Trong nhãn khoa, việc tích hợp dữ liệu di truyền và hình ảnh giúp phát hiện sớm bệnh lý võng mạc.
Tuy nhiên, tích hợp dữ liệu đa phương thức vẫn đối mặt với nhiều thách thức, như sự thiếu nhất quán trong thu thập, dữ liệu không đầy đủ hoặc sai lệch làm giảm độ tin cậy của mô hình. Để đạt hiệu quả, cần có chuẩn hóa dữ liệu, tiền xử lý nghiêm ngặt và xác thực liên ngành nhằm đảm bảo chất lượng phân tích dự báo.
3. Bằng chứng thế giới thực: Từ thử nghiệm lâm sàng đến thực tiễn
Manfred Stapff. The Importance of Real-World Evidence in Medical Research and Drug Development.
Applied Clinical Trials. 2025.
Dang A. Real-World Evidence: A Primer. Pharmaceut Med. 2023 Jan;37(1):25-36.
doi: 10.1007/s40290-022-00456-6. PMID: 36604368; PMCID: PMC9815890.
Real-World Evidence (RWE) – bằng chứng từ thế giới thực – đại diện cho một sự chuyển đổi trong nghiên cứu y học: từ việc chỉ dựa vào thử nghiệm lâm sàng (RCTs) sang khai thác dữ liệu từ thực tiễn chăm sóc sức khỏe hàng ngày. RWE là bằng chứng khoa học về tính an toàn và hiệu quả của một sản phẩm y tế, được tạo ra từ Real-World Data (RWD) – dữ liệu được thu thập trong quá trình chăm sóc thông thường.
Các nguồn RWD bao gồm bệnh án điện tử (EHRs), hồ sơ đăng ký, dữ liệu bảo hiểm, và dữ liệu từ ứng dụng hoặc thiết bị sức khỏe cá nhân. Một nghiên cứu so sánh hiệu quả điều trị đa u tủy xương (Multiple Myeloma) giữa thử nghiệm lâm sàng và dữ liệu thực tế cho thấy: bệnh nhân trong RWD thường lớn tuổi hơn, và kết quả chỉ ra rằng 6/7 phác đồ điều trị trong thế giới thực có thời gian sống không tiến triển thấp hơn 1,44 lần và sống toàn bộ thấp hơn 1,75 lần so với RCT tương ứng.

RWE có tiềm năng lấp đầy khoảng trống nghiên cứu, đặc biệt với bệnh hiếm gặp, khi nhiều bệnh nhân không thể tham gia thử nghiệm truyền thống. Ngoài ra, RWE hỗ trợ hoạch định chính sách y tế, quy hoạch nguồn lực, và đánh giá hiệu quả điều trị trong môi trường thực tế, góp phần giảm bất bình đẳng trong chăm sóc sức khỏe.
4. Dấu ấn sinh học số: Giám sát sức khỏe liên tục
Babrak LM, Menetski J, Rebhan M, Nisato G, Zinggeler M, Brasier N, Baerenfaller K, Brenzikofer T, Baltzer L, Vogler C, Gschwind L, Schneider C, Streiff F, Groenen PMA, Miho E. Traditional and Digital Biomarkers: Two Worlds Apart? Digit Biomark. 2019 Aug 16;3(2):92-102. doi: 10.1159/000502000. PMID: 32095769; PMCID: PMC7015353.
Trong y học hiện đại, biomarkers (dấu ấn sinh học) là công cụ không thể thiếu để đánh giá tình trạng sức khỏe. Sự phát triển của thiết bị kỹ thuật số và ứng dụng di động đã tạo ra một thế hệ mới – digital biomarkers, cung cấp dữ liệu liên tục, khách quan và cá nhân hóa hơn bao giờ hết.

Biomarkers truyền thống bao gồm các chỉ số như cholesterol, huyết áp, BMI... Trong khi đó, digital biomarkers được định nghĩa là “các phép đo sinh lý và hành vi khách quan, thu thập qua thiết bị kỹ thuật số đeo được, cấy ghép, hoặc tiêu hóa được”. Điểm khác biệt cốt lõi là khả năng giám sát liên tục, giúp phát hiện sớm thay đổi sức khỏe.
Digital biomarkers đã chứng minh tiềm năng trong nhiều lĩnh vực: phát hiện nguy cơ sa sút trí tuệ thông qua kiểm tra nhận thức trên máy tính, theo dõi vận động trong bệnh Huntington, và đánh giá triệu chứng Parkinson qua bài kiểm tra chạm ngón tay trên điện thoại thông minh.
Mặc dù tiềm năng lớn, lĩnh vực này vẫn gặp thách thức về chuẩn hóa định nghĩa, bảo mật dữ liệu, và quy trình phê duyệt chậm – cần được cải thiện để mở rộng ứng dụng lâm sàng.
5. Hệ thống hỗ trợ quyết định lâm sàng dựa trên AI
Elhaddad M, Hamam S. AI-Driven Clinical Decision Support Systems: An Ongoing Pursuit of Potential. Cureus. 2024 Apr 6;16(4):e57728. doi: 10.7759/cureus.57728. PMID: 38711724; PMCID: PMC11073764.

Clinical Decision Support Systems (CDSS) dựa trên AI đang cách mạng hóa quá trình ra quyết định y khoa, nhờ khả năng phân tích dữ liệu phức tạp và nhận diện mẫu ẩn (hidden patterns). Trong chẩn đoán hình ảnh, các mạng nơ-ron tích chập (CNNs) đã đạt hiệu suất tương đương chuyên gia trong phân loại ung thư da (Esteva et al.). Trong dự đoán rủi ro tim mạch, mô hình deep learning sử dụng EHRs giúp xác định sớm bệnh nhân có nguy cơ cao, cho phép can thiệp sớm và phòng ngừa biến chứng.
6. Thách thức và cơ hội phát triển
Bên cạnh tiến bộ, lĩnh vực khoa học dữ liệu y sinh đối mặt với thách thức lớn: bảo mật và quyền riêng tư dữ liệu; tính tương thích của hệ thống giữa các bệnh viện, đặc biệt với hạ tầng cũ; tốc độ chấp nhận công nghệ còn chậm trong một số cơ sở y tế.
Tuy nhiên, cơ hội phát triển tại Việt Nam rất lớn. Với hơn 100 triệu dân, Việt Nam sở hữu nguồn dữ liệu y tế quý giá cho huấn luyện mô hình AI. Chính phủ đang đẩy mạnh chuyển đổi số y tế, với Quỹ phát triển dữ liệu quốc gia trị giá 1.000 tỷ đồng (2025) — một bước tiến quan trọng để thúc đẩy đổi mới và ứng dụng AI trong y học.
7. Kết luận
Các hướng nghiên cứu khoa học dữ liệu y sinh mới thể hiện cách tiếp cận thực tiễn, hiệu quả và hướng đến bệnh nhân. Từ tích hợp dữ liệu đa nguồn đến bằng chứng thực tế, từ digital biomarkers đến hệ thống hỗ trợ quyết định thông minh — tất cả đều hướng tới mục tiêu chung: nâng cao chất lượng điều trị, giảm chi phí và thúc đẩy y học cá thể hóa trong kỷ nguyên dữ liệu.