Tích hợp học máy với các phương pháp thống kê giúp tăng cường các mô hình dự đoán rủi ro bệnh tật
Các nhà nghiên cứu từ Đại học Bắc Kinh đã tiến hành một đánh giá hệ thống toàn diện về việc tích hợp học máy vào các phương pháp thống kê cho các mô hình dự đoán rủi ro bệnh tật, làm sáng tỏ tiềm năng của các mô hình tích hợp trong chẩn đoán lâm sàng và các hoạt động sàng lọc. Nghiên cứu do giáo sư Feng Sun từ Khoa dịch tễ học và thống kê sinh học, Trường Y tế Công cộng, Đại học Bắc Kinh chủ trì đã được công bố trên Tạp chí khoa học dữ liệu y tế.
Dự đoán nguy cơ mắc bệnh rất quan trọng để chẩn đoán sớm và đưa ra quyết định lâm sàng hiệu quả. Tuy nhiên, các mô hình thống kê truyền thống, ví dụ như hồi quy logistic và hồi quy tỷ lệ nguy cơ Cox, thường gặp phải những hạn chế do các giả định cơ bản không phải lúc nào cũng đúng trong thực tế.
Trong khi đó, các phương pháp học máy, mặc dù có tính linh hoạt và khả năng xử lý dữ liệu phức tạp và không có cấu trúc, nhưng vẫn chưa chứng minh được hiệu suất vượt trội so với các mô hình truyền thống trong một số trường hợp nhất định. Để giải quyết những thách thức này, việc tích hợp học máy với các phương pháp thống kê truyền thống có thể cung cấp các mô hình dự đoán mạnh mẽ và chính xác hơn.
Đánh giá có hệ thống đã phân tích nhiều chiến lược tích hợp khác nhau cho các mô hình phân loại và hồi quy, bao gồm bỏ phiếu đa số, bỏ phiếu có trọng số, xếp chồng và lựa chọn mô hình, dựa trên việc các dự đoán từ các phương pháp thống kê và học máy có không đồng nhất hay không. Nghiên cứu phát hiện ra rằng các mô hình tích hợp thường vượt trội hơn cả phương pháp thống kê và học máy khi sử dụng riêng lẻ. Ví dụ, xếp chồng đặc biệt hiệu quả đối với các mô hình liên quan đến hơn 100 yếu tố dự báo, vì nó cho phép kết hợp các điểm mạnh của các mô hình khác nhau trong khi giảm thiểu các điểm yếu.
“Những phát hiện của chúng tôi cho thấy việc tích hợp máy học vào các phương pháp thống kê truyền thống có thể cung cấp các mô hình chính xác và tổng quát hơn để dự đoán nguy cơ mắc bệnh”, Giáo sư Feng Sun, cho biết. “Cách tiếp cận này có tiềm năng nâng cao việc ra quyết định lâm sàng và cải thiện kết quả của bệnh nhân”.
Trong tương lai, nhóm nghiên cứu có kế hoạch xác thực và cải thiện các phương pháp tích hợp hiện có hơn nữa và phát triển các công cụ toàn diện để đánh giá các mô hình này trong nhiều bối cảnh lâm sàng khác nhau. Mục tiêu cuối cùng là thiết lập các mô hình tích hợp hiệu quả và tổng quát hơn phù hợp với các tình huống khác nhau, cuối cùng là thúc đẩy các hoạt động chẩn đoán và sàng lọc lâm sàng.
Nguyễn Mai (dịch)
Nguồn: https://medicalxpress.com/news/2024-10-machine-statistical-methods-disease.html