Trong thập kỷ qua, AI đã thâm nhập vào hầu hết mọi ngóc ngách của khoa học. Các mô hình học máy đã được sử dụng để dự đoán cấu trúc protein, ước tính phần rừng nhiệt đới Amazon đã bị mất do nạn phá rừng và thậm chí phân loại các thiên hà xa xôi có thể là nơi cư trú của các ngoại hành tinh.
Mặc dù AI có thể được sử dụng để tăng tốc khám phá khoa học, giúp các nhà nghiên cứu đưa ra dự đoán về các hiện tượng khó nghiên cứu hoặc tốn kém, nhưng AI cũng có thể khiến các nhà khoa học lạc lối. Tương tự như chatbot đôi khi “ảo giác” hoặc bịa đặt, các mô hình học máy đôi khi có thể đưa ra kết quả sai lệch hoặc sai lầm.
Trong một bài báo đăng trực tuyến ngày 09 tháng 11 năm 2023 trên tạp chí Science, các nhà nghiên cứu tại Đại học California, Berkeley, đã trình bày một kỹ thuật thống kê mới để sử dụng một cách an toàn các dự đoán thu được từ các mô hình học máy để kiểm tra các giả thuyết khoa học.
Kỹ thuật này được gọi là suy luận dựa trên dự đoán (PPI), sử dụng một lượng nhỏ dữ liệu trong thế giới thực để điều chỉnh đầu ra của các mô hình tổng quát, ví dụ như AlphaFold, dự đoán cấu trúc protein – trong bối cảnh các câu hỏi khoa học cụ thể.
“Những mô hình này mang tính tổng quát: Chúng có thể trả lời nhiều câu hỏi, nhưng chúng tôi không biết câu hỏi nào chúng trả lời tốt và câu hỏi nào chúng trả lời tệ – và nếu bạn sử dụng chúng một cách đơn thuần, không biết mình đang ở trong trường hợp nào, bạn có thể nhận được những câu trả lời không chính xác”, Michael Jordan, giáo sư về kỹ thuật điện và khoa học máy tính, thống kê tại UC Berkeley cho biết. “Với PPI, bạn có thể sử dụng mô hình nhưng vẫn sửa các lỗi có thể xảy ra, ngay cả khi ngay từ đầu bạn không biết bản chất của những lỗi đó.”
Rủi ro của độ chệch tiềm ẩn
Khi các nhà khoa học tiến hành thử nghiệm, họ không chỉ tìm kiếm một câu trả lời duy nhất. Họ muốn có được nhiều câu trả lời hợp lý. Điều này được thực hiện bằng cách tính toán “khoảng tin cậy”, có thể tìm được bằng cách lặp lại một thử nghiệm nhiều lần và xem kết quả thay đổi như thế nào.
Trong hầu hết các nghiên cứu khoa học, khoảng tin cậy thường đề cập đến một số liệu thống kê tóm tắt hoặc tổng hợp chứ không phải các điểm dữ liệu riêng lẻ. Tuy nhiên, hệ thống máy học tập trung vào các điểm dữ liệu riêng lẻ và không cung cấp những loại đánh giá về độ không chắc chắn. Ví dụ: AlphaFold dự đoán cấu trúc của một protein đơn lẻ, nhưng nó không cung cấp khái niệm về độ tin cậy cho cấu trúc đó cũng như không có cách nào để đạt được khoảng tin cậy liên quan đến các đặc tính chung của protein.
Các nhà khoa học có thể sử dụng các dự đoán từ AlphaFold như thể chúng là dữ liệu để tính khoảng tin cậy cổ điển, bỏ qua thực tế rằng những dự đoán này không phải là dữ liệu. Vấn đề với cách tiếp cận này là hệ thống máy học có nhiều độ chệch tiềm ẩn có thể làm sai lệch kết quả. Những độ chệch này một phần xuất phát từ dữ liệu vốn là những nghiên cứu khoa học hiện có nói chung có thể không có cùng trọng tâm như nghiên cứu hiện tại.
Jordan nói: “Thật vậy, trong các vấn đề khoa học, chúng ta thường quan tâm đến những hiện tượng nằm ở ranh giới giữa cái đã biết và cái chưa biết”. “Không có nhiều dữ liệu từ quá khứ nằm ở ranh giới đó và điều đó khiến các mô hình AI tạo ra nhiều khả năng ‘ảo giác’ hơn, từ đó tạo ra kết quả không thực tế.”
Tính khoảng tin cậy hợp lệ
PPI cho phép các nhà khoa học kết hợp các dự đoán từ các mô hình như AlphaFold mà không đưa ra bất kỳ giả định nào về cách xây dựng mô hình hoặc dữ liệu. Để làm được điều này, PPI yêu cầu một lượng nhỏ dữ liệu không chệch, liên quan đến giả thuyết cụ thể đang được nghiên cứu, kết hợp với các dự đoán học máy tương ứng với dữ liệu đó. Bằng cách kết hợp hai nguồn bằng chứng này, PPI có thể hình thành khoảng tin cậy hợp lệ.
Ví dụ: nhóm nghiên cứu đã áp dụng kỹ thuật PPI cho các thuật toán có thể xác định chính xác các khu vực bị phá rừng ở Amazon bằng hình ảnh vệ tinh. Nhìn chung, những mô hình này chính xác khi được thử nghiệm riêng lẻ trên các khu vực trong rừng. Tuy nhiên, khi những đánh giá này được kết hợp để ước tính nạn phá rừng trên toàn bộ Amazon, khoảng tin cậy trở nên sai lệch. Điều này có thể là do mô hình gặp khó khăn trong việc nhận ra một số mô hình phá rừng mới hơn.
Với PPI, nhóm nghiên cứu có thể điều chỉnh sai lệch trong khoảng tin cậy bằng cách sử dụng một số ít khu vực bị phá rừng do con người gắn nhãn. Nhóm nghiên cứu cũng chỉ ra cách áp dụng kỹ thuật này cho nhiều nghiên cứu khác, bao gồm các câu hỏi về sự gấp nếp của protein, phân loại thiên hà, mức độ biểu hiện gen, đếm sinh vật phù du và mối quan hệ giữa thu nhập và bảo hiểm y tế tư nhân. Jordan cho biết: “Thực sự không có giới hạn nào về loại câu hỏi mà phương pháp này có thể được áp dụng. “Chúng tôi nghĩ rằng PPI là một thành phần rất cần thiết của khoa học hợp tác, sử dụng nhiều dữ liệu và mô hình hiện đại.”
Phạm Hạnh (dịch)
Nguồn: https://www.sciencedaily.com/releases/2023/11/231109221449.htm