Dữ liệu lớn về thiên văn học: Sử dụng số liệu thống kê theo cách mới để giải mã vũ trụ

Thời đại kỹ thuật số đã mang lại lợi ích to lớn cho cả lĩnh vực thống kê và thiên văn học. Tuy nhiên, theo Tiến sĩ Max Bonamente, giáo sư vật lý và thiên văn học tại Đại học Alabama ở Huntsville (UAH), hầu hết các nhà thiên văn học không được đào tạo đầy đủ để nhận ra những lợi ích đáng kể có được khi kết hợp thống kê và thiên văn. Ông và các đồng nghiệp của mình đang làm việc để thay đổi tất cả những điều đó thông qua việc tiên phong nghiên cứu lĩnh vực thống kê thiên văn học.

Tiến sĩ Bonamente đã xuất bản một bài báo trong Thông báo hàng tháng của Hiệp hội Thiên văn hoàng gia. Trong đó ông giới thiệu một bước ngoặt mới đầy sáng tạo trong phân phối xác suất hứa hẹn sẽ cách mạng hóa cách thức diễn giải dữ liệu vũ trụ.

Nhà nghiên cứu giải thích: “Theo truyền thống, các nhà thiên văn học là những nhà thống kê kém – chúng tôi muốn ‘tạo nên các số liệu thống kê khi chúng tôi thực hiện”. “Bài báo mới nhất của tôi là một phương pháp mới để giải thích các sai số hệ thống. Nó mô tả một phương pháp phân phối xác suất mới mà trước đây chưa từng nghĩ đến. Điều đó có ý nghĩa thực tế trong việc đưa ra kết luận từ các quan sát. Nhiều nhà thiên văn học không có nền tảng toán học cần thiết để làm thống kê. Thật khó, vì cốt lõi của thống kê là toán học. Rất ít người muốn dành thêm thời gian để làm việc đó. Tất nhiên, không phải ai cũng cảm thấy như vậy.”

Điều này được chứng minh bằng sự thành công của hội thảo IDD2022: Phương pháp thống kê cho dữ liệu sự kiện được tổ chức gần đây bởi UAH, một phần của Hệ thống Đại học Alabama. Tiến sĩ Bonamente và đồng nghiệp của ông, Tiến sĩ Lingling Zhao, trợ lý giáo sư khoa học vũ trụ, đã tổ chức hội thảo.

Cuộc họp đã tạo điều kiện cho các nhà khoa học trẻ tìm hiểu về các phương pháp thống kê phù hợp để phân tích và giải thích dữ liệu, đồng thời bao gồm phân tích hợp tác thực hành các vấn đề mẫu sử dụng phần mềm tiên tiến. Cuộc họp cũng cung cấp một diễn đàn cho các nhà thiên văn học và nhà nghiên cứu trong các lĩnh vực liên quan để trao đổi những tiến bộ gần đây trong việc phân tích dữ liệu sự kiện.

“Dữ liệu sự kiện” là tập hợp các sự kiện riêng lẻ trong thiên văn học, điển hình là các photon ánh sáng, ngoài ra còn có neutrino hoặc các hạt khác. Những sự kiện này có thể được nghiên cứu thông qua các ứng dụng thống kê dưới dạng hàm của vị trí (hình ảnh), thời gian (chẳng hạn như đường cong ánh sáng) hoặc năng lượng hoặc bước sóng (quang phổ). Các sự kiện cũng có thể được định nghĩa là một tập hợp các đại lượng, chẳng hạn như các sự kiện sóng hấp dẫn hoặc các cụm thiên hà được phát hiện thông qua các phép đo của nền vi sóng vũ trụ, là tàn dư được làm lạnh của ánh sáng đầu tiên có thể di chuyển tự do trong vũ trụ.

Tiến sĩ Bonamente là cựu sinh viên của UAH, lấy bằng thạc sĩ và tiến sĩ vật lý tại UAH, nơi ông đã phát triển việc sử dụng một phương pháp thống kê có tên là Chuỗi Markov Monte Carlo (MCMC) để phân tích các sự kiện vũ trụ. MCMC bao gồm một lớp thuật toán đặc biệt được sử dụng trong phân phối xác suất, một hàm toán học cung cấp xác suất xảy ra các kết quả có thể xảy ra khác nhau cho một thử nghiệm.

“Những phương pháp này đã giúp phân tích dữ liệu nhanh hơn và với độ chính xác cao hơn”, nhà nghiên cứu lưu ý. “Ngày nay, học máy có ở khắp mọi nơi trong thiên văn học. Ví dụ, chúng tôi đã sử dụng MCMC để đo hằng số Hubble, đây là một vấn đề lớn vào thời điểm đó.” Hằng số Hubble là một trong những con số quan trọng nhất trong vũ trụ học, vì nó cho chúng ta biết vũ trụ đang giãn nở nhanh như thế nào.

Thống kê thiên văn đại diện cho tương lai của quản lý và phân tích dữ liệu lớn trong thiên văn học, vì các công nghệ mới nhất đang tạo ra lượng dữ liệu đáng kinh ngạc với độ phức tạp thực sự đáng kinh ngạc. Thách thức để phân tích dữ liệu này chỉ tăng theo cấp số nhân khi các cơ chế thu thập dữ liệu mới phát triển trong radio, lò vi sóng, tia hồng ngoại, tia X, tia gamma, giao thoa kế và dụng cụ quang học sẽ yêu cầu các thuật toán và kỹ thuật thống kê mới.

Tiến sĩ Bonamente chỉ ra: “Hầu hết các nhà thiên văn học hay vật lý học đều không biết nhiều về lý thuyết xác suất chứ chưa nói đến thống kê”. “Công việc của một nhà khoa học phải là cẩn thận và không nhượng bộ mong muốn tìm ra một kết quả mới tuyệt vời khi nó không có ở đó. Vì vậy, kết hợp toán học và thiên văn học  hướng đi tự nhiên đối với tôi.”

Phạm Hạnh (dịch)

Nguồn: https://phys.org/news/2023-06-big-astronomy-statistics-decipher-universe.html

số liệu thống kêBigdatatiêu điểm
Comments (0)
Add Comment