Phương pháp tiếp cận dữ liệu lớn để dự đoán cấu trúc protein

Cấu trúc  proteincó liên quan đến sự phát triển của mô, chẳng hạn như: móng tay hoặc lông. Các protein khác hoạt động như cơ, kiểm soát sự trao đổi chất và đáp ứng miễn dịch, hoặc vận chuyển oxy trong hồng cầu và nếu chúng không hoạt động bình thường, có thể dẫn đến các bệnh nặng, như: bệnh Alzheimer. Để phát triển các phương pháp khắc phục các protein bị lỗi, điều quan trọng là phải biết cấu trúc của chúng.

Sử dụng phương pháp tiếp cận dữ liệu lớn, các nhà nghiên cứu của Viện Công nghệ Karlsruhe (KIT) đã phát triển một phương pháp để dự đoán cấu trúc protein. Trong các nghiên cứu của Viện Hàn lâm Khoa học Quốc gia Hoa Kỳ (PNAS), theo báo cáo của các nhà nghiên cứu  họ đã thành công việc dự đoán cấu trúc protein phức tạp nhất bằng các phân tích thống kê.

Alexander Schug thuộc Trung tâm Máy Tính Steinbuch cho biết: “Con người, chuột, cá voi, vi khuẩn hay thiên nhiên không phải liên tục tạo ra protein để tái tạo mà đôi khi thay đổi chúng theo đột biến và đột biến tiến hoá. Những đột biến này có thể được xác định một cách dễ dàng khi đọc thông tin di truyền tạo ra các protein.. Nếu đột biến xuất hiện theo cặp, phần protein liên quan chủ yếu nằm gần nhau. Với sự trợ giúp của máy tính, dữ liệu của nhiều phần liền kề không gian có thể được cấu thành để dự đoán chính xác cấu trúc ba chiều giống như một câu hỏi lớn”.

Sử dụng siêu máy tính, các nhà nghiên cứu tìm kiếm thông tin di truyền miễn phí có sẵn của hàng ngàn sinh vật, từ vi khuẩn đến con người, cho những đột biến tương quan. Schug cho biết thêm: “Bằng cách kết hợp công nghệ mới nhất và bộ dữ liệu, chúng tôi đã nghiên cứu gần 2.000 protein khác nhau. Đây là một chiều hướng hoàn toàn mới so với các nghiên cứu trước . Mặc dù công việc hiện tại là nghiên cứu cơ bản, kết quả được kết hợp trong các phương pháp điều trị mới của bệnh trong tương lai”.

Anh Tuấn (dịch)

Nguồn: http://www.statisticsviews.com/details/news/10497814/Big-data-approach-to-predict-protein-structures.html