Gần đây, các nghiên cứu có quy mô lớn đã xác định được một số cơ sở di truyền của các căn bệnh phổ biến nghiêm trọng như bệnh tim và bệnh tiểu đường, tuy nhiên hầu hết các tác động của di truyền với các căn bệnh này vẫn còn là ẩn số. Hiện nay, các nhà nghiên cứu tại trường Đại học Massachusetts Amherst mà đứng đầu là nhà thống kê sinh học Andrea Foulkes vừa áp dụng các công cụ thống kê tinh vi vào các cơ sở dữ liệu lớn hiện có nhằm phát hiện ra các thông tin mới quan trọng về các gen gây ra các tình trạng có liên quan đến bệnh tim, chẳng hạn như cholesterol cao.
Bà Foulkes cho biết: “Phương pháp phân tích dữ liệu mới này tạo ra nhiều cơ hội để phát triển các phương pháp điều trị mới. Đồng thời, nó cũng góp phần thúc đẩy các phương pháp xác định đối tượng có nguy cơ mắc bệnh tim cao. Một điều quan trọng nữa là phương pháp của chúng tôi dễ dàng sử dụng với phần mềm máy tính sẵn có và có thể được áp dụng rộng rãi để tăng thêm vốn kiến thức về di truyền đối với nhiều căn bệnh. Chúng tôi hi vọng điều này sẽ mang lại những hiểu biết sắc hơn về các rối loạn phổ biến và nâng cao sức khỏe toàn diện cho xã hội”.
Phương pháp phân tích mới do bà Foulkes cùng với bác sĩ chuyên khoa tim Muredach Reilly tại trường Đại học Pennsylvania và các thành viên khác phát triển được gọi là “Mô hình hóa hỗn hợp các giá trị P trong phân tích tổng hợp” hay MixMAP. Do sử dụng các cơ sở dữ liệu công cộng hiện có nên đây được coi là công cụ có chi phi thấp cho các nhà điều tra.
Bà Faulkes – hiện đang điều hành Viện nghiên cứu Sinh học tính toán, Thống kê sinh học và Tin sinh học tại trường ĐH Massachusetts Amherst giải thích: MixMap dựa trên một khung mô hình hóa thống kê có nguyên tắc và một lượng lớn các dữ liệu tổng hợp sẵn có từ các nghiên cứu tương quan về di truyền cho tới việc thử nghiệm chính thức về một tương quan mới ở mức độ locus (vị trí gen trên nhiễm sắc thể). Các thành viên khác trong nhóm nghiên cứu tại trường ĐH Massachusetts Amherst là Rongheng Lin- trợ lý giáo sư và các nghiên cứu sinh sau tiến sĩ là Gregory Matthews và Ujwall Das.
Bà Foulkes cũng giải thích rõ: phương pháp mới xem xét cấu trúc của bộ gen và đã được khái quát hóa cho các vấn đề khác. Trong nghiên cứu bệnh di truyền, các mô hình nghiên cứu tương quan toàn bộ nhiễm sắc thể truyền thống, nghiên cứu các biến đổi di truyền phổ biến trong một nhóm người bị bệnh so với nhóm người khỏe mạnh, trong đó tập trung vào những điểm đa hình đơn nucleotit (SNP) để biết được liệu có biến thể đơn nào liên quan đến căn bệnh đó hay không. Nếu 1 biến thể xuất hiện thường xuyên hơn ở người mắc bệnh thì SNP được cho là có liên quan đến bệnh đó.
Trong khi các phương pháp thống kê truyền thống đang “mò kim đáy biển” để tìm ra dấu hiệu mắc bệnh thì phương pháp mới của Foulkes và các cộng sự lại sử dụng kiến thức về các vùng DNA trong hệ gen, trong đó khả năng có chứa một số tín hiệu di truyền về biến thể của căn bệnh cùng tập trung trong một khu vực. Vì vậy, phương pháp này có thể phát hiện ra các nhóm biến thể bất thường hơn là chỉ có các SNP đơn, từ đó xác định được các vùng gen có dấu hiệu chắc chắn trên mức thay đổi bình thường.
Bà Foulkes ví von: “Giống như khi nghe một bản hòa tấu. Ta có thể nghe thấy cả tiếng trống và tiếng cello cho dù mỗi mỗi nhạc cụ đều chơi một cách trầm lặng, vì tất cả âm thanh đang hòa quyện với nhau. Các phương pháp thống kê hiện nay chỉ có thể nghe thấy tiếng trống nhưng lại ko thể nghe được tiếng cello dù cello có được chơi nhiều thể nào đi nữa. Nguyên nhân là vì không có tiếng cello nào lớn như tiếng trống.
Tuy nhiên, phương pháp của chúng tôi có thể làm được điều đó. Nhờ vậy, chúng tôi còn có thêm sức mạnh thống kê đáng kể để xác định được các gen mới có liên quan đến bệnh.
Bác sĩ Reilly cho biết MixMAP- với vai trò là chiến lược bổ sung cho các phương pháp truyền thống, sẽ là phương pháp nhận được sự quan tâm mạnh mẽ từ cộng đồng thống kê và ngành nghiên cứu cấu trúc gen liên quan đến tim mạch. Phương pháp này có thể được áp dụng cho các nghiên cứu di truyền hiện nay về mức cholesterol trong máu, đồng thời tìm ra những gen mới có khả năng trong việc phát hiện yếu tố quan trọng gây ra bệnh tim như cholesterol có mật độ lipoprotein thấp.
Bà Foulkes cho rằng kỹ thuật MixMAP vẫn là một kỹ thuật khám phá cần phải tiếp tục được xác định, tuy nhiên kỹ thuật này sẽ còn tiến xa hơn rất nhiều bằng cách sử dụng các phương pháp mô hình hóa phức tạp để xác định số lượng lỗi. Bà cũng nhấn mạnh “chúng tôi không chỉ đơn giản là xác định các tín hiệu mạnh nhất mà còn xác định được các đo lường tương quan để cho thấy chúng có ý nghĩa thống kê”.
Nhìn chung, các nhà chuyên môn đều nhận xét “So với các phương pháp phân tích dựa trên đa hình đơn nucleotit thì MixMAP cung cấp các thông tin bổ sung mới mẻ và dễ dàng thực hiện với các công cụ phần mềm thống kê nguồn mở hiện nay”.
Trang (St và dịch)
Nguồn: http://www.sciencedaily.com/releases/2013/02/130206185856.htm