Bigdata: Giải quyết vấn đề xã hội nguy hại với Phân tích dự đoán

Trước khi trở thành Phó Tổng thống Mỹ, Ông Mike Pence là thống đốc bang Indiana. Ông đã tuyên thệ nhậm chức thống đốc vào ngày 14 tháng 1 năm 2013, với một số mục tiêu chính sách đưa ra, bao gồm cải thiện sức khỏe và cuộc sống hạnh phúc hơn của nguời dân bang Indiana. Trong nhiệm kỳ lãnh đạo, bang của ông phải đối mặt với một số vấn đề xã hội nguy hại bao gồm tỷ lệ tử vong trẻ sơ sinh ở mức cao; dịch bệnh opioid (bệnh lạm dụng thuốc giảm đau có tính chất gây nghiện) ngày càng tăng liên quan đến sử dụng thuốc theo đơn và thuốc bất hợp pháp (thuốc nghiện); vấn đề tội phạm và tội phạm tái phạm tội.

Ông Chris Atkins, người từng là giám đốc chính sách của Thống đốc Pence trong quá trình tranh cử làm thống đốc và sau đó làm giám đốc tài chính của bang Indiana, giải thích trong một cuộc phỏng vấn tháng 2 năm 2018, “… trong chính quyền của Pence, ông đã đưa ra những ý tưởng to lớn, táo bạo để thực hiện các kết quả chính sách mong muốn của mình trong quá trình tranh cử đã đề ra. Khi chúng ta xem xét các giải pháp cho những vấn đề lớn này, chúng ta nhận ra rằng cần phải có một cách mới để tiếp cận giải quyết vấn đề – một chiến lược để giải quyết các vấn đề lớn như tỷ lệ tử vong ở trẻ sơ sinh. Chiến lược đó đã trở thành chính phủ định hướng dựa trên dữ liệu.”

Tỷ lệ tử vong trẻ sơ sinh

Tỷ lệ tử vong trẻ sơ sinh của Mỹ đã giảm liên tục trong nhiều thập niên, giảm từ 9,4 ca tử vong trên 1.000 ca sinh sống năm 1990 xuống còn 5,6 ca tử vong vào năm 2016 . Tuy nhiên, ở bang Indiana tỷ lệ đó ở mức cao (7,5). Bang Indiana là một trong những bang có tỷ lệ tử vong trẻ sơ sinh cao nhất trong cả nước Mỹ. Đặc biệt, trẻ em da đen có tỷ lệ tử vong trẻ sơ sinh (14,4) – cao hơn gấp đôi tỷ lệ trẻ em da trắng (6.4). Do tỷ lệ tử vong ở trẻ sơ sinh thường được sử dụng như một chỉ số về mức độ sức khỏe ở một quốc gia, một thống kê đáng ngạc nhiên, nếu ví bang Indiana là một quốc gia, thì tỷ lệ tử vong ở trẻ sơ sinh của Indiana sẽ cao hơn Kuwait (7,0) và đối với trẻ em da đen sẽ cao hơn Colombia (13,6), vùng lãnh thổ giữa Israel-Palestine (14,1) và Jordan (14,2).

Như thường lệ của các chính phủ khi đối phó với các vấn đề xã hội phức tạp và  nguy hại, các nhà hoạch định chính sách của bang Indiana gặp khó khăn khi nhìn vào lớp màn phủ bên ngoài của Big Data và sự phức tạp của vấn đề để có thể tìm ra được nguyên nhân gốc rễ của vấn đề tử vong trẻ sơ sinh của bang Indiana. Theo ông Atkins giải thích rằng chính phủ “… phải theo những suy nghĩ của họ – trong trường hợp này, họ tin rằng việc hút thuốc, uống rượu và lạm dụng thuốc có tính chất gây nghiện là nguyên nhân chính gây tử vong ở trẻ sơ sinh.” Thật không may, những nỗ lực để giảm bớt những vấn đề này không có tác động đáng kể nào để cải thiện tỷ lệ này. Ông Atkins và nhóm của ông nhận ra rằng cần phải có những hiểu biết sâu sắc hơn để giải quyết vấn đề. Đặc biệt, họ cần hiểu biết thêm về mối tương quan giữa các bà mẹ và con của họ.

May mắn thay, người tiền nhiệm trước là Ông Mitch Daniels, đã thiết lập một nền tảng văn hóa mạnh mẽ về quyết định dựa trên dữ liệu trong các cơ quan của Bang, vì vậy ông Pence chỉ phải tìm ra cách để mở rộng văn hóa đó ở các cơ quan của Bang. Nhóm nghiên cứu đã đưa ra giả thuyết rằng công nghệ phân tích dự đoán có thể được áp dụng cho các dữ liệu lớn của các cơ quan của Bang đang nắm giữ để nghiên cứu nguyên nhân gốc rễ của tỷ lệ tử vong trẻ sơ sinh và phát triển lộ trình để giải quyết vấn đề. Đây là khởi đầu của Trung tâm Quản lý và Hiệu năng của Indiana (MPH).

MPH được thành lập để đáp ứng với một tầm nhìn đầy tham vọng: Tạo ra chính phủ nhà nước hiệu quả, minh bạch và hiệu quả nhất trong cả nước bằng cách phát triển một hệ thống quản lý dựa trên dữ liệu toàn diện trong toàn hệ thống. Về mặt kỹ thuật, MPH là nền tảng phân tích dự báo theo thời gian thực dựa trên công nghệ SAP. Công nghệ này cho phép các nhà khoa học dữ liệu có thể định lượng được tầm quan trọng của các yếu tố nguy cơ đã biết và trước đó chưa biết được chứa đựng trong Big Data và thiết lập mối tương quan giữa các yếu tố nguy cơ đó.

Đối với dự án đầu tiên, Ông Pence đã áp dụng cho Bang trong việc phân tích dự đoán 9 tỷ thông tin dữ liệu trong 50 bộ dữ liệu lớn để xác định các tổng thể con với những ảnh hưởng cơ bản nhất đến tỷ lệ tử vong ở trẻ sơ sinh. Về cơ bản, là sự kết hợp thông tin các bà mẹ và trẻ sơ sinh giữa các bộ dữ liệu với nhau (trong khi duy trì tính bảo mật ở một môi trường an toàn dữ liệu) và bắt đầu tìm kiếm các mẫu thông tin có liên quan. Các dữ liệu cho thấy rằng có một số yếu tố nguy cơ về mặt thống kê quan trọng chưa bao giờ được các chuyên gia y tế xem xét; mối tương quan giữa một số yếu tố rủi ro đã biết và trước đây chưa biết, mà kết hợp đó làm tăng yếu tố nguy cơ của tổng thể; các tổng thể con và khu vực cụ thể với sự ảnh hưởng có thể định lượng được và dự đoán được cho tỷ lệ tử vong ở trẻ sơ sinh.

Nhưng quan trọng nhất, phân tích dữ liệu cho thấy rằng cảm nhận của chúng ta là sai: Tiếp cận chăm sóc sức khỏe tiền sinh sản – lạm dụng thuốc – nổi lên như là yếu tố quan trọng nhất ảnh hưởng gây tử vong ở trẻ sơ sinh. Ông Atkins mô tả điều này là “… một sự hiểu biết đổi mới vì nó nói với chúng ta rằng chúng ta đã điều chỉnh các chính sách sai lầm.” Họ đã sử dụng sự hiểu biết mới này để bảo đảm dành được một nguồn ngân sách 13,5 triệu đô la cho nhiều mục tiêu hơn. Và qua đó đã chứng minh tính hiệu quả của phân tích dự báo, tài trợ liên tục được phân bổ cho MPH của Bang để giải quyết các vấn đề xã hội nguy hại khác.

Dịch bệnh opioid (lạm dụng thuốc giảm đau có tính chất gây nghiện)

Mỹ đang phải hứng chịu sự mất mát bởi một dịch bệnh opioid, với hơn 2 triệu người Mỹ nghiện thuốc giảm đau theo kê đơn, và thuốc fentanyl và các loại thuốc bất hợp pháp như heroin. Một thống kê đáng kinh ngạc là mặc dù Mỹ chỉ chiếm 5% dân số thế giới, nhưng người dân của Mỹ tiêu thụ 80% thuốc giảm đau trên thế giới. Tình trạng khẩn cấp về y tế công cộng trên toàn quốc này là một vấn đề đang diễn ra và ngày càng nghiêm trọng, với việc dùng thuốc quá liều liên quan đến bệnh lạm dụng thuốc có chứa methadone (thuốc gây ghiện)  42.249 ca tử vong trong năm 2016, tăng gấp đôi so với năm trước. Dịch bệnh opioid đã tấn công Indiana đặc biệt khó khăn, trong năm 2016 theo báo cáo, cứ 1 trong 20 người dân sử dụng thuốc giảm đau opioid là bất hợp pháp. Trong năm 2015, Chính phủ đã đưa việc sử dụng ma túy vào tâm điểm của dịch HIV tồi tệ nhất trong hai thập kỷ qua. Và đáng báo động, 80% người sử dụng lao động ở bang Indiana đã quan sát việc lạm dụng thuốc theo toa tại nơi làm việc.

Giống như tử vong trẻ sơ sinh, lạm dụng thuốc có tính gây nghiện là một vấn đề xã hội nguy hại. Do chịu ảnh hưởng của các yếu tố kinh tế và xã hội phức tạp và liên quan. Cảnh sát bang Indiana đã đánh giá một lượng lớn dữ liệu về các xét nghiệm ma túy dương tính và trộm cắp dược phẩm,và họ đã nhìn nhận sâu sắc để có được cái nhìn toàn diện về vấn đề này do tính chất mối quan hệ ẩn của các thông tin trong các tập dữ liệu của họ. Được nhắc đến bởi một đợt bùng phát HIV và viêm gan C tại hạt Scott thuộc bang Indiana, Thống đốc Pence đã ký ban hành thành lập một lực lượng đặc nhiệm về thực thi, điều trị và phòng ngừa ma túy. Nhóm MPH đã hợp tác với lực lượng đặc nhiệm để kết hợp và phân tích các bộ dữ liệu, với hy vọng rằng các sự kiện tương lai như vậy có thể được dự đoán và ngăn chặn.

Thông tin an toàn công cộng được kết hợp với dữ liệu y tế để xác định các điểm nóng lạm dụng thuốc có tính chất gây nghiện và những khoảng trống trong điều trị – chính xác là các loại thông tin chi tiết có thể hành động thiếu. Ví dụ, hơn 40 ca tử vong liên quan đến lạm dụng chất gây nghiện đã được báo cáo ở quận Tippecanoe – cách nơi điều trị các bệnh dịch liên quan đến lạm dụng thuốc gây nghiện gần nhất 60 phút lái xe. Bang đã tận dụng những hiểu biết mới này để triển khai thiết lập thêm 5 trung tâm điều trị tại các địa điểm có nhu cầu lớn nhất, nơi mà trước đây chúng sẽ được đặt chỉ dựa trên thông tin về mật độ dân số. Khả năng của MPH để đi sâu vào phân tích dữ liệu cũng cung cấp khả năng mô hình rủi ro về nghiện và đề xuất các biện pháp can thiệp được nhắm tới mục tiêu.

Phạm tội tái phạm tội

Mỗi năm, hơn 700.000 tù nhân được thả ra khỏi các nhà tù ở Hoa Kỳ. Nhà tù ờ Indiana định nghĩa tái phạm tội là một sự trở lại tù giam trong vòng 3 năm kể từ ngày người phạm tội được thả ra khỏi một cơ quan cải tạo của Bang. Trong năm 2016, tỷ lệ tái phạm của Bang là 37%, với gần một nửa số tù nhân trở về đã bị kết tội mới. Các nghiên cứu đã chỉ ra rằng nam giới trẻ có nhiều khả năng tái phạm tội, trong khi những người tham gia vào chương trình có việc làm thì ít có khả năng tái phạm tội hơn. Nhưng những gì khó khăn  để xác định là làm thế nào để giảm mức độ tái phạm tội bằng cách nhắm mục tiêu các chương trình phù hợp, vào đúng thời điểm, để đúng người phạm tội – đây là nhiệm vụ mà MPH phải nghiên cứu giải quyết.

Khi các nghiên cứu trước đây tập trung vào hiệu quả tổng thể của các chương trình xã hội và cơ sở, MPH cho phép phân tích thông tin tập trung vào cá nhân, xem xét các đặc điểm và lịch sử phạm tội của cá nhân. Không còn giới hạn trong việc nghiên cứu hiệu quả chương trình chung cho các nhóm tội phạm, các nhà khoa học dữ liệu có thể hỏi: nếu chương trình này được áp dụng tại thời điểm này cho người phạm tội này, chúng ta có thể mong đợi được bao nhiêu khả năng tái phạm tội?  Do đó, bang đã lên các kế hoạch tạo ra các công việc và kết hợp hiệu quả hơn các chương trình với các cá nhân để kết quả tốt nhất. MPH cũng đã được sử dụng để thông báo các quyết định chính sách về các vấn đề quan trọng như cải cách kết án.

Một cách tiếp cận dựa trên dữ liệu để chống lại các vấn đề xã hội nguy hại

Điều rõ ràng từ các kịch bản được quản lý bởi MPH của Indiana là ở trung tâm của mọi vấn đề xã hội nguy hại phức tạp. Xem xét rằng 75% người phạm tội tái phạm của Bang được chẩn đoán mắc rối loạn sử dụng chất gây nghiện, nhiều cá nhân chắc chắn đã được xác định là thuộc  nhóm có nguy cơ cao  trong nhiều nghiên cứu của MPH. Thật vậy, mối tương quan chéo này có thể là cốt lõi của lý do tại sao Indiana có tỷ lệ vụ cướp dược phẩm cao.

Trong đó, giá trị thực sự của MPH, không phải là ở một giải pháp cho một vấn đề duy nhất – mà là một nền tảng dựa trên dữ liệu có thể được tận dụng để cung cấp thông tin chi tiết có thể hành động cho bất kỳ vấn đề nào; sự phụ thuộc lẫn nhau giữa các vấn đề; và thậm chí để dự đoán những vấn đề mới có thể phát sinh. Để báo cho ông Atkins: “Các vấn đề lớn thường không chú trọng trong hệ thống, chương trình và tiểu bang… nhưng nhiều cơ quan có dữ liệu được lưu giữ có thể giúp chính phủ đạt được những hiểu biết có thể hành động và giúp điều chỉnh chính sách và lập kế hoạch tốt hơn được định hướng dựa trên dữ liệu thay vì theo định hướng… Chính phủ định hướng dựa trên dữ liệu không phải về công nghệ. Đó là về tận dụng dữ liệu làm tài sản để hoàn thành sứ mệnh của chính phủ nhằm cải thiện cuộc sống của người dân.”

Công Hoan (lược dịch)

Nguồn:http://www.digitalistmag.com/improving-lives/2018/06/07/solving-wicked-problems-with-predictive-analytics-06171703