Áp dụng khung chất lượng ở cơ quan Thống kê Quốc gia Australia (AB)

Khung chất lượng dữ liệu (DQF) của Thống kê Australia (ABS) là một khung tổng quát cho phép đánh giá một cách toàn diện và đa chiều chất lượng dữ liệu về một sản phẩm thống kê được biên soạn hay phát hành. DQF cho phép người sử dụng và các nhà cung cấp dữ liệu đánh giá chất lượng của một mục dữ liệu hoặc một bộ sưu tập các mục dữ liệu với mục đích và yêu cầu cụ thể của người sử dụng hay thiết kế một bộ sưu tập hoặc sản phẩm thống kê phù hợp với chủ định của mình.

Cho dù ABS đã có khuyến cáo nên quan tâm đến tất cả  bảy phương diện về chất lượng dữ liệu[1], nhưng vấn đề là cách nhìn nhận của người sử dụng hoặc nhà sản xuất về tầm quan trọng tương đối ở mỗi loại. ABS khuyến khích người dùng và nhà sản xuất dữ liệu xem xét các nhân tố chất lượng nào là quan trọng và liên quan nhất đến mục đích riêng của mình. Chất lượng gắn liền với tính phù hợp về mục đích sử dụng dữ liệu hoặc sản phẩm thống kê cần làm ra, và do giữa họ có mục đích khác nhau nên có thể đưa ra những đánh giá khác nhau về chất lượng đối với cùng một sản phẩm. Chẳng hạn, nếu coi trọng về độ tin cậy và sự tín nhiệm của nguồn dữ liệu, thì việc kiểm tra kỹ phương diện về môi trường thể chế tạo ra dữ liệu sẽ được coi trọng đặc biệt và điều này có thể sẽ có tầm quan trọng hơn khi đánh giá chất lượng tổng thể. Ngoài ra, nếu mục đích chính là để so sánh và đối chiếu dữ liệu, thì sẽ liên quan đặc biệt đến yếu tố gắn kết mang tính chặt chẽ.

Áp dụng DQF của ABS đối với người sử dụng số liệu thống kê
Khi đánh giá chất lượng một mục dữ liệu, tập dữ liệu hoặc sản phẩm thống kê nào đó, ta phải có thuyết minh trình bày về chất lượng. Trình bày chất lượng là những thông tin về chất lượng của một mục dữ liệu hay bộ sưu tập của những mục dữ liệu với việc sử dụng các khung chất lượng DQF của ABS. Mục đích của báo cáo chất lượng là để chuyển tải rõ ràng những đặc điểm quan trọng của dữ liệu có ảnh hưởng đến chất lượng, để những người sử dụng tiềm năng có thể đưa ra quyết định về tính phù hợp đối với việc sử dụng của mình. Báo cáo chất lượng phải đưa ra cả những điểm mạnh và mặt hạn chế của dữ liệu. Các báo cáo chất lượng có độ dài và mức độ chi tiết khác nhau, tùy thuộc vào đối tượng và hình thức phát hành. Chẳng hạn, ABS đưa ra  các báo cáo chất lượng cụ thể dựa trên những ấn phẩm thống kê phát hành, được gọi là “công bố chất lượng”. Các công bố chất lượng được tóm tắt ngắn gọn, chuyển tải nhanh chóng những thông điệp chất lượng thống kê quan trọng, cũng như cung cấp những đường dẫn để có thể biết thêm thông tin chi tiết về sản phẩm thống kê đầu ra. Công bố chất lượng của ABS được thiết kế chủ yếu dành cho các công bố  sản phẩm bằng điện tử, do đó có độ dài ngắn, và cho phép sắp xếp liên tiếp từng lớp thông tin trong một môi trường web, qua đó mỗi lớp kế tiếp có chứa thông tin chi tiết hơn. Các công bố chất lượng bổ sung của ABS, mang tính toàn diện và đầy đủ hơn cũng được thông báo, nhưng không thay thế những vấn đề hiện đang tồn tại của ABS (ví dụ: ghi chú giải thích, khái niệm, nguồn và phương pháp chứng minh bằng tài liệu).

Áp dụng DQF của ABS đối với người sản xuất số liệu thống kê: Việc chú trọng đến tính thích hợp của thông tin thống kê đã đề cao sự cần thiết phải xây dựng chất lượng trong các quá trình sản xuất và phân phát dữ liệu của các cơ quan thu thập thông tin. ABS khuyến cáo các nhà sản xuất thống kê xem xét  bảy phương diện chất lượng trước khi thiết kế bộ sưu tập, thu thập số liệu thống kê và sản xuất sản phẩm đầu ra. Cách tiếp cận này cho phép các quyết định mang tính am hiểu về các phương diện, bao gồm các yếu tố như phương pháp luận phù hợp, những sản phẩm đầu ra mong muốn và khả năng tiếp cận dữ liệu, tính gắn kết của bộ sưu tập  với  các  bộ sưu tập khác, hay  các sản phẩm và sự thích hợp của  bộ sưu tập với những mục đích nhất định của nó. Một số nguyên tắc được đề xuất đối với việc quản lý từng phương diện chất lượng được đưa ra sau đây.

1) Môi trường thể chế tạo ra nguồn dữ liệu: Các cơ quan thu thập dữ liệu cần xây dựng văn hóa tập trung vào chất lượng, và nhấn mạnh  tính khách quan và tính chuyên nghiệp. Cơ quan thu thập cần phải chuẩn bị đủ nguồn lực và kỹ năng cho mục tiêu dự định, có thể khuyến khích người trả lời cùng hợp tác bằng việc ủy quyền và đưa ra những đảm bảo thích đáng về mặt pháp lý v.v… có như vậy mới tạo ra nguồn dữ liệu tin cậy cho người sử dụng.

2) Dữ liệu mang tính phù hợp: Để có số liệu phù hợp, cơ quan thu thập cần phải cùng song hành  với người sử dụng về nhu cầu thông tin. Những cơ chế để làm điều này gồm những quá trình tư vấn và thu thập tin tức khác nhau, và những xem xét thường xuyên nhu cầu khách hàng.

3)Dữ liệu mang tính kịp thời: Tính kịp thời của dữ liệu thống kê xuất phát từ cân nhắc về  những mục đích chính của thông tin như: xem xét về thời gian mà thông tin vẫn còn giá trị có phụ thuộc vào mức độ thay đổi của hiện tượng, tần suất đo lường và tính sẵn sàng đáp ứng nhu cầu của những người sử dụng dựa vào những thông tin mới nhất không. Ngoài việc xem xét những khía cạnh này, khi dự định thời điểm phát hành dữ liệu, phải đưa ra những nhu cầu năng lực tổ chức sản xuất số liệu thống kê trong khung thời gian nhất định. Khả năng này bao gồm các nguồn nhân lực, những đòi hỏi về hệ thống, và mức độ chính xác cần thiết của dữ liệu. Tiếp theo phát hành dữ liệu sơ bộ là những dữ liệu đã được sửa đổi và là những số liệu cuối cùng. Thường người ta sử dụng chiến lược cho phép những dữ liệu ít chính xác có mặt sớm hơn để xử lý và đưa ra quyết định phát hành dữ liệu hoàn chỉnh hơn ở giai đoạn sau

4) Dữ liệu có độ chính xác: Ở giai đoạn thiết kế, việc xem xét  kỹ các yếu tố chất lượng để có được sự kết hợp tốt nhất giữa độ chính xác, chi phí và tính kịp thời là rất quan trọng. Cần đánh giá diện bao quát về mục tiêu để có thể hoàn thành chiến lược thu thập dữ liệu.  Nghiên cứu tính  thích hợp các công cụ thu thập dữ liệu sẽ đảm bảo giảm các lỗi trả lời điều tra. Cần đưa ra các biện pháp thỏa đáng đúng lúc để khuyến khích việc trả lời điều tra, tiếp đến là nghiên cứu các trường hợp không  trả lời điều tra và đối phó với các dữ liệu bị mất (ví dụ, thông qua việc quy lỗi hay chỉnh lý để có các ước lượng). Tất cả các giai đoạn thu thập và xử lý dữ liệu phải là những công việc xem xét thích đáng sự cần thiết đối với các quá trình đảm bảo chất lượng, bao gồm cả kiểm tra về tính thích hợp nội bộ và bên ngoài của dữ liệu với các chiến lược hiệu chỉnh tương ứng.

5 )Dữ liệu mang tính chặt chẽ: Đối với quản lý sự gắn kết, cơ quan thu thập dữ liệu phải sử dụng các khung tiêu chuẩn, khái niệm, các biến và các bảng phân loại có sẵn, để đảm bảo cho mục tiêu đo lường phù hợp với thời gian và trong suốt những lần thu thập khác nhau. Đồng thời, sử dụng các phương pháp thông thường và mang tính hệ thống trong thu thập và xử lý dữ liệu sẽ góp thêm phần gắn kết. Trường hợp dữ liệu có sẵn từ các nguồn khác nhau, cần phải tính đến khả năng xung đột và hợp nhất có thể về dữ liệu.

6) Dữ liệu có khả năng giải thích: Quản lý tốt khả năng giải thích rõ ràng và dễ hiểu của dữ liệu, chủ yếu liên quan đến việc cung cấp thông tin đầy đủ về độ đo thống kê và quy trình thu thập dữ liệu. Người dùng cần biết những gì đã được đo lường, chúng được đo ra sao, được đo chuẩn như thế nào. Mô tả về phương pháp luận cho phép người sử dụng đánh giá xem liệu các phương pháp sử dụng có khoa học, khách quan không, và mức độ tự tin của các phương pháp có được thể hiện trong kết quả không. Để đáp ứng những mục tiêu cụ thể, bằng việc sử dụng các phương pháp phân tích, mô tả hay  đồ họa thường có thể tăng thêm giá trị nhằm giúp vạch  ra các mô hình dữ liệu.

7) Có thể tiếp cận được dữ liệu: Quản lý khả năng tiếp cận cần phải tập trung vào việc làm thế nào để giúp người sử dụng biết về sự tồn tại của dữ liệu hoặc sản phẩm thống kê, xác định vị trí, và tiếp nhận  nó vào môi trường làm việc của họ. Danh mục sản phẩm đầu ra, hệ thống phân phối, các kênh phân phối và các phương tiện truyền thông, và các chiến lược cam kết với  người sử dụng là tất cả xem xét quan trọng liên quan đến phương diện chất lượng này.

Trần Mạnh Hùng, giới thiệu,

 NguồnAPPLYING THE ABS DATA QUALITY FRAMEWORK
http://www.abs.gov.au/ausstats/abs@.nsf/Latestproducts/1520.0Main%20Features10May%202009?opendocument&tabname=Summary&prodno=1520.0&issue=May%202009&num=&view


[1] Môi trường thể chế, sự phù hợp, tính kịp thời, độ chính xác, tính chặt chẽ, khả năng giải thích và truy cập được