Mải mê với số liệu thống kê

Kerstin Hänsel , Cơ quan Thống kê LB Đức[1]

I. Giới thiệu

Số lượng người  truy cập vào các trang web thống kê đang tăng lên hàng năm ở Đức –  vì  họ ở khắp thế giới. Chúng tôi đã xác định được khách hàng của mình, họ là những chuyên gia, đã được chúng tôi phục vụ tốt trong nhiều năm. Ngoài ra, còn có những khách hàng khác, họ đến với chúng tôi một cách ngẫu nhiên hoặc ngày càng đến với chúng tôi nhiều hơn thông qua các  công cụ tìm kiếm . Họ không sử dụng dữ liệu của chúng tôi và cũng chẳng phải là những người quen thuộc các thuật ngữ và phương pháp thống kê. Cho dù lúc đầu, trang mạng chúng tôi chỉ là hệ thống dịch vụ mới, với ý đồ là để cho các khách hàng hiện tại truy cập nhanh hơn đến các dữ liệu của mình. Hiện nay nó đã trở một cổng thông tin về phát triển kinh tế và xã hội được hàng triệu người truy cập.  Điều này có nghĩa là, thứ nhất, mức độ phổ biến của trang mạng chúng tôi tăng mạnh, và thứ hai, cơ cấu khách hàng đã thay đổi. Trong khi trước kia chúng tôi làm dữ liệu  chủ yếu dành cho các chuyên gia, hiện nay chúng tôi  buộc phải điều chỉnh phạm vi dữ liệu cơ bản của mình để cung cấp cho các nhóm khách hàng rộng  lớn hơn.

Phát triển các xuất bản phẩm qua các trang mạng thống kê tương tự như các ấn phẩm in,  nhưng nhanh hơn nhiều. Đầu tiên, các nhà thống kê làm đầy cơ sở dữ liệu bằng các số liệu và cách trình bày tập trung vào khả năng truy cập, các phương pháp thống kê và chất lượng số liệu. Ở bước hai, chúng tôi đã đưa lên thêm các ấn phẩm  dạng văn bản (đã được tối ưu hóa các xuất bản phẩm trên giấy) được tải xuống khi các tập tin dạng pdf và số lượng các yêu cầu về các tập tin cao hơn nhiều so với các ấn phẩm in. Nhưng làm thế nào để phục vụ hàng triệu người sử dụng hiện nay, khi họ  chỉ biết rất ít về chúng tôi và các dữ liệu của chúng tôi. Về cơ bản, đơn giản chúng tôi chỉ chuyển hệ thống ấn phẩm in  của mình sang hệ thống điện tử mà không lường trước được rằng việc tìm kiếm thông tin thông qua internet đã thay đổi đáng kể.

II. Những  yêu cầu mới đối với chúng tôi

a. Thông tin phải hiểu được đối với công chúng, những  người đến với các trang mạng của chúng tôi thông qua các đường kết nối (link), các công cụ tìm kiếm hoặc là một cách ngẫu nhiên.

Ngôn ngữ thống kê không thiên vị, mang tính hệ trọng và đầy rẫy những danh từ. Các đề mục diễn tả những gì mà các con số muốn nói theo cách quan sát. Ngôn ngữ thống kê được diễn đạt theo thể bị động. Chúng tôi không quen nói bản thân mình là những diễn viên. Ngôn ngữ chủ yếu gắn bó mọi người, là ngôn ngữ hấp dẫn và không có khoảng cách.

Thay vì đặt tên cho những người làm ra con số là diễn viên, chúng tôi xác nhận ý nghĩa của những con số với việc vây quanh chúng bằng các định nghĩa và  các phân định ranh giới. Do vậy, thay vì nói ” khoảng 7 triệu người nước ngoài đã sống ở Đức trong năm 2008 “, chúng tôi đưa ra các câu như ” Vào cuối năm 2008, đăng ký trung ương về người nước ngoài cho thấy  chỉ có tổng số khoảng 6.730.000 người ở Đức có quốc tịch nước ngoài “.

Chúng tôi  phải đơn giản hóa các nguyên bản, thay thế các thuật ngữ chuyên môn và sử dụng ít con số hơn. Trong các nguyên bản giải thích, cần thiết  là đưa ra được thông tin về ngữ cảnh. Thay vì mô tả kết quả, chúng tôi phải tập trung vào việc giải thích các con số, đặt chúng vào một bối cảnh có liên quan, giải quyết các vấn đề không nhất quán và ngăn ngừa sự hiểu nhầm.

Nhiều người sử dụng internet không hiểu khi chúng tôi sử dụng thuật ngữ  chuyên môn thống kê hoặc chỉ đơn giản họ chỉ nhận thấy ở đó những chủ đề nhàm chán.

b . Hầu hết những người sử dụng internet đều quan tâm đến một chủ đề nào đó hơn là các con số thống kê

Hãy suy nghĩ về cách bạn tự nghiên cứu trên internet: Bạn nhập  thuật ngữ vào công cụ tìm kiếm và  nhìn qua danh mục các trang web đưa ra. Vậy thì điều quan trọng là những chủ đề nào chúng tôi dùng để gửi tới công chúng. Chủ đề là  yếu tố quan trọng để xem liệu những  người sử dụng Internet có quan tâm đến chúng tôi  không. Chúng tôi phải lựa chọn vấn đề mang tính thời sự và xử lý  chúng bằng những dữ liệu mà chúng tôi có thể góp vào. Vì  mục đích đó, chúng tôi  phải  chọn các kết quả cụ thể hơn và đặt chúng ở nơi được sử dụng lúc này. Trong trường hợp dữ liệu rất đặc trưng (chẳng hạn, như các chủ đề ít được yêu cầu), chúng tôi cũng cần phải  dũng cảm  không công bố chúng trên các phương tiện truyền thông hàng đầu của mình và thay vào đó là chỉ để phổ biến chúng cho các nhóm mục tiêu được chọn.

Chúng tôi phải chuyển các kết quả thống kê kết nối với các lĩnh vực của cuộc sống người dân. Nếu chúng tôi có ý định công bố dữ liệu theo các chủ đề, chúng tôi phải tăng cường liên kết với dữ liệu từ các số liệu thống kê khác. Chúng tôi phải giới thiệu cho người sử dụng về những gì chúng tôi có khả năng thể hiện bằng dữ liệu của mình.

c. Rất nhiều điều thú vi đối với thường dân, miễn là dễ hiểu

Là những nhà thống kê, chúng tôi làm quen với nhiều dữ liệu và những kết nối từ các số liệu thống kê khác nhau. Khi chúng tôi nghiên cứu những con số hàng ngày, chúng tôi quên rằng ngay cả chỉ một con số đơn thuần, cũng có thể là một mẩu tin thú vị đối với người dân. Internet là diễn đàn lý tưởng để trình bày những số liệu quan trọng hoặc những kết quả riêng rẽ  dựa vào các số liệu thống kê  theo cách ngắn gọn. Tuy nhiên, điều này đòi hỏi chúng tôi chọn lựa cẩn thận những gì chúng tôi trình bày: đâu là xu hướng quan tâm, những vấn đề gì đặt ra đối với chúng tôi- những chuyên gia phổ biến dữ liệu. Điều đáng đề cập đến là gì? Chúng tôi cần có một cái nhìn chi tiết và thường xuyên hơn các số liệu thống kê mà khá gần gũi với đời sống của người dân, nơi liên quan đến các vật phẩm hoặc điều kiện sinh hoạt hàng ngày.

d. Do thời gian lưu lại trung bình trên bất kỳ trang mạng nào của người sử dụng internet rất ngắn, nên hình ảnh thể hiện nhiều  hơn  ngàn lời nói

Trong bối cảnh các luồng thông tin ngày càng phát triển, chúng tôi cần đến các phương thức truyền đạt những nội dung của mình; cách thức quan trọng là ngoài việc đơn giản hóa và rút ngắn các thông tin, là hình thức trực quan dễ hình dung. Biểu đồ và bảng biểu phải dễ hiểu khi thoáng nhìn, chúng tôi phải xếp loại  các thành quả của mình làm ra, đặt chúng vào bối cảnh vụ việc, phải đơn giản hóa và  quan trọng hơn hết thảy là phải giảm bớt những con số. Các biểu đồ  sinh động và các ứng dụng tương tác sử dụng công nghệ và hỗ trợ thông tin biểu đạt  bằng các số liệu của chúng tôi.

Ngôn ngữ hình ảnh chúng tôi sử dụng là gì? Các hình ảnh,  nếu được lựa chọn thích hợp, sẽ được độc giả  nhớ đến hơn so với bất kỳ chủ đề nào. Các chiến dịch quảng cáo lợi dụng hiện tượng đó. Chúng tôi phải cố gắng công bố nhiều thông tin của mình theo cách trực quan.

e. phương tiện truyền thông xã hội

Facebook, Twitter .. là những diễn đàn truyền thông mới và là công cụ đáng xem xét, để biết liệu chúng có đáp ứng nhu cầu không. Cho đến nay, các diễn đàn đó  hầu như đã không được sử dụng để phổ biến các dữ liệu của chúng tôi. Chúng tôi phải kiểm tra kỹ lưỡng xem ở đâu và làm thế nào để có thể đưa các số liệu thống kê chính thức vào các diễn đàn đó. Trong mọi trường hợp, sự hòa nhập phải được thực hiện một cách có hệ thống và cho dù tổ chức của các diễn đàn đó phi tập trung – nhưng  công việc duy trì, bảo quản phải được tập trung, vì  đảm bảo chất lượng thông tin phổ biến trong tình trạng có sự thách thức lớn nhất ở đây. Do vậy, bước đầu có thể là sự liên kết tự động, ví dụ như tin tức báo chí hay việc phổ biến các thông tin mới đã được xuất bản ở nơi khác.

Nguồn:  LOST IN STATISTICS?

Getting the numbers across in ways that external audiences understand

(Khai thách các con số theo cách để người đọc bên ngoài hiểu được)

Submitted by Destatis, Prepared by Kerstin Hänsel   (kerstin.haensel@destatis.de). Germany

http://www.unece.org/fileadmin/DAM/stats/documents/ece/ces/ge.45/2010/wp.5.e.pdf , TMH


[1] Báo cáo tại Hội nghị  Truyền thông Thông kê của UNECE, Paris Cộng hòa Pháp, tháng 7.2010