Cách thu thập dữ liệu trên mạng xã hội
Tương tác xã hội đóng vai trò quan trọng trong việc xác định hành vi và kết quả của cá nhân, đặc biệt ở các nước đang phát triển, nơi mọi người dựa vào các mối quan hệ không chính thức để chia sẻ thông tin, cung cấp hàng hóa công cộng và chia sẻ rủi ro. Vì vậy, người ta cần suy nghĩ cẩn thận về mạng lưới xã hội cơ bản khi xem xét tác động của các biện pháp can thiệp khác nhau. Ví dụ, các mối quan hệ xã hội có thể dẫn đến tác động lan tỏa từ nhóm can thiệp sang nhóm đối chứng. Hoặc có thể có ngoại tác lan tỏa trong nhóm can thiệp tạo ra hiệu quả can thiệp không đồng nhất tùy theo mối liên hệ giữa các cá nhân/hộ gia đình/doanh nghiệp. Trong một số trường hợp, bản thân sự kết nối xã hội có thể là kết quả được quan tâm ( Anukriti và cộng sự 2022 ; Khandelwal và Singh 2024). Lập bản đồ mạng xã hội là một cách để chính thức hóa và suy nghĩ về cách thức các tương tác và sự lan tỏa này xảy ra. Việc thu thập dữ liệu về kết nối xã hội cho phép chúng tôi truy cập vào số liệu thống kê giúp chúng tôi hiểu rõ hơn về các kênh lây truyền.
Nên thu thập loại dữ liệu mạng nào?
Câu hỏi đầu tiên là loại dữ liệu quan hệ nào phù hợp với câu hỏi muốn trả lời. Ví dụ, hãy nghĩ đến việc sử dụng bếp điện – nếu đó thường là quyết định được đưa ra ở cấp hộ gia đình, bạn có thể muốn biết thông tin được truyền tải giữa các hộ gia đình như thế nào. Mặt khác, đối với kiến thức về kế hoạch hóa gia đình và sức khỏe sinh sản, việc hỏi những phụ nữ mà họ dành nhiều thời gian nhất có thể phù hợp hơn (ví dụ: Anukriti et al 2020 ). Đơn vị đo lường phụ thuộc rất nhiều vào mức độ tương tác mà bạn quan tâm. Lưu ý nếu bạn đang lập bản đồ mạng lưới hộ gia đình, xem ai trong hộ gia đình được điều tra, vì điều đó có thể gây ra sai lệch trong dữ liệu.
Khi đã xác định được đơn vị đo lường, cần xác định dữ liệu này sẽ ở dạng nào. Có nhiều loại quan hệ hay tương tác, ví dụ như quan hệ họ hàng, hành động (nói chuyện với; đi chợ với; vay mượn); cùng xảy ra (cùng học tập hoặc làm việc cùng nhau). Và cho dù chỉ muốn dữ liệu nhị phân (được kết nối hay không được kết nối) hay dữ liệu liên tục (ví dụ: số lần nói chuyện trong tháng trước).
Quan tâm đến số liệu thống kê mạng nào?
Có hai thành phần chính để xây dựng mạng, các mục (về các cá nhân) và danh sách liên kết (về sự kết nối giữa các cá nhân). Trong sơ đồ mạng bên dưới (trích từ Iacobelli & Singh 2023), mỗi vòng tròn là một phụ nữ trong mạng (nút) và một liên kết được vẽ giữa hai nút nếu bất kỳ ai trong số họ đặt tên người kia là bạn bè. Tùy thuộc vào câu hỏi nghiên cứu của bạn, bạn có thể quan tâm đến các số liệu thống kê mạng khác nhau. Một trong những số liệu thống kê phổ biến nhất là số lượng mối quan hệ hoặc kết nối trực tiếp (hoặc mức độ). Trong mạng bên dưới, người được khoanh tròn màu xanh lam có hai kết nối. Tính trung tâm là một khái niệm quan trọng khác làm nổi bật quyền lực/ảnh hưởng của một người trong mạng lưới. Ví dụ, người được khoanh tròn màu đỏ là người rất “trung tâm” vì cô ấy có nhiều bạn.
Ngoài số liệu thống kê cấp độ cá nhân, bạn cũng có thể quan tâm đến số liệu thống kê ở cấp độ toàn bộ mạng. Một thước đo như vậy là phân cụm cho thấy mức độ liên kết chặt chẽ của một mạng nhất định.
Hình 1: Bản đồ mạng xã hội tại một ngôi làng ở Nepal.
Cách tốt nhất để lập bản đồ mạng xã hội là gì?
Hãy bắt đầu với tình huống: Giả sử bạn muốn lập bản đồ mạng cấp cá nhân hoặc hộ gia đình trong một làng. Trong trường hợp ngân sách và thời gian không giới hạn, trước tiên bạn sẽ tiến hành một cuộc điều tra dân số về làng. Sau đó, bạn sẽ quản lý mô-đun mạng xã hội của mình cho mọi người (hoặc từng hộ gia đình). Ở đây cũng vậy, bạn có sự lựa chọn. Bạn có thể hỏi từng người trả lời xem họ có tương tác với từng người khác trong cuộc điều tra dân số của bạn hay không. Hoặc bạn có thể yêu cầu họ cho bạn biết tên của những cá nhân mà họ có liên hệ (có hoặc không có giới hạn trên về số lượng tên họ có thể đề cập đến). Mỗi cách tiếp cận này đều có ưu và nhược điểm. Việc sử dụng cuộc điều tra dân số để xem xét từng tên có thể tốn thời gian và đóng vai trò chuẩn bị cho người trả lời. Mặt khác, việc giới hạn số lượng tên có thể dẫn đến việc bỏ sót các kết nối, dẫn đến mạng được mã hóa lên đầu. Cách tốt nhất là để mọi người nêu tên bao nhiêu người tùy thích. Điều này thường không có xu hướng vượt quá sáu đến bảy tên. Cuối cùng, bạn đối chiếu từng kết nối riêng lẻ với cuộc điều tra dân số. Trong Iacobelli & Singh 2023, các tác giả đã khảo sát từng phụ nữ trong làng và yêu cầu mỗi phụ nữ báo cáo tất cả các mối quan hệ của mình trong làng để xây dựng mạng lưới. Trong Beaman và cộng sự (2021) , các tác giả đã tạo ra mạng lưới hộ gia đình bằng cách hỏi tất cả các hộ gia đình trong làng mà họ đã tư vấn để đưa ra các quyết định nông nghiệp. Phương pháp này cung cấp cho bạn một bức tranh hoàn chỉnh về mạng nhưng lại tốn kém về thời gian và tiền bạc.
Làm cách nào để đo lường mạng xã hội với những hạn chế về nguồn lực?
Giảm số lượng câu hỏi theo loại mối quan hệ mà bạn quan tâm. Đây có thể là hỏi một câu hỏi suy ra mạng lưới tình bạn theo chiều hướng tư vấn, chẳng hạn như “Bạn đến gặp ai trong làng để được tư vấn về sức khỏe sinh sản?” Tùy thuộc vào câu hỏi bạn muốn trả lời, bạn có thể sử dụng số lượng mối quan hệ làm kết quả chứ không phải xây dựng mạng lưới hoàn chỉnh. Để xây dựng mạng hoàn chỉnh, bạn vẫn cần phải khớp các tên được thu thập trong cuộc khảo sát với cuộc điều tra dân số để tạo danh sách liên kết. Đây có thể là một cách tiếp cận hiệu quả về mặt chi phí nhưng vẫn đòi hỏi nhiều thời gian để thực hiện việc đối sánh một cách chính xác. Ví dụ như trong làng có hai người Maya Tamang; vì vậy, khi ai đó gọi Maya là bạn bè, bạn cần liên kết chính xác với đúng Maya. Và chúng ta đừng bắt đầu về vấn đề cách viết khác nhau!
Tiến hành chọn mẫu quả cầu tuyết một phần để có được mạng “hoàn chỉnh” cho một tập hợp con của toàn bộ mạng. Trong phương pháp này, bạn sẽ chọn ngẫu nhiên một số lượng hạt cố định. Bạn sẽ gợi ra các kết nối của họ, sau đó gợi ra các kết nối từ các kết nối của họ, v.v. Và sau đó ghép tên với cuộc điều tra dân số. Tuy nhiên, nếu toàn bộ mạng lưới bị tách biệt, việc lựa chọn hạt giống có thể gây ra những hậu quả không hề nhỏ.
Chọn mẫu ngẫu nhiên các cá thể và ước tính các liên kết còn thiếu. Trong Banerjee và cộng sự (2013), các tác giả tiến hành điều tra dân số toàn diện tại 75 làng và quản lý khảo sát mạng lưới tới 46% tổng số hộ gia đình tại mỗi làng. Họ “sửa” kết quả của mình để tìm ra thước đo về dữ liệu bị thiếu. Chandrasekhar & Lewis (2016) phác thảo một tập hợp các hiệu chỉnh phân tích và quy trình ước tính hai bước bằng cách sử dụng tái cấu trúc đồ họa.
Dữ liệu quan hệ tổng hợp (ARD) là một cách tiếp cận khác có thể được sử dụng để khôi phục các tham số của mạng ở cấp độ cá nhân và toàn bộ mạng (Breza et al. 2020). Thay vì hỏi tên của tất cả các cá nhân mà người trả lời được kết nối, bạn chỉ cần hỏi số lượng cá nhân có những đặc điểm nhất định mà một người nhất định được kết nối. Ví dụ: “Có bao nhiêu hộ gia đình mà bạn biết có cặp song sinh?” có thể được yêu cầu đối với một tập hợp con ngẫu nhiên của mẫu đầy đủ. Phương pháp này rẻ hơn tới 70% so với phương pháp khơi gợi mạng tiêu chuẩn.
Kim Oanh (dịch)
Nguồn: https://blogs.worldbank.org/en/impactevaluations/how-to-collect-data-on-social-networks-