Sử dụng dữ liệu lớn để khám phá các nguyên tắc hoạt động trực tuyến của mọi người trên toàn cầu

bởi Đại học Công nghệ Toyohashi

Bản đồ khu vực hành động toàn cầu cho thấy sự khác biệt về địa lý trong việc sử dụng phương tiện truyền thông xã hội bất chấp việc sử dụng trên toàn thế giới. 

Nhà cung cấp: Đại học Công nghệ Toyohashi.

Một nhóm nghiên cứu do Shiori Hironaka, trợ lý dự án Khoa học và Kỹ thuật Máy tính tại Đại học Công nghệ Toyohashi, dẫn đầu, đã thu thập dữ liệu lớn trên mạng xã hội ở mười quốc gia và phân tích mối quan hệ giữa các kết nối và hành vi của mọi người trên Internet. Các nhà nghiên cứu nhận thấy rằng những người dùng có cùng đặc điểm về tỷ lệ theo dõi, phản ánh hành vi của người dùng bất kể quốc gia nào. Khám phá các đặc điểm chung và sự khác biệt trong dữ liệu phản ánh sự đa dạng xã hội có thể giúp mọi người sử dụng hiệu quả dữ liệu theo sự khác biệt văn hóa của họ, ví dụ, để tiếp thị và chia sẻ thông tin hiệu quả.

Nhóm đã thu thập dữ liệu về hoạt động của hơn 4.000.000 người dùng Twitter ở mười quốc gia (Nhật Bản, Mỹ, Brazil, Anh, Philippines, Thổ Nhĩ Kỳ, Indonesia, Ấn Độ, Mexico và Ả Rập Xê-út) và phân tích thống kê các mối quan hệ trực tuyến giữa các kết nối và hành vi của người dùng. Đây là phân tích đầu tiên về loại dữ liệu này trên thế giới.

Việc sử dụng dữ liệu phương tiện truyền thông  xã hội cho một mảng đa dạng của các cuộc khảo sát và phân tích đang trở thành phổ biến hơn như nhiều người sử dụng phương tiện truyền thông xã hội. Điều này là do dữ liệu truyền thông xã hội được coi là quan sát gián tiếp về các tình huống xã hội. Tuy nhiên, bản chất của dữ liệu thay đổi theo quốc gia do sự khác biệt về văn hóa và các yếu tố khác, mặc dù dữ liệu được quan sát tương tự trên phương tiện truyền thông xã hội. Hành vi của người dùng phản ánh văn hóa mạng theo nhóm người dùng khác nhau. Do đó, điều quan trọng là phải biết các thuộc tính của phương tiện truyền thông xã hội để sử dụng chúng trong các cuộc khảo sát khác nhau.

Nhóm nghiên cứu đã phân tích các kết nối giữa những người dùng, tập trung vào sự gần gũi của các khu vực mà họ hành động. Bởi vì mục đích sử dụng phương tiện truyền thông xã hội có thể được kết nối chặt chẽ với sự gần gũi của các khu vực hành động của những người dùng được kết nối qua phương tiện truyền thông xã hội. Cụ thể, các khu vực hành động có xu hướng gần gũi nếu một dịch vụ truyền thông xã hội được sử dụng để trao đổi với bạn bè. Nếu mục đích là đọc các bài đăng hoặc tin tức của những người nổi tiếng, thì việc gần các khu vực hành động không thành vấn đề. Sau khi xem xét mối quan hệ giữa mức độ gần gũi của các khu vực hành động và hành vi của người dùng trên phương tiện truyền thông xã hội, chúng tôi đã so sánh các đặc điểm của các quốc gia khác nhau.

Kết quả là, chúng tôi đã xác định được mười quốc gia có những điểm chung về đặc điểm của người dùng liên quan đến mức độ gần với các khu vực hành động. Một đặc điểm theo tỷ lệ sau. Đó là tỷ lệ giữa những người dùng mà một người dùng đang theo dõi. Nếu tỷ lệ theo dõi cao, người ta tin rằng một người dùng được truy cập bởi những người muốn đọc các bài viết của người dùng. Chúng tôi cũng nhận thấy rằng những người dùng có hồ sơ dài hơn có xu hướng ở xa khu vực hành động của những người dùng được kết nối hơn. Tuy nhiên, mười quốc gia không nhất thiết phải có điểm chung này.

Về cơ bản, dữ liệu trên các kết nối mạng xã hội có thể thể hiện thông tin về người dùng trên khắp thế giới theo cách tương tự. Tuy nhiên, điều này có thể không đảm bảo độ chính xác dự kiến ​​cho các chức năng như đề xuất bạn bè và ước tính thuộc tính vì bản chất của dữ liệu khác nhau do sự khác biệt về văn hóa. Các đặc điểm đã xác định được kỳ vọng sẽ giúp cung cấp thông tin tốt nhất cho người dùng của các quốc gia và nền văn hóa khác nhau.

Nghiên cứu được công bố trên IEEE Access .

Thái Học (dịch)

Nguồn: https://phys.org/news/2021-08-big-explore-principles-people-online.html