Dữ liệu lớn – Liệu bạn có thể kiểm soát?
Dữ liệu lớn là một vấn đề nóng trong kinh tế thế giới hiện nay. Việc tăng lượng dữ liệu thu thập được và lưu trữ bởi tổ chức trên toàn thế giới trong vài thập kỷ qua là không thể phủ nhận và khả năng truy cập và phân tích dữ liệu này ngày càng trở nên quan trọng hơn.
Dưới đây là một số thống kê chính, sự kiện và số liệu làm nổi bật sự tăng trưởng này trong dữ liệu và mức độ quan trọng của nó đối với thông tin kinh doanh và việc ra quyết định.
Dữ liệu lớn trong môi trường kinh doanh và công nghệ ngày nay
• 2.7 Zetabytes dữ liệu tồn tại trong vũ trụ kỹ thuật số ngày nay.
• 235 Terabytes đã được Thư viện Quốc hội Hoa Kỳ thu thập vào tháng 4 năm 2011.
• Chính quyền Obama đầu tư 200 triệu đô la vào các dự án nghiên cứu dữ liệu lớn.
• IDC ước tính đến năm 2020, các giao dịch kinh doanh trên internet – doanh nghiệp với doanh nghiệp và doanh nghiệp với người tiêu dùng – sẽ đạt 450 tỷ USD mỗi ngày.
• Các cửa hàng Facebook, truy cập và phân tích 30+ Petabyte dữ liệu do người dùng tạo ra.
• Akamai phân tích 75 triệu sự kiện mỗi ngày với mục tiêu quảng cáo tốt hơn.
• 94% người dùng Hadoop thực hiện phân tích khối lượng lớn dữ liệu không khả thi; 88% phân tích dữ liệu chi tiết hơn; trong khi 82% có thể giữ lại nhiều dữ liệu hơn.
• Walmart xử lý hơn 1 triệu giao dịch khách hàng mỗi giờ, được nhập vào cơ sở dữ liệu ước tính chứa hơn 2,5 petabyte dữ liệu.
• Hơn 5 tỷ người đang gọi, nhắn tin, tweet và duyệt web bằng điện thoại di động trên toàn thế giới.
• Trước đây giải mã bộ gen người, mất 10 năm để xử lý; bây giờ có thể được hoàn thành trong một tuần.
• Trong năm 2008, Google đã xử lý 20.000 terabyte dữ liệu (20 petabyte) mỗi ngày.
• Đáng tự hào là cơ sở dữ liệu lớn nhất của AT & T với khối lượng dữ liệu lớn nhất trong một cơ sở dữ liệu duy nhất (312 terabyte); và số lượng bản ghi lớn thứ hai trong một cơ sở dữ liệu (1.9 nghìn tỷ), bao gồm các bản ghi thoại của AT & T.
Sự tăng trưởng nhanh của dữ liệu phi cấu trúc
• Người dùng YouTube tải lên 48 giờ video mới mỗi phút.
• 571 trang web mới được tạo ra mỗi phút.
• Các thương hiệu và tổ chức trên Facebook nhận được 34.722 lượt thích mỗi phút.
• 100 terabyte dữ liệu được tải hàng ngày lên Facebook.
• Theo nghiên cứu của Twitter vào đầu năm 2012, mỗi ngày có khoảng 175 triệu tweet và có hơn 465 triệu tài khoản.
• 30 tỷ nội dung được chia sẻ trên Facebook mỗi tháng.
• Khối lượng dữ liệu sẽ cao gấp 44 lần vào năm 2020 so với năm 2009.
• Cuối năm 2011, IDC Digital Universe đã xuất bản một báo cáo trong đó chỉ ra khoảng 1,8 zettabytes dữ liệu sẽ được tạo ra vào năm 2011.
Nói cách khác, lượng dữ liệu trên thế giới ngày nay bằng:
• Mỗi người ở Mỹ sử dụng ba lần tweets mỗi phút tương đương khoảng thời gian 26.976 năm.
• Mỗi ngày có hơn 215 triệu bức ảnh chụp cộng hưởng từ (MRI) chất lượng cao trên thế giới.
• Hơn 200 tỷ bộ phim HD – sẽ phải mất 47 triệu năm để xem.
Thu Hiền (lược dịch)
Nguồn: https://www.waterfordtechnologies.com/big-data-interesting-facts/