Chuyển đổi dữ liệu lớn để thành dữ liệu thông minh

Chúng ta đang bước vào thời đại của vạn vật kết nối Internet viết tắt là IoT (tiếng Anh: Internet of Things), rất nhiều thiết bị kết nối sẽ giao tiếp với nhau sử dụng cảm biến/tín hiệu và người ta dự kiến ​​rằng những thiết bị này sẽ tạo ra một lượng dữ liệu lớn.

Xử lý nhiều dữ liệu (Big data) và tạo ra tín hiệu hành động từ đó sẽ là một thách thức.

Các công ty đang đầu tư rất nhiều nguồn lực để xây dựng nền tảng mà có thể xử lý big data để trích xuất một số thông tin hữu ích ra khỏi nó. Chúng ta biết rằng IoT sẽ tạo ra dữ liệu vô hạn và liệu những nền tảng này có thể xử lý hết được tình trạng đó và liệu chi phí đầu tư để xử lý các dữ liệu của hàng ngàn thiết bị đó có hiệu quả không.

Ví dụ: Ngày nay SkyServer đã có dữ liệu trên 200 triệu thiên hà trong cơ sở dữ liệu. Các dữ liệu SDSS (Sloan Digital Sky Survey) vượt quá 150 terabytes, bao gồm hơn 220 triệu thiên hà và 260 triệu ngôi sao. Các hình ảnh độc lập bao gồm 2,5 nghìn tỷ pixel của dữ liệu thô ban đầu.

Và tính chính xác của thiết bị này sẽ được cải thiện với thời gian, khả năng phát hiện của chúng cũng sẽ tạo ra nhiều petabytes dữ liệu. Chúng ta sẽ tiếp tục bổ sung thêm máy chủ, RAM, ổ cứng và bộ vi xử lý để quản lý tất cả điều này?

Tại sao chúng ta không đầu tư tất cả các nguồn lực để tạo ra các thiết bị thông minh? Mỗi thiết bị thông minh sẽ tạo ra giao diện đầu ra của nó chỉ những dữ liệu hành động với thế giới bên ngoài?

Ví dụ như kính viễn vọng trên bầu trời có thể so sánh tất cả các hình ảnh của nó và chỉ gửi những hình ảnh đến máy chủ có yếu tố mới. Một số thiết bị được xây dựng trong kính viễn vọng trên bầu trời có thể giúp nó so sánh trong quá khứ và tạo ra những hiểu biết hành động dựa trên đó … nói cách đơn giản, nó giống như bộ não con người bên trong kính viễn vọng rằng sẽ biến đổi dữ liệu lớn để thành dữ liệu thông minh. Lưu trữ, quản lý và xử lý rác thải (big data) tại SkyServer không thực sự có ý nghĩa. Tại sao chúng ta phải chịu chi phí truyền dữ liệu rác? Có thể là thiết bị phần cứng giữ nó trong vô thức và có thể sử dụng nó nếu cần thiết để tạo ra các dữ liệu thông minh.

Trong thế giới của IoT nếu giao diện đầu ra của tất cả các thiết bị có thể đưa ra dữ liệu thông minh, kích thước dữ liệu sẽ giảm rất nhiều khi truyền tải và phần mềm sẽ thoải mái hơn với việc xử lý những megabyte dữ liệu.

Chúng ta cũng cần phải suy nghĩ lại cách chúng ta sử dụng Internet ngày nay, các dữ liệu được tạo ra từ internet là vô cùng tăng với thời gian. Phần mềm và công nghệ phần cứng không thể xử lý hết tất cả các tình huống trong tương lai.

Có thể chúng ta nghĩ về một ngôn ngữ mới cho mạng Internet mà có thể giúp truyền tải thông điệp trong một vài tín hiệu thay vì viết một câu chuyện bằng 1000 từ. Nếu bạn thấy cuộc hội thoại giữa những người điếc, họ chỉ sử dụng một vài tín hiệu và kể một câu chuyện đầy đủ trong một vài hành động. Xem xét việc sử dụng internet như là những người khiếm thính và suy nghĩ về một ngôn ngữ mà có thể kể một câu chuyện trong vài tín hiệu.

Chúng ta hãy nghĩ ra một nền tảng có thể giúp làm giảm kích thước của dữ liệu mà chúng ta đang tạo ra ngày hôm nay trên internet.

Biến đổi thế giới đối với các dữ liệu thông minh thay vì lãng phí tiền để xử lý rác thải (big data)

Anh Tuấn (lược dịch)

Nguồn: http://www.datasciencecentral.com/profiles/blogs/transform-big-data-to-smart-data