Một nguồn thu mới cho các nhà khoa học dữ liệu: Bán dữ liệu
Loại dữ liệu nào có thể bán được? các nhà khoa học dữ liệu có thể kiếm tiền độc lập bằng cách bán dữ liệu tự động được tạo ra thế nào: dữ liệu thô, dữ liệu nghiên cứu (được trình bày như các báo cáo theo yêu cầu của khách hàng), hoặc các dự đoán. Trong ngắn hạn, sử dụng một thế hệ dữ liệu / thu thập hoặc hệ thống dự đoán tự động, làm việc ở nhà không có ông chủ và không có nhân viên, và có thể không tương tác trực tiếp với khách hàng. Một con đường chuyên nghiệp xen kẽ mà nhiều người trong chúng ta sẽ thích thú!
Có một số công ty kiếm tiền bằng cách bán dữ liệu đã xử lý (hoặc thậm chí là bán dữ liệu thô):
• Số liệu thống kê lưu lượng truy cập web cho phép các nhà quảng cáo so sánh với các nhà xuất bản để mua lưu lượng hiệu quả nhất, hoặc để giúp định giá một trang web, và để thu thập tin tức về cạnh tranh nói chung. Ví dụ như 3 trang web là Compete.com, Alexa.com và Quancast.com. Các công ty cũng cung cấp dữ liệu về nhân khẩu học và từ khóa cho hàng triệu trang web mà họ theo dõi.
• Dữ liệu về lương và xu hướng việc làm, hàng ngàn việc làm. Các công ty như Payscale.com, Glassdoor.com và Indeed.com thu thập dữ liệu về tiền lương của hàng triệu khách và các việc làm. Các báo cáo như vậy cũng có thể được sử dụng để dự báo kinh tế hoặc các mô hình kinh doanh chứng khoán.
• Danh sách từ khóa, với số lượng ấn tượng, số lần nhấp chuột và giá trung bình mỗi lần nhấp chuột, cũng như các từ khóa liên quan, để giúp các nhà quảng cáo trả tiền nhiều hơn và có các từ khóa tốt hơn. Google cung cấp dịch vụ này thông qua một API. Việc cung cấp không phải là miễn phí.
• Danh sách đen và danh sách trắng (danh sách trắng là các địa chỉ có thể gửi thông tin sẽ được chấp nhận tự động) của các địa chỉ IP hoặc các địa chỉ email được sử dụng để lừa gạt, hoạt động Botnet hoặc diễn đàn thư rác (Botnet là một mạng gồm từ hàng trăm đến hàng triệu máy tính bị điều khiển hoàn toàn). Một ví dụ của công ty bán loại dữ liệu này là ProjectHoneyPot.org, với dữ liệu trên cơ sở báo cáo tiêu dùng của một nguồn khác.
• Giá nhà (giá thực tế và ước tính) cho tất cả các ngôi nhà ở Mỹ, xem Zillow.com.
• Giá cho tất cả các thủ tục y tế tiêu chuẩn, cho mỗi bệnh viện (giá thực tế và ước tính). Điều này thực sự là một ý tưởng tốt để khởi động dữ liệu lớn.
• Số liệu thị trường chứng khoán, đánh giá của người tiêu dùng (Yelp.com), danh sách của hàng ngàn chức danh cho các nhà khoa học dữ liệu (chúng tôi đang làm việc này), v.v
• Những dự đoán của bạn (chúng tôi đã bán các dấu hiệu chỉ báo về giao dịch thị trường chứng khoán trong quá khứ, sẵn có thông qua một API, và dịch vụ không phải là miễn phí).
• Bán số điểm, ví dụ như số lượng nhấp chuột hoặc các điểm số bất kỳ khác. FICO là một trong những công ty đầu tiên làm như vậy.
Bạn có những ý tưởng khác, cũng như những ý tưởng để tiết kiệm chi phí thu thập số lượng lớn dữ liệu để sản xuất và bán các điểm số hoặc các dự báo, hoặc chỉ đơn giản là bán các dữ liệu mà bạn đã thu thập được không?
NTH
Nguồn:http://www.datasciencecentral.com/profiles/blogs/selling-data