Khóa học chứng chỉ chuyên gia này dành cho bất kỳ ai muốn phát triển các kỹ năng, công cụ sẵn sàng cho công việc và danh mục đầu tư cho vị trí kỹ sư dữ liệu cấp độ bắt đầu. Trong suốt các khóa học trực tuyến, bạn sẽ đắm mình trong vai trò của một kỹ sư dữ liệu và có được các kỹ năng cần thiết để làm việc với một loạt các công cụ và cơ sở dữ liệu để thiết kế, triển khai và quản lý dữ liệu có cấu trúc và phi cấu trúc.
Khi kết thúc khóa học này, bạn sẽ có thể giải thích và thực hiện các nhiệm vụ chính cần thiết trong vai trò kỹ thuật dữ liệu; sử dụng ngôn ngữ lập trình Python và các tập lệnh shell Linux / UNIX để trích xuất, biến đổi và tải (ETL) dữ liệu; làm việc với Hệ quản trị cơ sở dữ liệu quan hệ (RDBMS) và truy vấn dữ liệu bằng cách sử dụng câu lệnh SQL. Bạn sẽ sử dụng cơ sở dữ liệu NoSQL và dữ liệu phi cấu trúc. Thêm nữa, bạn sẽ được giới thiệu về BigData và làm việc với các công cụ dữ liệu lớn như Hadoop và Spark. Từ đó, bạn có thể tích lũy kinh nghiệm với việc tạo kho dữ liệu và sử dụng các công cụ Business Intelligence để phân tích và trích xuất thông tin chi tiết.
Mỗi khóa học bao gồm nhiều thí nghiệm & dự án thực hành để áp dụng các khái niệm và kỹ năng bạn học được. Chương trình sẽ đạt đến đỉnh cao trong Dự án Capstone, nơi bạn sẽ tập hợp tất cả những kỹ năng này để phát triển và triển khai toàn bộ nền tảng dữ liệu với các kho và đường ống dữ liệu (data pipelines) khác nhau để giải quyết vấn đề phân tích dữ liệu lấy cảm hứng từ thế giới thực.
Chương trình này không yêu cầu bất kỳ kỹ thuật dữ liệu hoặc kinh nghiệm lập trình trước đây.
BẠN SẼ HỌC ĐƯỢC GÌ?
- Tạo, thiết kế và quản lý cơ sở dữ liệu quan hệ và áp dụng các khái niệm quản trị cơ sở dữ liệu (DBA) cho các RDBMS như MySQL, PostgreSQL & IBM Db2.
- Thể hiện kiến thức làm việc về NoSQL & Dữ liệu lớn bằng MongoDB, Cassandra, Cloudant, Hadoop, Apache Spark, Spark SQL, Spark ML, Spark Streaming.
- Phát triển và thực thi các truy vấn SQL bằng cách sử dụng các câu lệnh SELECT, INSERT, UPDATE, DELETE, các hàm cơ sở dữ liệu, các thủ tục được lưu trữ, các truy vấn lồng nhau và các JOIN.
- Triển khai ETL & đường ống dữ liệu với Bash, luồng không khí (Airflow)[1] & Kafka; kiến trúc, cư trú, triển khai kho dữ liệu; tạo báo cáo BI & bảng điều khiển tương tác.
CÁC KỸ NĂNG BẠN SẼ ĐẠT ĐƯỢC:
- Hệ quản trị cơ sở dữ liệu quan hệ (RDBMS)
- ETL & đường ống dữ liệu
- NoSQL và BigData
- Apache Spark
- SQL
- Khoa học dữ liệu
- Cơ sở dữ liệu (DBMS)
- NoSQL
- Lập trình Python
- Phân tích dữ liệu
- Pandas
- Numpy
NỘI DUNG KHÓA HỌC:
Khóa học Chứng chỉ chuyên gia này có 13 học phần:
- Học phần 1: Giới thiệu về kỹ thuật dữ liệu
- Học phần 2: Python dành cho khoa học dữ liệu, AI & phát triển
- Học phần 3: Dự án Python cho kỹ thuật dữ liệu
- Học phần 4: Giới thiệu về cơ sở dữ liệu quan hệ (RDBMS)
- Học phần 5: Cơ sở dữ liệu và SQL cho khoa học dữ liệu với Python
- Học phần 6: Giới thiệu thực hành về các lệnh Linux và Shell Scripting
- Học phần 7: Quản trị cơ sở dữ liệu quan hệ (DBA)
- Học phần 8: ETL và các đường ống dữ liệu với Shell, Airflow và Kafka
- Học phần 9: Bắt đầu với kho dữ liệu và phân tích BI
- Học phần 10: Giới thiệu về cơ sở dữ liệu NoSQL
- Học phần 11: Giới thiệu về dữ liệu lớn với Spark và Hadoop
- Học phần 12: Kỹ thuật dữ liệu và học máy sử dụng Spark
- Học phần 13: Dự án Capstone kỹ thuật dữ liệu
Link đăng ký học bắt đầu từ ngày 3/3/2022:
https://www.coursera.org/professional-certificates/ibm-data-engineer?action=enroll&authMode=signup
Ngọc Bích (lược dịch)
Nguồn:https://www.coursera.org/professional-certificates/ibm-data-engineer?action=enroll
[1] Airflow, một nền tảng nguồn mở, được sử dụng để sắp xếp các luồng công việc dưới dạng biểu đồ chu kỳ theo hướng (DAG) của các tác vụ theo cách lập trình.