Big Data (dữ liệu lớn) là dữ liệu được lưu trữ dưới dạng số hoá, khối lượng thông tin lớn, tốc độ tạo ra thông tin nhanh, tính chất quan hệ của thông tin phức tạp, và luôn cần phương thức mới để tính toán và tối ưu tốc độ tính toán để hỗ trợ con người có thể thống kê, so sách hay phân tích dữ liệu. Big Data là một lĩnh vực rộng lớn và đòi hỏi nhiều nguồn lực cũng như sự chuyên biệt. Tuy nhiên, nếu thu thập dữ liệu đúng và đầy đủ Big Data có thể hỗ trợ các doanh nghiệp trong hầu hết mọi lĩnh vực.
Trong ngành công nghiệp phát triển phần mềm hiện đại, chi phí phát triển phần mềm rất tốn kém và mất thời gian. Do vậy xu hướng sử dụng mã nguồn mở cho những nền phần mềm quan trọng và phức tạp như Big Data sẽ là một xu hướng tất yếu để tiết kiệm chi phí, thời gian và giảm thiểu rủi ro.
THỜI LƯỢNG:
- 3 ngày (24 giờ) sơ cấp + 2 ngày (16 giờ) cao cấp (có thể lựa chọn học 3 ngày hoặc cả 5 ngày)
- Học thực chiến: 20% lý thuyết kết hợp 80% thực hành và tương tác với giảng viên
- Hỗ trợ, tư vấn dài hạn và liên tục sau khóa học. Đặc biệt sẵn sàng tư vấn, cung cấp giải pháp xây dựng hệ thống Big Data và phân tích dữ liệu Big Data cho các dự án của học viên
NỘI DUNG: Dành cho nhà phát triển ứng dụng & chuyên gia CNTT
- Big Data và các công nghệ mã nguồn mở.
- Hệ sinh thái Hadoop: các thành phần của Hadoop và các ứng dụng của Hadoop trong Big Data.
- Nền tảng Kubernetes: kiến trúc, ứng dụng của Kubernetes và các ứng dụng có thể triển khai trên Kubernetes.
MỤC TIÊU
Khóa học trang bị cho học viên những kiến thức và kỹ năng chuyên sâu về công nghệ mã nguồn mở để xây dựng Platform phân tích và xử lý dữ liệu lớn. Cụ thể:
- Kiến thức chuyên sâu về Big Data và các chiến lược tổ chức, phân tích và giải các bài toán về big data.
- Chọn lựa các giải pháp mã nguồn mở cho phù hợp với tích chất dữ liệu và quy mô dữ liệu cho bài toán cần giải.
- Kỹ năng cài đặt và monitor các máy ảo trên nền tảng Kubernetes.
- Kỹ năng cài đặt, triển khai các phần mềm Big Data Kafka, Hadoop, Hive… trên nền Kubernetes.
- Kỹ năng triển khai và phát triển ứng dụng dựa trên hệ sinh thái mã nguồn mở Apache.
ƯU THẾ SO SÁNH CỦA CHƯƠNG TRÌNH
- Chương trình đào tạo được thiết kế dưới dạng cầm tay chỉ việc, nhằm đảm bảo trang bị cho học viên đạt được những kiến thức và kỹ năng chuyên môn cần thiết…
- Giảng viên là các Chuyên gia có nhiều năm kinh nghiệm tham gia trực tiếp vào các dự án phát triển ứng dụng Big Data.
- Nhận Chứng nhận Big Data và Công nghệ mã nguồn mở.
CHI TIẾT NỘI DUNG KHÓA ĐÀO TẠO
CHƯƠNG TRÌNH SƠ CẤP (3 NGÀY)
BUỔI | NỘI DUNG | CHI TIẾT |
Buổi 01 | Big Data và Phân tích dữ liệu lớn (Big Data Analytic) | + Giới thiệu về Big Data
+ Giới thiệu về Big Data Analytic + Vài kỹ thuật cơ bản để phân tích dữ liệu |
Buổi 02 | Các nền tảng công nghệ mã nguồn mở cho Phân tích dữ liệu lớn | + Giới thiệu khái niệm SaaS, PaaS, BaaS và IaaS và ví dụ
+ Giới thiệu Kubernetes + Giới thiệu Hadoop + Giới thiệu Zookeeper, Kafka + Giới thiệu Elasticsearch |
Buổi 03 | Hadoop | + Giới thiệu Hadoop: kiến trúc và các thành phần
+ Ứng dụng của Hadoop trong Big Data |
Buổi 04 | Hadoop – thực hành | + Giới thiệu: HDFS, YARN, chạy một số ví dụ như Wordcount, PI…
+ Automation script + Cài đặt và triển khai |
Buổi 05 | Hadoop – thực hành | + Giới thiệu: Hbase, Hive trên nền Hadoop. Chạy các ví dụ tạo bảng, insert update dữ liệu
+ Automation script + Cài đặt và triển khai |
Buổi 06 | Hadoop – thực hành | + Giới thiệu (tùy theo trình độ lớp học): Spark, RDD, Pig
+ Automation script + Cài đặt và triển khai (tùy theo trình độ lớp học): Spark, RDD, Pig |
CHƯƠNG TRÌNH CAO CẤP (+2 NGÀY)
BUỔI | NỘI DUNG | CHI TIẾT |
Buổi 07 | Kubernetes | + Giới thiệu Kubernetes: kiến trúc và các thành phần
+ Ứng dụng của Kubernetes và các ứng dụng có thể triển khai trên Kubernetes |
Buổi 08 | Kubernetes – thực hành | + Giới thiệu hệ thống cài đặt và cấu hình cho Kubernetes dùng Docker Desktop
+ Giới thiệu hệ thống Dashboard cho Kubernetes và Big Data Platform dùng Grafana + Automation scripts + Cài đặt và triển khai một số ứng dụng trên hệ thống kubernetes |
Buổi 09 | Kubernetes – thực hành – Ứng dụng các big data component để giải quyết 1 bài toán cụ thể | + Cài đặt, sử dụng Kafka, Hadoop/Hive, Elasticsearch/Kibana.
+ Cài đặt hệ thống monitor cho hệ thống big data application dùng Prometheus và Grafana + Automation scripts + Xây dựng ứng dụng Big Data giải quyết 1 bài toán cụ thể |
Buổi 10 | Kubernetes – thực hành – Ứng dụng các big data component để giải quyết 1 bài toán cụ thể |
Hoàn thiện ứng dụng Big Data đã làm trong buổi 09! |