Lợi ích của học viên



  • Tặng miễn phí 01 tài khoản trên Hệ thống quản lý học tập của MCI
  • Được support từ đội ngũ IT và CTO của MCI về công nghệ, dữ liệu lớn và hàng trăm job trên Workspace
  • Tham gia cộng đồng học viên sôi động, chia sẻ và hợp tác cùng hàng ngàn chuyên gia.
  • Nhận chứng chỉ sau khóa học – Ghi nhận kỹ năng và kiến thức đã học.
  • Miễn phí học lại không giới hạn – Luôn cập nhật với xu hướng mới nhất.
Combo DE Professional

Combo Data Engineering Professional

Đây là chương trình đào tạo nâng cao trong lộ trình Data Engineer. Hình thức đào tạo online và offline, mỗi buổi học từ 2.5 - 3 tiếng Tên 02 khóa học bao gồm: 1. Advanced Data Lakes and Data Warehouses với 10 buổi học 2. Advanced AWS Cloud Data Engineer với 09 buổi học Cơ hội nghề nghiệp nổi bật sau khi tốt nghiệp chương trình đào tạo này là các vị trí hot sau: • Data Analyst • Data Engineer • SQL Developer • ETL Developer • Data Analyst • Big Data Engineer • Cloud Data Engineer • BI Developer • Machine Learning Engineer

4.9 (275)

Đối tượng

• Những bạn muốn nắm vững các kỹ năng về xử lý và quản lý dữ liệu. • Những bạn muốn nâng cao kỹ năng và hiểu biết về các công cụ và công nghệ xử lý dữ liệu lớn, quản lý dữ liệu và trực quan hóa dữ liệu. • Những bạn cần sử dụng kỹ năng Data Engineering để phát triển các ứng dụng xử lý và quản lý dữ liệu hiệu quả. • Những bạn muốn mở rộng kiến thức về quản lý cơ sở dữ liệu, các hệ thống lưu trữ và xử lý dữ liệu lớn và hiểu về các công nghệ và quy trình xử lý dữ liệu để quản lý và điều phối các dự án liên quan đến dữ liệu. • Những bạn có nhu cầu học thêm kỹ năng mới để chuyển sang các vị trí liên quan đến phân tích dữ liệu và quản lý dữ liệu. • Những bạn khám phá và học hỏi thêm về các công nghệ và kỹ thuật trong Data Engineering để mở rộng kiến thức và kỹ năng cá nhân. • Những bạn muốn sử dụng các kỹ năng xử lý và phân tích dữ liệu để tối ưu hóa các chiến lược kinh doanh và quản lý tài chính.

Yêu cầu đầu vào

Yêu cầu nắm vững kiến thức cơ bản về dữ liệu Yêu cầu nắm vững kiến thức về SQL và Python cơ bản

Bạn sẽ học những gì

• Hiểu và thiết lập các nền tảng phát triển dữ liệu như Python, Hadoop và các công cụ liên quan. • Nắm vững khái niệm và sử dụng HDFS, PySpark và Kafka trong xử lý dữ liệu lớn. • Thực hiện các quy trình ETL (Extract, Transform, Load) hiệu quả. • Xây dựng và quản lý Data Warehouse và Data Lake (Hive). • Áp dụng các kỹ thuật streaming dữ liệu với Spark. • Hiểu và triển khai Apache Airflow để tự động hóa quy trình ETL. • Nắm vững kỹ thuật xử lý và chuyển đổi dữ liệu giữa SQL và No-SQL. • Thiết lập và quản lý môi trường AWS, bao gồm S3, EC2, VPC, Load Balancer, IAM và các dịch vụ khác. • Hiểu và triển khai các dịch vụ cơ sở dữ liệu trên AWS. • Xây dựng hệ thống thực tế và tính toán chi phí vận hành trên AWS. • Hiểu và áp dụng các khái niệm Monolithic và Microservice trong phát triển hệ thống. • Thực hiện các biện pháp bảo mật cho dữ liệu và hệ thống trên AWS. • Phát triển kỹ năng quản lý và thực hiện các dự án thực tế thông qua các bài tập và case study.

Nội dung khóa học

    Chủ đề:

    Setup các platform

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Setup các phần mềm như Python, SQL...
    - Giới thiệu về khóa học và chương trình học

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Sử dụng Python/Hadoop cho việc truy xuất các nguồn dữ liệu

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Truy xuất dữ liệu theo các dạng số liệu liên tục và số liệu rời rạc
    - Cách xử lý số liệu trên Python

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Hadoop và HDFS

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về Hadoop
    - Ứng dụng Hadoop trong việc lấy và lưu trữ dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    PySpark và PySpark Cluster setup

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về PySpark
    - Ứng dụng PySpark trong việc xử lý dữ liệu
    - Ứng dụng PySpark Cluster trong các trường hợp

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Streaming dữ liệu với Spark

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Ứng dụng xử lý dữ liệu streaming

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Kafka

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Khái niệm cơ bản về Kafka
    - Xử lý dòng dữ liệu thời gian thực
    - Am hiểu tính chất pub/sub và dữ liệu theo thời gian thực

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    ETL

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Sử dụng Python để thực hành quá trình ETL (Extract - Translate - Load) dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    ETL

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Sơ lược những trường hợp của ETL
    - ETL 2 lớp trước và sau Spark

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Thực hành

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Xác định yêu cầu một bài toán cụ thể
    - Thực hiện các bước từ truy xuất dữ liệu thay đổi và chỉnh sửa giao tiếp dữ liệu và lưu trữ dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Bài tập cuối khóa

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Bài tập lớn làm theo nhóm

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Ôn tập kiến thức level 1

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Ôn lại những kiến thức đã được học về ETL chuẩn bị cho Data warehouse
    - Cài đặt các phần cần thiết và set up máy

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Data Warehouse & Data Lake (Hive)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về Kho dữ liệu
    - Ứng dụng ETL để thiết lập nên kho dữ liệu
    - Thiết lập Apache Hive

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Data Warehouse

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Khái niệm ETL trước và sau kho dữ liệu
    - Những thiết lập để lưu trữ dữ liệu hiệu quả
    - Những khái niệm của một kho dữ liệu tiêu chuẩn

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Data Warehouse

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Khái niệm ETL trước và sau kho dữ liệu
    - Những thiết lập để lưu trữ dữ liệu hiệu quả
    - Những khái niệm của một kho dữ liệu tiêu chuẩn

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Apache Airflow

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Khái niệm Apache Airflow
    - Các ứng dụng của Apache Airflow trong việc thiết lập một kho dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Apache Airflow

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Thực hành thiết lập một Flow dât cho Kho dữ liệu bằng Apache AirFlow

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Mô hình dữ liệu SQL và No-SQL

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Mô hình lưu trữ SQL và No-SQL
    - Thiết lập mô hình lưu trữ vào Data warehouse

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Trực quan hóa dữ liệu với Power BI

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Sử dụng PowerBI để cảm quan về Data lưu trữ
    - Thiết lập việc cảm quan lưu lượng lưu trữ cũng như những thứ liên quan để đảm bảo data flow

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Ôn tập kiến thức level 2

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Ôn tập

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Bài tập cuối khóa

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Bài tập cuối khoá 2 và các trường hợp thực tế

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Setup và giới thiệu về AWS

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về AWS
    - Cài đặt những phần cần thiết cho khoá học

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    AWS IAM (Identity and Access Management)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về IAM
    - Phân quyền các user truy cập vào môi trường
    - Phân quyền cho các môi trường được phép khởi tạo và chạy

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    về Amazon Simple Storage Service (S3)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về hệ thống lưu trữ của AWS (S3)
    - Khái niệm về lưu trữ trong S3 (bucket, key, object, region)
    - Quy trình sử dụng S3

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    về Amazon Simple Storage Service (S3)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Những tình huống luu trữ
    - Phương pháp lưu trữ chống mất dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Amazon Elastic Compute Cloud (EC2)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Tổng quan về mô hình thiết lập của EC2
    - Giới thiệu về Ami chuẩn bị cho thiết lập instance
    - Phương pháp tạo instance

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Amazon Elastic Compute Cloud (EC2)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Những trường hợp đặc biệt
    - Đề án kết hợp S3 và EC2

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Database AWS

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Định nghĩa và cách hoạt động của Database trên AWS
    - Thiết lập một database trên AWS

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Thực hành về Database

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Thực hành thiết lập một database

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    DNS và Routing

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - DNS, Zone, Route, Route53 của AWS
    - Cách thiết lập Route 53

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    VPC

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - VPC, Subnet, Route Traffic, VPN Connection

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Load Balancer và HA

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Load Balancer
    - Cải thiện khả năng phân bổ lưu lượng

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Thực hành xây dựng hệ thống thực tế và tính chi phí vận hành

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Xây dựng hệ thống thực tế
    - Tính toán chi phí cho hệ thống

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    AWS Application

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Kết nối lại những gì đã học
    - Tích hợp application với những mục tiêu khác

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Monolithic vs Microservice

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Microservice, APIs, Monolithic
    - Thực hành microservieces

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Security

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Những cách giúp bảo mật dữ liệu trên AWS
    - Hệ thống kết hợp bảo mật

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Final test

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    Final test

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Final test

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    Final test

    Case Study:

    2023-05-22 18:57:57.159958

Tại sao khóa học tại MCI phù hợp với bạn

1. Lộ trình khóa học thiết kế khoa học, theo quy trình làm việc thực tế giúp bạn tiếp thu và nắm chắc kiến thức theo trình tự khoa học 2. Giáo trình đào tạo theo chuẩn Quốc tế kết hợp giữa lý thuyết và thực hành qua các case study thực tế 3. 100% Giảng viên tại MCI là các chuyên gia tư vấn tại Big4 các tập đoàn lớn tại Việt Nam, có chứng chỉ đào tạo nghiên cứu quốc tế trong lĩnh vực lập trình và dữ liệu 4. Giảng viên hướng dẫn tận tay giúp bạn thành thạo Python, Power BI, SQL trong thời gian ngắn nhất 5. Cam kết chất lượng đào tạo, miễn phí học lại trọn đời nếu chưa nắm rõ kiến thức

Đội ngũ giảng viên


Nguyễn Hữu Minh

1. Trình độ học vấn
Chuyên gia sở hữu nền tảng vững chắc trong Khoa học Dữ liệu và Công nghệ thông tin, với kiến thức chuyên sâu về Machine Learning, Deep Learning và Computer Vision.

2. Kinh nghiệm làm việc
Có hơn 7 năm kinh nghiệm trong lĩnh vực Khoa học dữ liệu & Công nghệ thông tin, tham gia nghiên cứu và triển khai nhiều bài toán thực tiễn trong doanh nghiệp. Hiện tại, chuyên gia đang làm việc tại PIXTA Vietnam Co., Ltd với vai trò Data Scientist & AI Researcher, trực tiếp phát triển và ứng dụng các giải pháp AI phục vụ hoạt động phân tích dữ liệu và tối ưu hệ thống.

3. Kinh nghiệm giảng dạy
Chuyên gia theo đuổi phong cách giảng dạy thực chiến, dễ hiểu và bám sát nhu cầu ứng dụng thực tế. Giúp học viên xây dựng nền tảng từ tư duy dữ liệu, nguyên lý mô hình AI đến cách triển khai vào các bài toán doanh nghiệp. Lồng ghép kiến thức với các tình huống thực tế trong Machine Learning, Deep Learning và Computer Vision, giúp học viên không chỉ hiểu sâu mà còn có khả năng làm việc thực tế.

4. Văn bằng và hoạt động chuyên môn
Chuyên gia đã tham gia phát triển các mô hình AI hỗ trợ doanh nghiệp khai thác dữ liệu hiệu quả hơn, nâng cao hiệu suất hệ thống và cải thiện chất lượng vận hành. Chú trọng vào việc giúp học viên chuyển hóa kiến thức thành dự án thực tế, kỹ năng và năng lực làm việc trong môi trường doanh nghiệp.


Nguyễn Kim Quang

1. Trình độ học vấn
Thạc sĩ Tài chính – Ngân hàng, có nền tảng chuyên sâu về phân tích tài chính, đánh giá hiệu quả doanh nghiệp, thẩm định dự án và quản trị rủi ro.

2. Kinh nghiệm làm việc
Có hơn 14 năm kinh nghiệm trong lĩnh vực tài chính – ngân hàng. Từng đảm nhiệm các vị trí như Kế toán tín dụng, Chuyên viên thẩm định, Thư ký Phó Tổng Giám đốc, Chuyên viên phân tích tài chính tại Quỹ Đầu tư Phát triển TP. Hà Nội. Hiện là Chuyên gia Kế hoạch – Hiệu suất tại PVcomBank, trực tiếp tham gia xây dựng kế hoạch, đánh giá hiệu quả, dự báo rủi ro và tối ưu hiệu suất tài chính.

3. Kinh nghiệm giảng dạy
Tham gia đào tạo các chuyên đề về phân tích tài chính, lập và đánh giá phương án tài chính, phân tích dữ liệu, SQL, Python và ứng dụng Data Analytics trong tài chính – ngân hàng. Phong cách giảng dạy thực chiến, logic, dễ hiểu, bám sát bài toán doanh nghiệp.

4. Văn bằng và hoạt động chuyên môn
Sở hữu các chứng chỉ quốc tế: IBM Data Science, Python – University of Michigan, SQL Advanced – HackerRank, Statistical Learning – Stanford. Thành thạo SQL, Python và các công cụ phân tích dữ liệu, trực quan hóa dữ liệu và Machine Learning phục vụ công việc và đào tạo.


Nguyen An

1. Trình độ học vấn
Cử nhân CNTT – Đại học Bách Khoa TP.HCM, Thạc sĩ Khoa học Máy tính (Candidate), luôn cập nhật những công nghệ và thuật toán tiên tiến trong ngành.

2. Kinh nghiệm làm việc
Data Engineer tại FPT Retail, trực tiếp xây dựng và vận hành hệ thống dữ liệu quy mô lớn cho một trong những tập đoàn bán lẻ hàng đầu Việt Nam. Hơn 10 năm kinh nghiệm trong ngành dữ liệu và phát triển phần mềm, với 7 năm kinh nghiệm đào tạo. Giảng viên Data Engineer tại MCI, dẫn dắt học viên tiếp cận tư duy thiết kế hệ thống dữ liệu hiện đại.

3. Kinh nghiệm giảng dạy
Chuyên gia giảng dạy Python, C/C++ và các công cụ tối ưu hóa hiệu suất làm việc. Phương pháp giảng dạy tập trung vào thực hành, giúp học viên viết code Python sạch và thiết kế kiến trúc Data Engineer hoàn chỉnh từ đầu đến cuối.

4. Văn bằng và hoạt động chuyên môn
Chứng chỉ quốc tế IBM Data Engineer (Professional Certificate) và Data Engineer (Career Path) – DataQuest, khẳng định năng lực thực hành và tư duy giải quyết bài toán dữ liệu thực tế. Thành thạo trong xây dựng Pipeline, tối ưu hóa Data Warehouse, và xử lý dữ liệu lớn.