MCI BLOGS


Nơi chia sẻ về những câu chuyện thú vị và những kinh nghiệm về lập trình phần mềm, phân tích dữ liệu, khoa học dữ liệu và kĩ sư dữ liệu..
Câu chuyện nghề nghiệp trong ngành công nghệ thông tin và khoa học dữ liệu của Học viện Công nghệ MCI dành cho độc giả.

TỔNG HỢP 38 THƯ VIỆN PYTHON HÀNG ĐẦU CHO DATA SCIENTIST, DATA VISUALIZATION & MACHINE LEARNING P3

Lê Thị Huyền Trang - Dec. 30, 2022, 3:43 p.m.

Bài viết này tổng hợp 38 thư viện Python hàng đầu cho khoa học dữ liệu, trực quan hóa dữ liệu & machine learning

Xem nhanh

Bài viết này tổng hợp 38 thư viện Python hàng đầu cho khoa học dữ liệu, trực quan hóa dữ liệu & Machine Learning.

26. Plotly

Stars: 7900, Commits: 4604, Contributors: 137

Plotly.py là một thư viện vẽ đồ thị tương tác, mã nguồn mở và dựa trên trình duyệt dành cho Python.

 27. Seaborn

Stars: 7700, Commits: 2702, Contributors: 126

Seaborn là một thư viện trực quan Python dựa trên matplotlib. Nó cung cấp một giao diện chuyên nghiệp để vẽ đồ họa thống kê hấp dẫn.

 

28. folium

Stars: 4900, Commits: 1443, Contributors: 109

Folium được xây dựng dựa trên sự sắp xếp dữ liệu của hệ sinh thái Python và mapping strengths của thư viện Leaflet.js. Thao tác dữ liệu bằng Python, sau đó trực quan hóa dữ liệu đó trong Leaflet map qua folium.

 29. Bqplot

Stars: 2900, Commits: 3178, Contributors: 45

Bqplot là một hệ thống trực quan hóa 2-D cho Jupyter, dựa trên các cấu trúc của Ngữ pháp đồ họa.

 

30. VisPy

Stars: 2500, Commits: 6352, Contributors: 117

VisPy là thư viện trực quan hóa dữ liệu 2D/3D tương tác hiệu suất cao. VisPy tận dụng sức mạnh tính toán của Bộ xử lý đồ họa (GPU) hiện đại thông qua thư viện OpenGL để hiển thị các bộ dữ liệu rất lớn.  

31.PyQtgraph

Stars: 2200, Commits: 2200, Contributors: 142

PyQtgraph hỗ trợ trực quan hóa dữ liệu nhanh và các công cụ GUI cho các ứng dụng khoa học/kỹ thuật

 

32. Bokeh

Stars: 1400, Commits: 18726, Contributors: 467

Bokeh là một thư viện hình ảnh tương tác cho các trình duyệt web hiện đại. Nó cung cấp cấu trúc đồ họa linh hoạt, trang nhã, ngắn gọn và mang lại khả năng tương tác hiệu suất cao trên các tập dữ liệu lớn hoặc truyền trực tuyến.

 

33. Altair

Stars: 600, Commits: 3031, Contributors: 106

Altair là một thư viện trực quan hóa thống kê khai báo cho Python. Với Altair, bạn có thể dành nhiều thời gian hơn để hiểu dữ liệu của mình và ý nghĩa của nó. 

34. eli5

Stars: 2200, Commits: 1198, Contributors: 15

eli 5 là một thư viện để gỡ lỗi/kiểm tra các trình phân loại học máy và giải thích dự đoán của chúng.

 

35. LIME

 Stars: 800, Commits: 501, Contributors: 41

Lime là thư viện được sử dụng để giải thích dự đoán của bất kỳ bộ phân loại học máy nào

 

36. SHAP

Stars: 10400, Commits: 1376, Contributors: 96

SHAP là thư viện để giải thích đầu ra của bất kỳ mô hình học máy nào.

 

37. YellowBrick

Stars: 300, Commits: 825, Contributors: 92

Các công cụ chẩn đoán và phân tích trực quan để hỗ trợ lựa chọn mô hình máy học.

 

38. pandas-profiling

Stars: 6200, Commits: 704, Contributors: 47

pandas - profiling là thư viện dùng để tạo báo cáo định hình HTML từ các đối tượng DataFrame của pandas.

Trên đây là 38 mô hình được sử dụng trong các lĩnh vực Data Science, Machine Leanring và Data Visualization. Hy vọng những chia sẻ hữu íc trên đây sẽ giúp công việc của bạn thuận lợi hơn. 

 

 

 

 

 

Chương trình đào tạo: Phân tích dữ liệu, Khoa học dữ liệu, Kĩ sư dữ liệu, Lập trình ứng dụng.
Chất lượng nhất - Uy tín nhất - Nhiều học viên tin tưởng nhất
Hơn 6000 học viên ưu tú đã tốt nghiệp