K- Nearest Neighbors (kNN) là một thuật toán học máy có giám sát (supervised learning) có thể được sử dụng […]
Author: Huy Nguyen
Thuật toán phân cụm K-means (K-means Clustering)
K-means clustering là một trong những thuật toán học máy không giám sát (unsupervised learning) đơn giản và phổ biến. […]
SQL với BigQuery
SQL là một trong những kỹ năng phổ biến nhất trong Khoa học dữ liệu. Trong bài viết này tôi […]
Hồi quy tuyến tính (linear regression) cho học máy (machine learning)
Hồi quy tuyến tính có lẽ là một trong những thuật toán nổi tiếng và được nghiên cứ nhiều nhất […]
Kiểm định giả thuyết và ý nghĩa thống kê
Ý nghĩa thống kê là một trong những thuật ngữ chúng ta thường nghe mà không thực sự hiểu rõ. […]
Một số khái niệm xác suất thống kê cơ bản thường sử dụng trong phân tích dữ liệu (Phần 2)
Tiếp theo phần 1, trong bài viết này, tôi sẽ khái quát thêm một số khái niệm xác suất thống […]
Một số khái niệm xác suất thống kê cơ bản thường sử dụng trong phân tích dữ liệu (Phần 1)
Xác suất thống kê đóng một vai trò quan trọng trong các dự án về khoa học dữ liệu. Mọi […]
Giới thiệu về Kaggle
Học khoa học dữ liệu với người mới bắt đầu có vẻ như là một việc quá sức. Ở đâu […]
Học máy (Machine learning) là gì? Phân loại các thuật toán học máy
Học máy (machine learning) được định nghĩa là việc nghiên cứu các chương trình máy tính sử dụng các thuật […]
Khoa học dữ liệu là gì?
Khi thế giới bước vào thời đại dữ liệu lớn (big data), nhu cầu lưu trữ cũng tăng lên. Đó […]