What? Scikit-learn là gì?
Scikit-learn (viết
tắt là sklearn) là một thư viện mã nguồn mở dành cho học máy - một ngành trong
trí tuệ nhân tạo, rất mạnh mẽ và thông dụng với cộng đồng Python, được thiết kế
trên nền NumPy và SciPy. Scikit-learn chứa hầu hết các
thuật toán machine learning hiện đại nhất, đi kèm với documentations, luôn được
cập nhật.
Why? Tại sao nên dùng scikit-learn?
- Hỗ trợ hầu hết
các thuật toán của machine learning một cách đơn giản, hiệu quả mà chúng ta
không cần phải mất công ngồi cài đặt lại.
- Có tài liệu hướng
dẫn sử dụng
- Độ tin cậy cao do
scikit-learn được xây dựng bởi các chuyên gia hàng đầu
- Có nguồn dữ liệu
phong phú: iris, digit, …
When? Khi nào thì sử dụng scikit-learn?
Đơn giản là khi cần
giải quyết bài toán có thể áp dụng được học máy. Tất nhiên là bạn vẫn có thể giải
quyết mà không cần dùng tới sự hỗ trợ của scikit-learn và bạn biết chắc chắn là
không hề đơn giản rồi.
How? Sử dụng scikit-learn như thế nào?
Trước tiên máy bạn
phải được cài đặt Python rồi. Sau đó bạn có thể vào trực tiếp trang chủ của scikit-learn để xem cách cài đặt nó. Đơn giản nhất
là sử dụng Anaconda
Như đã nói, sklearn được xây dựng trên NumPy và SciPy nên để sử dụng sklearn,
chúng ta bắt buộc phải có 2 packages này. Tất nhiên ta nên cài đặt matplotlib, một package không thể thiếu
trong scientific plotting. Cuối
cùng, chúng ta cần cài thêm package pandas,
phục vụ cho data wrangling và analysis.
Nếu đã có Python
thì có thể cài đặt các thư viện trên sử dụng pip:
pip install
numpy scipy matplotlib scikit-learn pandas
Như vậy ta đã có tất
cả các thư viện cần thiết để phục vụ nghiên cứu machine learning. Hãy sử dụng
nó để thực hành các bài viết trong blog nhé.
Tham khảo:
1 nhận xét:
Cảm ơn anh/team.
Bài ngắn gọn, nhanh nuốt.
Đăng nhận xét