Tổng số lượt xem trang

Thứ Hai, 7 tháng 8, 2017

Bắt đầu với Scikit-learn

What? Scikit-learn là gì?

Scikit-learn (viết tắt là sklearn) là một thư viện mã nguồn mở dành cho học máy - một ngành trong trí tuệ nhân tạo, rất mạnh mẽ và thông dụng với cộng đồng Python, được thiết kế trên nền NumPySciPy. Scikit-learn chứa hầu hết các thuật toán machine learning hiện đại nhất, đi kèm với documentations, luôn được cập nhật.

Why? Tại sao nên dùng scikit-learn?

- Hỗ trợ hầu hết các thuật toán của machine learning một cách đơn giản, hiệu quả mà chúng ta không cần phải mất công ngồi cài đặt lại.
- Có tài liệu hướng dẫn sử dụng
- Độ tin cậy cao do scikit-learn được xây dựng bởi các chuyên gia hàng đầu
- Có nguồn dữ liệu phong phú: iris, digit, …

When? Khi nào thì sử dụng scikit-learn?

Đơn giản là khi cần giải quyết bài toán có thể áp dụng được học máy. Tất nhiên là bạn vẫn có thể giải quyết mà không cần dùng tới sự hỗ trợ của scikit-learn và bạn biết chắc chắn là không hề đơn giản rồi.

How? Sử dụng scikit-learn như thế nào?

Trước tiên máy bạn phải được cài đặt Python rồi. Sau đó bạn có thể vào trực tiếp trang chủ của scikit-learn để xem cách cài đặt nó. Đơn giản nhất là sử dụng Anaconda
Như đã nói, sklearn được xây dựng trên NumPySciPy nên để sử dụng sklearn, chúng ta bắt buộc phải có 2 packages này. Tất nhiên ta nên cài đặt matplotlib, một package không thể thiếu trong scientific plotting. Cuối cùng, chúng ta cần cài thêm package pandas, phục vụ cho data wranglinganalysis.
Nếu đã có Python thì có thể cài đặt các thư viện trên sử dụng pip:

pip install numpy scipy matplotlib scikit-learn pandas

Như vậy ta đã có tất cả các thư viện cần thiết để phục vụ nghiên cứu machine learning. Hãy sử dụng nó để thực hành các bài viết trong blog nhé.

Tham khảo:

0 nhận xét: