Tổng số lượt xem trang

Thứ Hai, 29 tháng 5, 2017

Python – Cài đặt



Có thể ngắn gọn rằng: học Máy học rất khó có thể "cưỡng" sự hấp dẫn của Python. Đơn giản là vì hiện nay có rất nhiều thư viện cho Máy học được xây dựng/sử dụng Python (Tensorflow, Theano, hay scikit-learn).

      Trong bài này chúng ta sẽ cùng nhau cài đặt Python và những thư viện quan trọng để có được môi trường lập trình thuật tiện nhất. Python là ngôn ngữ lập trình mã nguồn mở, miễn phí, và có sẵn cho các hệ điều hành. Chúng tôi sẽ hướng dẫn mọi người trên môi trường Windows, với môi trường khác, việc cài đặt cũng không có nhiều khác biệt.

Chú ý: Python và các thư viện thường có các phiên bản khác nhau, cho  Windows 32-bit hay 64-bit.

Cài đặt Python trên Windows
Chúng ta vào [1] để lựa chọn phiên bản Python (Hình 1):

 Hình 1. Màn hình tải tệp cài đặt Python.

      Tại thời điểm cuốn sách này đang được viết thì Python 3.6.0 là phiên bản mới nhất. Khi bạn chọn tải về, chúng ta sẽ có tệp .exe và cài đặt bình thường. Nếu chúng ta không thay đổi, nó sẽ ở thư mục trong ổ chứa hệ điều hành (C:\). Để kiểm tra xem Python đã cài đặt và chạy được hay chưa, chúng ta tạo ra một file có tên là hello.py (dùng Notepad hay bất kì trình soạn thảo nào) với nội dung như sau:
print ('Hello. This is the first Python program!')
      Và lưu tệp hello.py vào một thư mục, trên máy của chúng tôi sẽ là thư mục D:\HocMayHoc. Bây giờ chúng ta hãy mở terminal ( Start>cmd) và đơn giản chỉ cần gõ (Hình 2):
D:\HocMayHoc>python hello.py
      Chương trình sẽ hiện như sau:
Hello. This is the first Python program!
Hình 2. Minh họa cho chương trình Python đầu tiên.

      Chúng ta thấy đấy, để viết một chương trình Python thật đơn giản! Chúng ta cũng có thể tương tác trực tiếp trên terminal bằng cách gọi trình biên dịch Python, sau đó gõ các dòng lệnh trên đó (Hình 3):
Hình 3. Lập trình trực tiếp Python trên terminal.

      Mặc dù chúng ta có thể lập trình trực tiếp trên terminal như vậy, nhưng để công việc dễ dàng hơn, đặc biệt khi chúng ta xây dựng những chương trình phức tạp, chúng ta cần một môi trường phát triển tương tác trực quan hơn. Đó chính là PyCharm.

Cài đặt PyCharm cho Python
Để cài đặt PyCharm, chúng ta vào [2] để tải tệp cài đặt. Lựa chọn hệ điều hành phù hợp (chúng tôi dùng Windows). PyCharm có 2 phiên bản: Professional là phiên bản đủ (có phí), và Community (miễn phí). Chúng ta sẽ tải phiên bản Community, vì nó cũng có đầy đủ những tính năng mà chúng ta cần cho cuốn sách này (Hình 4). 
Hình 4. Trang web download PyCharm.

      Nếu việc cài đặt PyCharm ổn thỏa, chúng ta sẽ thấy như Hình 5:

Hình 5. Màn hình mở PyCharm


      Chúng ta chọn tạo dự án mới (Create New Project), sau đó gõ tên dự án vào (Hình 6):

Hình 6. Tạo dự án trên PyCharm.

      Chúng ta lấy tên dự án là: HocMayHoc. Sau đó để tạo ra tệp chưa chương trình Python, nhấn chuột phải vào dự án, chọn New, rồi chọn Python File (xem Hình 7). Gõ tên file (ví dụ hello.py), và chúng ta sẽ có được Hình 8:

Hình 7. Tạo chương trình Python.


Hình 8. Tệp Python đã sẵn sàng để chúng ta lập trình.


      Sau khi hoàn tất một chương trình, chúng ta nhấn Ctr+Shift+F10 để chạy chương trình. Hoặc có thể dùng nút (Run).
      PyCharm tạo môi trường làm việc rất dễ dàng cho người lập trình. Người đọc có thể tham khảo thêm [3, 4] để tham khảo thêm.

Cài đặt các thư việncho Python

Nhằm giúp cho quá trình xây dựng một chương trình Máy học đơn giản, chúng ta cần nhiều thư viện. Có thể có nhiều cách cài đặt các thư viên,  nhưng khi chúng ta có PyCharm, dùng PyCharm là đơn giản nhất. Từ PyCharm chúng ta vào File/Default Settings, chọn Default Project/ Project Interpreter, chọn tiếp vào dấu (+) màu xanh như hình dưới:


Hình 9. Chọn (+) để cài đặt thư viện.

      Muốn cài đặt thư viện nào, chúng ta chỉ cần gõ tên thư viện đó. Ví dụ matplotlib như hình dưới hiển thị phiên bản cập nhật và thông tin tác giả của thư viện:



Hình 10. Hình ảnh sau khi vào File/Default Settings/ Default Project/ Project Interpreter
và chọn (+).
      Thao tác sau cùng là nhấn nút: Install Package ở phía dưới và đợi PyCharm tự cài đặt phần còn lại. Quá trình cài đặt hoàn tất sẽ được PyCharm cập nhật vào danh sách thư viện, hiển thị như hình.
      Quá trình cài đặt các thư viện khác cũng tiến hành tương tự. Trong cuốn sách này ngoài matplotlib, chúng ta cần thêm numpy, pandas, và scikit-learn.


1 nhận xét:

Unknown nói...

Ai theo được course này sẽ có nền tảng Python rất ổn:
https://www.datacamp.com/courses/intro-to-python-for-data-science?utm_source=fb_paid&utm_medium=fb_desktop&utm_campaign=fb_ppa