Syntax
Comment dùng dấu #
Import thư viện vào chương trình
1 | import pandas as pd |
Variable
Có thể dùng a-z|A-Z|0-9
và dấu _
để đặt tên biến
Gán giá trị vào biến bằng dấu =
String (chuỗi)
Dùng '
hoặc "
đều được, nhưng cần nhất quán trong chương trình
Có thể nối chuỗi bằng phép +
Đối với chuỗi nhiều dòng, dùng 3 dấu quote '''
Number (số)
Có 2 kiểu int và float
Truyền vào hàm str()
để chuyển số thành chuỗi
Phép toán
Cộng trừ nhân chia + - * /
Luỹ thừa dùng 2 ký tự sao **
Chia lấy phần dư dùng dấu phần trăm %
Shorthand: Dùng phép toán trước dấu bằng +=
để thay đổi một biến
Hàm
Cấu trúc def function_name():
Dấu space được dùng để chỉ đoạn code nào thuộc hàm.
Param có 3 loại: truyền theo vị trí, truyền theo tên, và param không bắt buộc.
Các hàm có sẵn: max(), min(), round(), str()
…
Hỗ trợ return nhiều value, cách nhau bởi dấU phẩy
Thao tác trên DataFrame
Kiểu dữ liệu của pandas, thể hiện bảng 2 chiều
Đọc dữ liệu từ csv vào DataFrame
1 | dataset = pd.read_csv('file_name.csv') |
Xem những cột đầu tiên của DataFrame
1 | df.head(10) |
Thêm cột vào DataFrame dựa vào giá trị của cột khác
1 | df['c'] = df.apply(lambda row: row.a + row.b, axis=1) |
Tính toán summary của một cột trong DataFrame
1 | result = df['value_column'].mean() |
Unique value count của một cột trong DataFrame
1 | df['A'].value_counts() |
Xem các thống kê cơ bản của DataFrame
1 | df.describe(include = 'all') |