Syntax

Comment dùng dấu #

Import thư viện vào chương trình

1
import pandas as pd

Variable

Có thể dùng a-z|A-Z|0-9 và dấu _ để đặt tên biến

Gán giá trị vào biến bằng dấu =

String (chuỗi)

Dùng ' hoặc " đều được, nhưng cần nhất quán trong chương trình

Có thể nối chuỗi bằng phép +

Đối với chuỗi nhiều dòng, dùng 3 dấu quote '''

Number (số)

Có 2 kiểu int và float

Truyền vào hàm str() để chuyển số thành chuỗi

Phép toán

Cộng trừ nhân chia + - * /

Luỹ thừa dùng 2 ký tự sao **

Chia lấy phần dư dùng dấu phần trăm %

Shorthand: Dùng phép toán trước dấu bằng += để thay đổi một biến

Hàm

Cấu trúc def function_name():

Dấu space được dùng để chỉ đoạn code nào thuộc hàm.

Param có 3 loại: truyền theo vị trí, truyền theo tên, và param không bắt buộc.

Các hàm có sẵn: max(), min(), round(), str()

Hỗ trợ return nhiều value, cách nhau bởi dấU phẩy

Thao tác trên DataFrame

Kiểu dữ liệu của pandas, thể hiện bảng 2 chiều

Đọc dữ liệu từ csv vào DataFrame

1
dataset = pd.read_csv('file_name.csv')

Xem những cột đầu tiên của DataFrame

1
df.head(10)

Thêm cột vào DataFrame dựa vào giá trị của cột khác

1
df['c'] = df.apply(lambda row: row.a + row.b, axis=1)

Tính toán summary của một cột trong DataFrame

1
result = df['value_column'].mean()

Unique value count của một cột trong DataFrame

1
df['A'].value_counts()

Xem các thống kê cơ bản của DataFrame

1
df.describe(include = 'all')