Skip to content

Pandas 基础

Pandas 是基于 NumPy 构建的数据分析工具,提供了高效地操作大型数据集所需的工具。

Terminal window
pip install pandas
import pandas as pd

一维数组,类似于带有标签的列表。

data = [1, 2, 3]
s = pd.Series(data)
print(s)

二维表格数据,类似于 Excel 表格。

data = {
'Name': ['Tom', 'Jerry', 'Mickey'],
'Age': [20, 22, 25]
}
df = pd.DataFrame(data)
print(df)
df.head() # 查看前 5 行
df.info() # 查看数据基本信息
df.describe() # 统计摘要

Pandas 支持多种数据格式,最常用的是 CSV。

df = pd.read_csv('data.csv')
df.to_csv('output.csv', index=False)
# 筛选 Age 大于 21 的行
filtered_df = df[df['Age'] > 21]
print(filtered_df)