1.R

Preparation

Download: R

IDE: RStudio

![[Pasted image 20250508100748.png]]

2.Python

pandas库

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
import pandas as pd

df = pd.read_csv('') //1.读取csv文件

df.head() //2.读取前 5

df.info() /*3.快速了解一个 DataFrame 的结构和基本信息,包括:行数和列数;每一列的名字和数据类型(dtype);非空(non-null)值的数量;占用的内存。

用途:快速查看缺失值(通过 non-null count);理解每列的数据类型(object, int, float 等);检查数据量(多少行多少列)*/

df.shape //4.查看行数列数,返回元组(行数, 列数)

df['列名'] = pd.to_datetime(df['列名'], format='原始日期格式,如%d/%m/%Y') //5.把日期字符串变成‘datetime64’格式;

df['列名'].unique() //所有不重复值,即每种取一个