R语言常用函数介绍及应用
R语言作为统计分析和数据处理的重要工具,提供了大量的内置函数来简化数据操作和分析。在此,我将介绍一些常用的R语言函数,并简单说明它们的应用。
基础统计函数
mean(): 计算平均值。
data <- c(1, 2, 3, 4, 5)
mean_value <- mean(data)
# mean_value => 3
median(): 计算中位数。
median_value <- median(data)
# median_value => 3
sd(): 计算标准差。
standard_deviation <- sd(data)
# standard_deviation => 1.58 (approx)
var(): 计算方差。
variance <- var(data)
# variance => 2.5
summary(): 提供数据的摘要统计。
summary_data <- summary(data)
# Outputs Min, 1st Qu., Median, Mean, 3rd Qu., Max
数据操作函数
c(): 创建向量。
vector <- c(1, 2, 3, 4, 5)
data.frame(): 创建数据框。
df <- data.frame(Name=c("John", "Doe"), Age=c(28, 30))
dim(): 获取数据框或矩阵的维度。
dimensions <- dim(df)
# dimensions => 2 rows, 2 columns
names(): 获取或设置对象的名称。
names(df) <- c("Name", "Age")
head() / tail(): 查看数据的前几行或后几行。
head_data <- head(df, n = 1)
子集和索引
subset(): 根据条件筛选数据子集。
subset_df <- subset(df, Age > 28)
which(): 返回符合条件的索引。
index <- which(df$Age > 28)
# index => 2
unique(): 返回唯一值。
unique_values <- unique(data)
图形绘制函数
plot(): 创建简单的二维图形。
plot(data)
hist(): 绘制直方图。
hist(data)
boxplot(): 绘制箱线图。
boxplot(data)
数据转换函数
as.numeric(), as.character(), as.factor(): 类型转换。
num_data <- as.numeric(c("1", "2", "3"))
as.matrix(), as.data.frame(): 数据框和矩阵相互转换。
matrix_data <- as.matrix(df)
高级功能
apply(): 对数组或矩阵应用函数。
result <- apply(matrix_data, 2, sum) # 对每列求和
lapply() / sapply(): 对列表应用函数。
list_data <- list(a=1:5, b=6:10)
lapply_result <- lapply(list_data, sum)
tapply(): 按分类因子计算函数。
group_sum <- tapply(df$Age, df$Name, sum)
这些函数只是R语言功能广泛的冰山一角。通过结合这些函数,你可以进行数据导入、清理、分析和可视化,帮助揭示数据中隐藏的模式和关系。