提示信息

R语言常用函数介绍及应用

柿子 已关注

R语言作为统计分析和数据处理的重要工具,提供了大量的内置函数来简化数据操作和分析。在此,我将介绍一些常用的R语言函数,并简单说明它们的应用。

基础统计函数

  1. mean(): 计算平均值。

    1. data <- c(1, 2, 3, 4, 5)
    2. mean_value <- mean(data)
    3. # mean_value => 3
  2. median(): 计算中位数。

    1. median_value <- median(data)
    2. # median_value => 3
  3. sd(): 计算标准差。

    1. standard_deviation <- sd(data)
    2. # standard_deviation => 1.58 (approx)
  4. var(): 计算方差。

    1. variance <- var(data)
    2. # variance => 2.5
  5. summary(): 提供数据的摘要统计。

    1. summary_data <- summary(data)
    2. # Outputs Min, 1st Qu., Median, Mean, 3rd Qu., Max

数据操作函数

  1. c(): 创建向量。

    1. vector <- c(1, 2, 3, 4, 5)
  2. data.frame(): 创建数据框。

    1. df <- data.frame(Name=c("John", "Doe"), Age=c(28, 30))
  3. dim(): 获取数据框或矩阵的维度。

    1. dimensions <- dim(df)
    2. # dimensions => 2 rows, 2 columns
  4. names(): 获取或设置对象的名称。

    1. names(df) <- c("Name", "Age")
  5. head() / tail(): 查看数据的前几行或后几行。

    1. head_data <- head(df, n = 1)

子集和索引

  1. subset(): 根据条件筛选数据子集。

    1. subset_df <- subset(df, Age > 28)
  2. which(): 返回符合条件的索引。

    1. index <- which(df$Age > 28)
    2. # index => 2
  3. unique(): 返回唯一值。

    1. unique_values <- unique(data)

图形绘制函数

  1. plot(): 创建简单的二维图形。

    1. plot(data)
  2. hist(): 绘制直方图。

    1. hist(data)
  3. boxplot(): 绘制箱线图。

    1. boxplot(data)

数据转换函数

  1. as.numeric(), as.character(), as.factor(): 类型转换。

    1. num_data <- as.numeric(c("1", "2", "3"))
  2. as.matrix(), as.data.frame(): 数据框和矩阵相互转换。

    1. matrix_data <- as.matrix(df)

高级功能

  1. apply(): 对数组或矩阵应用函数。

    1. result <- apply(matrix_data, 2, sum) # 对每列求和
  2. lapply() / sapply(): 对列表应用函数。

    1. list_data <- list(a=1:5, b=6:10)
    2. lapply_result <- lapply(list_data, sum)
  3. tapply(): 按分类因子计算函数。

    1. group_sum <- tapply(df$Age, df$Name, sum)

这些函数只是R语言功能广泛的冰山一角。通过结合这些函数,你可以进行数据导入、清理、分析和可视化,帮助揭示数据中隐藏的模式和关系。

    遇到难题? "AI大模型GPT4.0、GPT" 是你的私人解答专家! 点击按钮去提问......
柿子 关注 已关注

最近一次登录:2024-11-20 12:42:00   

暂时还没有签名,请关注我或评论我的文章
×
免费图表工具,画流程图、架构图