读书笔记:R语言中数据结构基础知识补充

R语言中常见谬误习惯

  1. 大小写应用谬误,函数名的大小写不同示意的性能也不同。
  2. 引号应用谬误,R包的名称前后须要引号突围,否则报错。
  3. 函数后缀括号应用谬误,即便函数后没有参数,也要接上()
  4. 路径名与本义符,\/示意不同含意,有时门路中含有\,须要将其批改。
  5. R包应用谬误,每次应用R包都要先载入,否则会报错。

数据结构

向量

向量中的数据能够是数值型、逻辑型、字符型,然而单个向量内数据类型要统一。c()示意组合的意思。
元素后方括号中加数字能够拜访该地位的元素。

矩阵

矩阵是二维数组,每个元素具备雷同的类型。maxrix进行创立矩阵。

数组

矩阵只能是二维的,但数组能够具备更多维度。array进行创立,数组能够看作是矩阵的一种扩大模式,数组内数据类型须要保持一致。

数据框

数据框的列与列之间的数据类型能够不同,然而每一列内要雷同,相似于常见的数据集格局。
数据框中每一列都是一个变量,能够应用$符号进行调用。

attachdetach这两对函数能够简化数据框的输出形式,防止每次反复输出数据框的名称。
还有一种形式是with(数据名{执行命令$变量名}),花括号内的赋值变量如果须要全局应用,则用<<-符号。

因子

变量能够分成三种不同的类型

  • 无序变量

    • 名义型
      类别型的数据,比方男和女,别离代表不同品种。
  • 有序变量

    • 非连续型
      等级类的数据,比方小、中、大,存在肯定程序。
    • 连续型
      数值类的数据,比方株高、分量等,常见的测量数值。

R语言中用因子(factor)示意名义型和非间断有序型变量,实际上能够了解成将变量的每个子项映射到一个数字,用数字来代表类别或等级。

order=TRUE示意有序排列
levels=c("small","mid","big")设置序列等级,默认依照字母顺序排列。
str()能够疾速数据的构造信息
summary()查看数据概要,包含最值、均值、频数等信息。

列表

R语言中最为简单的数据结构,蕴含好几个对象(比方向量、矩阵、数据框、其余列表),用list()创立。

列表内每个对象(变量)能够独立命名,如果不加名称则依照数字程序。应用[[ x ]]双重方括号内加对象名或者序号即可疾速调取。

注意事项:

  1. 美元符号$示意变量的意思,句号.没有非凡含意
  2. R语言中序号下标从1开始,而不是0
课本材料:R语言实战-第二版-人民邮电出版社

本文由mdnice多平台公布