R 语言入门基础知识

日期：2020-06-18 栏目：程序人生浏览：次

R语言 1997年成为GNU项目开源免费

R官方网址

R是数据分析领域的语言
小巧灵活，通过扩展包来增强功能
绘图功能
代码简单

开发环境
R + RStudio

1、数据类型
character 字符
numeric 数值型，实数或小数
integer 整型
complex 复数型
logical 逻辑型类似于boollean

2、数据结构
Vector 向量
Factor 因子
Array 数组
Matrix 矩阵
Data Frame 数据框
List 列表

R 语言入门基础知识

一维：向量、因子向量属于数值型变量，因子对应于分类变量
二维：矩阵、数据框矩阵中元素的数据类型是一致的，数据框由向量组成，每个向量中的数据类型保持一致，向量间的数据类型可以不一致，类似于表结构。
三维：数组、列表数组用的比较少，多维数据结构；列表可以包含上面所有的数据结构

3、向量
向量表示一组数据，数据类型一致，向量可以表示行或者列
c() 如:
: 如: 1:10
seq(from(开始), to(到), by(步长), length.out(指定向量的元素个数), along.with(长度与指定的向量长度相同))

提取子集：
数字下标(正数:获取指定元素，从1开始，负数:排除的意思)
which()函数(按条件来进行筛选)

#向量
(x1<- c(10,11,12,13))
(x2<- 1:10)
x3<- seq(1,5,1) #from 1 to 5 by 1
x4<- seq(5,by=2,length.out=8) #向量中元素个数为8
x5<- seq(2,by=3, along.with = x4) # along.with向量个数与x4一致
x5[1:5]
x5[c(1,2,3,4,5)]
x5[-1:-5] #不要下标为1-5的元素

which(x5>5) #大于5的向量下标
x5[which(x5>10)] #大于5的向量值

4、因子
因子用于分类变量，有类别
factor()
gl()

#因子
f<-c('a','a','b','o','ab','ab')
f<-factor(c('a','a','b','o','ab','ab')) #创建因子，level默认按字母排序

unclass(f) #查看因子

f<-factor(c('a','a','b','o','ab','ab'),levels = c('a','b','o','ab')) #指定因子对应的level

unclass(f) #

f1<- gl(4,3,labels = c('blue','red','green','yellow')) #4个级别，每个级别重复3次，labels的内容
f1

unclass(f1)

5、矩阵
行和列

生成矩阵
matrix()
由向量派生
由向量组合生成

操作
访问元素
行列命名

矩阵运算
矩阵加法
1.矩阵+n 各个元素加n
2.矩阵+矩阵对应元素相加

矩阵乘法
1.矩阵*n 各个元素乘n
2.矩阵*矩阵行列相乘(矩阵1 m行*n列矩阵2 p*q 要求n==p 结果矩阵为 m*q)
3.矩阵元素*矩阵元素对应元素相乘

R 语言入门基础知识

单位矩阵
元素都为1 n*n方阵

对角矩阵
对角元素为1 其余的为0 n*n方阵

矩阵转置
n*m m*n

#矩阵

#创建矩阵：
#方法一：使用matric(nrow=?,ncol=?)
x<-matrix(nrow=2,ncol=3) #nrow 指定行， ncol指定列
x
x<-matrix(1:18,nrow = 3,ncol = 6) # 3行，6列，元素值由1:18填充，默认一列一列顺序填充
x
x<-matrix(1:18,nrow = 3, ncol = 6, byrow = T) # 3行，6列，元素值由1:18填充，指定行顺序填充
x

#方法二： dim(a) 通过dim 传递向量
a<-1:18
dim(a)<-c(3,6) #3行6列，行顺序填充
x

#方法三： rbind或cbind进行拼接
x<-1:10
y<-11:20
z<-21:30

m1 = rbind(x,y,z) #以行为单位进行拼接
m2 = cbind(x,y,z) #以列为单位进行拼接
m1
m2

#获取矩阵元素
x<-matrix(1:18,nrow = 3,ncol = 6,byrow = T)
x

x[1,2] #第1行第2列
x[1,] #第1行
x[,2] #第2列
x[,c(2,3,4)] #第2 3 4列
x[c(1,2),] #第1 2行
x[c(1,2),2:4] #第1 2行第2 3 4列

#行列命名
colnames(x)<-c('C1','C2','C3','C4','C5','C6') #列的名字
rownames(x)<-c('R1','R2','R3') #行的名字

x['R1','C1']
x[c('R1','R2'),c('C1','C2')]

#矩阵运算

m1<-matrix(1:18,nrow = 3,ncol = 6, byrow = T)
m2<-matrix(19:36,nrow = 3, ncol = 6, byrow = T)
m1
m2

#矩阵加法
m1+10 #矩阵+n
m1+m2 #矩阵+矩阵

#矩阵乘法
m1*10 #矩阵*n
m1*m2 #矩阵对应元素相乘
m1 %*% t(m2) #矩阵*矩阵矩阵乘法行列相乘

#对角矩阵
diag(4) #4*4矩阵对角元素都为1
diag(c(1,2,3,6)) #4*4矩阵，对角元素为1,2,3,6

x<-matrix(1:16,4,4)
diag(x) #显示矩阵x的对角元素值

#解方程组
m<-diag(4)
m
b<-1:4
solve(m,b) #m %*% x=b 求x

6、数据框
记录与域

#数据框

转载注明出处：https://www.heiqu.com/597740ac789208faa2f46f4d684c446c.html

R 语言入门基础知识

相关推荐