之前我已经写过一些基础介绍了,因此可供参考基础
R语言简介与下载安装
R语言是一款开源的编程类工具,专门用于数据清洗、整理、统计分析、可视化以及数据挖掘等方面,而且不受系统平台的限制。
在https://www.r-/ 网站中可以下载到R语言,最好选择清华的镜像。
为了能够更好的写代码,可以下载RStudio软件,即R语言的GUI。 /
第三方包的下载与加载
使用代码下载:
install.packages(package_name)
使用代码加载
library(package_name)require(package_name)
library 和require 都是加载包,区别在于,输出的错误信息不一致。
如何查看帮助文档
R语言中的数据结构
向量的创建
手工输入法——C序列生成法——:或seq重复生成法——rep目标抽取法#手工输入法w<-c(a,b,c,d)#seq方法w<-seq(from,to,by)w2<-seq(from,to,length)x<-seq(from=-5,to=5,length=1000)#重复生成法rep(x,times)rep(x,each)#times 指定x的循环次数#each 指定x其中的循环次数
向量的获取
位置索引法——中括号内写上目标元素的下标bool索引法——方括号内为布尔值#索引x<-c(10,2,5)x[1]y<-c(10,2,5)y[x>1]#实例:取出大于20的元素index<-which(x>20)x[index]
向量的数据类型转换
#实例 日期转换as.Date(x=c('6月1日','2月10日','7月15日'),format='%Y年%m月%日’)parse_date_time(x,orders)
特殊值
向量的因子化转换
factor(x=character(),levels,labels=levels,exclude=NA,ordered=is.ordered(x))gender<-c('男‘,’男‘,’女‘)factor(x=gender)
常用函数
矩阵
矩阵的构造
通常意义上,矩阵主要是指二维矩阵,由列和行两个维度构成。
matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)as.matrix(x,rownames.force=NA)#data 指定一个用于构造矩阵的一维向量;nrow ncol分别指定行列数;dimnames设置行列名称
矩阵的索引
mat4<-matrix(1:24,ncol=4)mat4mat4[3,]mat4[,2]mat4[3,2]mat4[2:5,2:3]#取出奇数行偶数列的数据mat4[1:dim(mat4[1]%%2==1,1:dim(mat4)[2]%%2==0]
基于矩阵运算的常用函数
数据框
构造数据框
不管是向量还是矩阵,它们的元素都是同质的。
数据框的构造有两种途径,一种是利用data.frame函数手动创建或者利用as.data.frame生成。
常用函数
#从学生信息表中筛选出身高不低于170的男生subset(x=stu_info,subset=gender=='男'&height>=170)
列表
列表类似于一个大熔炉,可以存储任意一种数据对象,列表的索引有3种形式,分别是单中括号、双中括号以及美元符号。
控制流语句及自定义函数
#自定义函数func_name<-function(parameters){ func_expressionreturn(result)}
apply族函数
tapply函数的使用:用于向量的分组统计。
tapply(x,INDEX,FUN=NULL,...,simplify=TRUE)res2=tapply(X=iris$Sepal.Width,INDEX=iris$Species,FUN=summary)res2
apply函数用于矩阵轴的统计。
apply(X,MARGIN,FUN,...)#MARGIN如果为1,就表示对矩阵的每一行进行统计计算,如果为2,就表示对每一列做统计运算。
lapply和Sapply函数
lapply函数用于对向量或者列表元素的计算。sapply函数是lapply的升级版。