데이터셋의 기본 정보 확인
iris 데이터셋의 기본 내용 확인하기
- 매트릭스와 데이터 프레임은 모두 2차원 형태의 데이터를 저장하는 자료구조이기 떄문에 다루는 방법이 대부분 동일
- 데이터 프레임인 iris 데이터셋을 대상으로 학습을 하지만 매트릭스에도 동일하게 적용
dim(iris) # 행과 열의 개수 출력
nrow(iris) # 행의 개수 출력
ncol(iris) # 열의 개수 출력
colnames(iris) # 열 이름 출력, names( )와 결과 동일
head(iris) # 데이터셋의 앞부분 일부 출력
tail(iris) # 데이터셋의 뒷부분 일부 출력
iris 데이터셋의 추가적인 내용 확인하기
str(iris) # 데이터셋 요약 정보 보기
iris[,5] # 품종 데이터 보기
unique(iris[,5]) # 품종의 종류 보기(중복 제거)
table(iris[,"Species"]) # 품종의 종류별 행의 개수 세기
매트릭스와 데이터프레임에서 사용하는 함수
행별, 열별 합계와 평균 계산
colSums(iris[,-5]) # 열별 합계
colMeans(iris[,-5]) # 열별 평균
rowSums(iris[,-5]) # 행별 합계
rowMeans(iris[,-5]) # 행별 평균
행과 열의 방향 전환
z <- matrix(1:20, nrow=4, ncol=5)
z
t(z) # 행과열 방향 전환
조건에 맞는 행과 열의 값 추출
IR.1 <- subset(iris, Species=="setosa")
IR.1
IR.2 <- subset(iris, Sepal.Length>5.0 &
Sepal.Width>4.0)
IR.2
IR.2[, c(2,4)] # 2, 4열의 값만 추출
매트릭스와 데이터프레임에 산술연산
a <- matrix(1:20,4,5)
b <- matrix(21:40,4,5)
a
b
2*a # 매트릭스 a에 저장된 값들에 2를 곱하기
b-5
2*a + 3*b
a+b
b-a
b/a
a*b
a <- a*3
b <- b-5
자료구조 확인
class(iris) # iris 데이터셋의 자료구조 확인
class(state.x77) # state.x77 데이터셋의 자료구조 확인
is.matrix(iris) # 데이터셋이 매트릭스인지를 확인하는 함수
is.data.frame(iris) # 데이터셋이 데이터프레임인지를 확인하는 함수 is.matrix(state.x77)
is.data.frame(state.x77)
자료구조 변환
# 매트릭스를 데이터프레임으로 변환
st <- data.frame(state.x77)
head(st)
class(st)
# 데이터프레임을 매트릭스로 변환
iris.m <- as.matrix(iris[,1:4])
head(iris.m)
class(iris.m)
열 추출
iris[,"Species"] # 결과=벡터. 매트릭스와 데이터프레임 모두 가능
iris[,5] # 결과=벡터. 매트릭스와 데이터프레임 모두 가능 iris["Species"] # 결과=데이터프레임. 데이터프레임만 가능
iris[5] # 결과=데이터프레임. 데이터프레임만 가능
iris$Species # 결과=벡터. 데이터프레임만 가능
This post was written based on what I read and studied the book below.
댓글