본문 바로가기
R Basics

데이터프레임 (2)

by Nowkeeh Ahc

데이터셋의 기본 정보 확인

 

iris 데이터셋의 기본 내용 확인하기

- 매트릭스와 데이터 프레임은 모두 2차원 형태의 데이터를 저장하는 자료구조이기 떄문에 다루는 방법이 대부분 동일

- 데이터 프레임인 iris 데이터셋을 대상으로 학습을 하지만 매트릭스에도 동일하게 적용

dim(iris) 		# 행과 열의 개수 출력 
nrow(iris) 		# 행의 개수 출력 
ncol(iris) 		# 열의 개수 출력 
colnames(iris) 	# 열 이름 출력, names( )와 결과 동일 
head(iris) 		# 데이터셋의 앞부분 일부 출력 
tail(iris) 		# 데이터셋의 뒷부분 일부 출력

 

iris  데이터셋의 추가적인 내용 확인하기

str(iris) 				# 데이터셋 요약 정보 보기 
iris[,5] 				# 품종 데이터 보기 
unique(iris[,5]) 			# 품종의 종류 보기(중복 제거) 
table(iris[,"Species"]) 		# 품종의 종류별 행의 개수 세기

 

매트릭스와 데이터프레임에서 사용하는 함수

 

행별, 열별 합계와 평균 계산

colSums(iris[,-5]) 		# 열별 합계 
colMeans(iris[,-5]) 		# 열별 평균 
rowSums(iris[,-5]) 		# 행별 합계 
rowMeans(iris[,-5]) 		# 행별 평균

 

행과 열의 방향 전환

z <- matrix(1:20, nrow=4, ncol=5)
z
t(z) 			# 행과열 방향 전환

 

조건에 맞는 행과 열의 값 추출

IR.1 <- subset(iris, Species=="setosa") 
IR.1 
IR.2 <- subset(iris, Sepal.Length>5.0 & 
		Sepal.Width>4.0) 
IR.2 
IR.2[, c(2,4)] 		# 2, 4열의 값만 추출

 

매트릭스와 데이터프레임에 산술연산

a <- matrix(1:20,4,5) 
b <- matrix(21:40,4,5) 
a 
b 

2*a 		# 매트릭스 a에 저장된 값들에 2를 곱하기
b-5 
2*a + 3*b 

a+b 
b-a 
b/a 
a*b 

a <- a*3 
b <- b-5

 

 

자료구조 확인

 

class(iris) 			# iris 데이터셋의 자료구조 확인 
class(state.x77) 		# state.x77 데이터셋의 자료구조 확인 
is.matrix(iris) 		# 데이터셋이 매트릭스인지를 확인하는 함수 
is.data.frame(iris) 		# 데이터셋이 데이터프레임인지를 확인하는 함수 is.matrix(state.x77) 
is.data.frame(state.x77)

 

자료구조 변환

# 매트릭스를 데이터프레임으로 변환 
st <- data.frame(state.x77) 
head(st) 
class(st) 

# 데이터프레임을 매트릭스로 변환 
iris.m <- as.matrix(iris[,1:4]) 
head(iris.m) 
class(iris.m)

 

 

열 추출

iris[,"Species"] 	# 결과=벡터. 매트릭스와 데이터프레임 모두 가능 
iris[,5] 		# 결과=벡터. 매트릭스와 데이터프레임 모두 가능 iris["Species"] 	# 결과=데이터프레임. 데이터프레임만 가능 
iris[5] 		# 결과=데이터프레임. 데이터프레임만 가능 
iris$Species 	# 결과=벡터. 데이터프레임만 가능

 


This post was written based on what I read and studied the book below.

http://www.yes24.com/Product/Goods/92851804

댓글