# 파일 불러오기 ====
Exam = read.table("/Users/user/OneDrive - 경북대학교/학과/2-1/탐색적자료분석 및 실험/실습파일/exam1.txt", head = T)
head(Exam$score)

# 줄기와 잎그림 확인 ====
stem(Exam$score)

# 줄기 수 줄이기와 늘이기 ====
# 이유는 여러가지 가능성을 열어두고 탐색하기 위함. 

## 줄기 수 줄이기 ====
stem(Exam$score, scale = 0.5)
# (0,1), (2,3).... 한 줄에 다 들어감.
# 이렇게하면 이전에 했던 줄기 그림이 쌍봉분포인데 비해 이것의 줄기 그림은 단봉분포의 형태를 취한다. 이것은 너무 단순하여 이 자료의 주요 특성을 잃은 것으로 볼 수도 있다. 즉 2개의 봉우리를 구분하지 못하고 1개만 본 것이다. 

## 줄기 수 늘이기 ====
stem(Exam$score, scale = 2)
# 원자료라면 하나였을 줄기가 각각이 줄기가 2개가 생김. 
# 일반적으로 줄기 수를 늘이면 늘일수록 많은 수의 봉우리를 보게 되고 반대로 줄기 수를 줄이면 줄일 수록 적은 수의 봉우리를 보게 된다. 

## hist ====
hist(Exam$score, nclass = 10, right = F)
# 대용량 크기 확인에 용이하다.

hist(Exam$score, nclass = 20, right = F)

 

 

줄기 그림과 히스토그램의 공통점과 차이점 

 

1. 공통점

 > 테두리가 동일: 각 구간의 관측빈도에 비례하는 길이의 막대 기둥을 가진다.

 

2. 차이점

 > 줄기 그림에서는 구간 내의 자료들이 숫자로 구별

   - 히스토그램에서는 보다 큰 정보의 손실이 발생함. 

 

 > 줄기 그림은 줄기의 크기를 줄이거나 늘이는데 작성된 줄기 그림 사용 가능 

   - 계획적인 시행착오를 수작으로 거듭할 필요가 있는 EDA에서는 효율성에서 차이가 있다.

 

 > 히스토그램은 임의로 구간의 폭을 지정할 수 있다. 

+ Recent posts