#데이터 전처리
#데이터 전처리 이후 종속변수의 정규성 판단
#종속변수가 정규성을 따르지 않는다는 것을 확인했다.
#데이터가 비정규성이므로 이를 분석하기 위해 rlm을 사용한다.
#그러기 위해 rlm을 하는데 사용되는 MASS라이브러리를 불러온다.
#rlm 진행
#t 값을 확인하면 주말/주중 데이터는 유의미한 영향력이 없다는 것을 알 수 있다.
#따라서 주중/주말 데이터 제거하고 새로운 모델 생성
새로운 모델에서는 모든 독립변수가 종속변수에 유의미한 영향을 준다는 것을 볼 수 있고,
다중공선성 검증 결과 값이 1내외로 아주 작은 값이므로 다중공선성에도 문제가 없다.
따라서 이 모델을 최종 모델로 선별한다.
함의
- 기온(Temp):
- 기온이 1도 상승할 때 오존 농도는 약 1.32 ppb 증가.
- t-value = 7.48 → 기온은 오존 농도에 강한 영향을 미침(유의미).
- 태양광(Solar.R):
- 태양광이 1 langley 증가할 때 오존 농도는 약 0.0454 ppb 증가.
- t-value = 2.66 → 유의미한 영향을 미침.
- 풍속(Wind):
- 풍속이 1 mph 증가할 때 오존 농도는 약 2.07 ppb 감소.
- t-value = -4.51 → 유의미한 음의 영향을 미침.
- 주중/주말 여부(is_weekday):
- 주중/주말 여부는 오존 농도에 유의미한 영향을 미치지 않음.
'R' 카테고리의 다른 글
R데이터분석을 할 때 여러가지 경우의 수 (0) | 2024.12.08 |
---|---|
r내장데이터 mtcars를 이용한 데이터분 (0) | 2024.12.07 |
전력 데이터에 영향을 미치는 요인 분석 (0) | 2024.12.07 |
음주와콜레스테롤 aov (0) | 2024.10.21 |
운동하는 사람들 중에서 체중의 평균이 그룹간 차이가 있나(anova) (0) | 2024.10.20 |