디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

봉갤 통계 (03)

요한행자갤로그로 이동합니다. 2023.05.31 15:34:38
조회 104 추천 0 댓글 2
														

1. 자료의 분포를 히스토그램과 상자 수염 그림(박스 플롯)으로 알아봅니다.
flower <- c(95,67,28,32,65,65,69,33,98,96,76,42,32,38,42,40,40,69,95,92,75,83,76,83,85,62,37,65,63,42,89,65,73,81,49,52,64,76,83,92,93,68,52,79,81,83,59,82,75,82,86,90,44,62,31,36,38,42,39,83,87,56,58,23,35,76,83,85,30,68,69,83,86,43,45,39,83,75,66,83,92,75,89,66,91,27,88,89,93,42,53,69,90,55,66,49,52,83,34,36)
> par(mfrow=c(2,1))
> hist(flower)
> boxplot(flower, horizontal=TRUE)

a15714ab041eb360be3335625683746f0753452cd6a5eb89d53460f4991dcd6eaabb0ad97faf07be9289d9050b


상자 수염 그림에서 수염은 min, MAX, 상자는 Q1, Q3 그리고 가운데 선은 Q2(median)이며,
수염 밖의 점들은 outlier.


2. 경험적인 규칙(3시그마 규칙 혹은 empirical rule)을 알아봅시다.
> deviation<-c(1,2,3)
> pnorm(deviation)-pnorm(deviation)
68% 95% 99.7% 얻으십니다.


3. 신뢰구간 구할 때 필요한 z/t-score 찾기
conf <- c(0.90, 0.95)
df = 19
z_score <- qnorm(1-(1-conf)/2)

#[1] 1.644854 1.959964
t_score <- qt(1-(1-conf)/2,df)
#[1] 1.729133 2.093024

4. 눈치채셨다시피 확률 분포에 d/p/q/r 두문자를
더하면 각각 distribution, probability density, quantile, random (난수)를
생성/계산하실 수 있습니다.


5. 통계로 진행하는 신뢰구간 계산

5.1 비율

기본 함수를 이용하면 전문적인 방법으로 계산되므로 그냥 함수만드셔서 계산합니다.

x<-8

n<-43#43번 중 8번 스페이드 뽑는 경우

z_interval<-function(x,n,conf){

p_hat <-x/n;

SE_est <- sqrt(p_hat*(1-p_hat)/n);

z_score <- qnorm(1-(1-conf)/2);

margin_of_error <- z_score*SE_est;

conf_interval <- p_hat + margin_of_error*c(-1,1);

return(conf_interval);

}

#(.07,.30) 스페이드 카드 분포율의 95% 신뢰구간

5.2 평균

자료가 있으시다면 6.2로, 없으면 다음 함수를 이용해 보세요.

t_interval<-function(x_bar,Sx,n,conf){

df=n-1;

t_score <- qt(1-(1-conf)/2,df);

margin_of_error <- t_score*Sx/sqrt(n);

conf_interval <- x_bar+margin_of_error*c(-1,1);

return(conf_interval);

}



6. 자료로 구하는 신뢰구간

6.1 비율

자료 정리해서 7.1에서와 같이 통계로 신뢰구간을 구합니다.

#card_n = runif(43);#균등 분포를 따르는 43개의 난수 ... 자료 준비는 댓글을 보세요.

x<-length(which(card=="spade"))#에잇 나옵니다.

n<-length(card)#43


6.2 평균

#t.test(energy_bar_protein, mu=20, alternative=c("two.sided"), conf.level=.95)

t.test(energy_bar_protein, conf.level=.95)

#(20.46771, 22.33229)를 구하였네요.


7. 요약 통계로 진행하는 가설 검정

7.1 비율 (one sample)

#Ho: p = .25

#Ha: p !=.25

alpha = 0.05 #일 때, (x,n) 이 (8,43)인 경우

prop.test(8,43,p=.25,alternative=c("two.sided"),conf.level=1-alpha,correct=FALSE)

#p-value .3328

#신뢰구간이 비범하게 계산되므로 사용시 유의하시기 바랍니다. (참고 3)


7.2 비율 비교(2-proportion sample z-test)

#Ho: p1 = p2

#Ha: p1!= p2

alpha = 0.05 #일 때, (x1,n1)=(306,382), (x2,n2)=(321,382)인 경우

prop.test(x<-c(306,321),n<-c(382,382),alternative=c("two.sided"),conf.level=1-alpha,correct=FALSE)

#p-value는 .1572


7.3 평균

BSDA 라이브러리에 tsum.test 라고 있는데 (왠지 설치가 안 되어서) 그냥 함수를 만들어 씁니다.

ttest1<-function(x_bar,Sx,n,alternative,mu,conf.level){

df=n-1;

t_score<-(x_bar-mu)/(Sx/sqrt(n));

if (alternative=='less'){

p_value <- pt(t_score,df);

} else if (alternative == 'greater'){

p_value <- 1-pt(t_score,df);

}

else {

p_value <- pt(-abs(t_score),df)+(1-pt(abs(t_score),df));

}

#신뢰구간도 함께 계산

#t_interval 함수는 5.2를 보세요.

conf.interval = t_interval(x_bar,Sx,n,conf.level)

#결과값 출력

print(sprintf('t: %f', t_score));#이렇게 해야 출력이 됨

print(sprintf('df: %d', df));

print(sprintf('p-value: %f',p_value));

print(sprintf('%5.1f%% confidence interval: %s',conf.level*100, paste(conf.interval,collapse=' ')))#paste는 숫자를 문자열로 변환시켜 줍니다

}

(예)

> ttest1(9.91,.55,125,alternative<-c('less'),mu<-10,conf.level=.95)

#[1] "t: -1.829510"

#[1] "df: 124"

#[1] "p-value: 0.034863"


7.4 평균 비교

ttest2<-function(mean.x,S.x,n.x,mean.y,S.y,n.y,alternative,conf.level){

SEest = sqrt(S.x^2/n.x+S.y^2/n.y);

df = n.x+n.y-2;#고수의 근사치

#df = (S.x^2/n.x+S.y^2/n.y)^2/(S.x^4/(n.x^2)/(n.x-1)+S.y^4/(n.y^2)/(n.y-1));#이것은 웰치스 t-검정 때 사용되는 df

t_score = (mean.x-mean.y)/SEest;

if (alternative=='less'){

p_value <- pt(t_score,df);

} else if (alternative == 'greater'){

p_value <- 1-pt(t_score,df);

}

else {

p_value <- pt(-abs(t_score),df)+(1-pt(abs(t_score),df));

}

print(sprintf('t: %f', t_score));#이렇게 해야 출력이 됨

print(sprintf('df: %d', df));

print(sprintf('p-value: %f',p_value));

}



8. 자료로 진행하는 가설 검정

8.1 평균

자료준비는 자료 9.1를 보셔요.

t.test(energy_bar_protein, mu=20, alternative=c("two.sided"), conf.level=.95)


8.2 평균 비교

자료준비는 참고 4를 보셔요. 자료 사이에 쉼표 안 넣으셔도 됩니다.

t.test(Value~Group,data=Data, var.equal=FALSE, conf.level=.95)



9. 자료

9.1 비율의 신뢰구간 구할 때 사용해보는 카드 자료 (균등 분포를 따르는 난수를 사용하였습니다.)

card_n <- c(0.036590445,0.454104494,0.415237338,0.546043575,0.391643707,0.142640430,0.563935322,0.634059084,0.491580955,0.680692898,0.249468027,0.365051202,0.611381465,0.737182819,0.355852245,0.856451032,0.603791257,0.240798722,0.790983794,0.743826264,0.766156720,0.697951405,0.538654729,0.001202413,0.170650637,0.722026658,0.337674215,0.932576812,0.142190033,0.546902644,0.675102984,0.586704257,0.244876134,0.804343352,0.551903761,0.423398372,0.688877665,0.003871202,0.980567358,0.879892344,0.910341816,0.521254774,0.037317731)

card<-replicate(43,0)#0을 43번 반복해서 담고 있는 double 벡터 타입

card[which(card_n<.25)]="diamond";#.25보다 작은 수는 다이아몬드

card[intersect(which(card_n>=.25),which(card_n<.50))] = "club"

card[intersect(which(card_n>=.50),which(card_n<.750))] = "heart"

card[which(card_n>=.75)] = "spade"

9.2 한 집단의 평균 t-검정 자료

출처: https://www.jmp.com/en_us/statistics-knowledge-portal/t-test/one-sample-t-test.html

energy_bar_protein <- c(20.70,27.46,22.15,19.85,21.29,24.75,20.75,22.91,25.34,20.33,21.54,21.08,22.14,19.56,21.10,18.04,24.12,19.95,19.72,18.28,16.26,17.46,20.53,22.12,25.06,22.44,19.08,19.88,21.39,22.33,25.79)



참고:
1. R 중급 활용에 필요한 tidyverse 라이브러리의 위엄 https://www.andrew.cmu.edu/user/achoulde/94842/lectures/lecture07/lecture07-94842.html
2. 자료가 정규 분포를 따르는지 확인할 때 qqplot! https://cran.r-project.org/web/packages/distributions3/vignettes/one-sample-z-test.html
3. prop.test로 계산되는 신뢰 구간이 이상하다 https://stats.stackexchange.com/questions/183225/confidence-interval-from-rs-prop-test-differs-from-hand-calculation-and-resul

4. 두 집단 평균이 같은지 다른지 알아보는 t-검정 https://rcompanion.org/rcompanion/d_02.html


추천 비추천

0

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 주위 눈치 안 보고(어쩌면 눈치 없이) MZ식 '직설 화법' 날릴 것 같은 스타는? 운영자 24/04/29 - -
공지 아이유 프로필 정보 [671/1] ㅠㅐㅌ갤로그로 이동합니다. 17.05.04 405443 4918
공지 제24회 아이유갤러리 자짤경연대회 결과발표 [47] 가시갤로그로 이동합니다. 22.06.30 16045 1414
공지 하이 사랑둥이들 [2365/1] 아이디잃어버렸다(1.232) 20.01.01 253141 10754
공지 아이유 인증글 모음♬ [391] 리얼좋아갤로그로 이동합니다. 14.04.01 568833 3440
공지 갤에 내 얘기가 없으니까 [1895/5] 엿막어는반사갤로그로 이동합니다. 15.01.11 6675888 8852
공지 아이유 갤러리 이용 안내 [386] 운영자 14.04.01 319491 2153
7534182 아 개빧치네 [1] 먼지o갤로그로 이동합니다. 19:49 7 0
7534181 하루n회아이유응원(732) 하루n회아이유응원갤로그로 이동합니다. 19:47 3 0
7534180 건아형 인종차별 미안해 분홍신갤로그로 이동합니다. 19:46 7 0
7534179 건아햄 미안해 ㅇㅇ(61.109) 19:46 4 0
7534178 아니 허재아들 mvp 에바지 분홍신갤로그로 이동합니다. 19:45 7 0
7534177 에베소서 성경말씀 아멘 아갤러(118.235) 19:45 2 0
7534176 아이유보고싶어ㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓㅓ [1] 1U갤로그로 이동합니다. 19:45 10 0
7534175 아 허웅은 에반데 ㅇㅇ(61.109) 19:45 7 0
7534174 구체적으로 설명을 해야 알아요? 우쭈쭈 불쌍해라. 병신(211.36) 19:45 5 0
7534173 생쥐뇬. 뒤지게 머리잡히고 쳐맞다 아고 나죽네. 병신(211.36) 19:44 12 0
7534172 라건아 안주면 인종차별로 신고함 분홍신갤로그로 이동합니다. 19:44 4 0
7534171 주님의 이름으로 하나님의 축복과 사랑이 애나들에게 아갤러(118.235) 19:44 6 0
7534170 파엠은 라건아 줘야지 ㅇㅇ(61.109) 19:43 6 0
7534169 전청조 도독년 옆에 누가 있니? 니 미래. [1] 병신(211.36) 19:42 11 0
7534168 빨리 mvp나 발표해 분홍신갤로그로 이동합니다. 19:42 8 0
7534167 아멘 아갤러(118.235) 19:42 6 0
7534166 빛이요 등이요 길이요 진리이신 성경말씀 아갤러(118.235) 19:41 6 0
7534165 나도 갤주님처럼 따듯한 사람이 되고프다 ㅇㅇ(121.126) 19:41 6 0
7534164 뒤지게 실컷 괴롭힘당하고 쳐맞다 죽는거 아라? 병신(211.36) 19:41 11 0
7534163 돈없으면 쭈구리뇬이.누굴 가스라이팅을 해? 병신(211.36) 19:40 12 0
7534162 ㅅㅅㅅㅅ [6] 버오갤로그로 이동합니다. 19:39 24 0
7534161 재산몽땅 기부하면 용서할게 뽕뇬아. 병신(211.36) 19:38 14 0
7534160 ㅈ소특 [1] 랑망이갤로그로 이동합니다. 19:38 16 0
7534159 도둑질이나 하지마. 도둑년들아. 저주할것. 병신(211.36) 19:37 13 0
7534158 부산 KCC 우승!! [2] 분홍신갤로그로 이동합니다. 19:37 10 0
7534157 <이지아 아이유.오늘도 24시간 스토킹 흙수저라 놀림> 소시오패스(211.36) 19:35 22 0
7534156 밥묵자 [3] 제스퍼갤로그로 이동합니다. 19:33 22 0
7534155 오늘 11시쯤에 가입햇는데 77777 가능하냐 아갤러(223.38) 19:31 19 0
7534154 1인칭 [5] 둠칫갤로그로 이동합니다. 19:29 38 0
7534153 지듣노 ㅁㅌㅊ [4] 코코봉봉갤로그로 이동합니다. 19:27 36 0
7534152 우성아!! 간식먹자!!!! ㅇㅇ(121.126) 19:26 11 0
7534151 내일 7기 가입 끝나는 기념 뭐라도 떴으면 좋겠다 [2] ㅇㄹㅋ.갤로그로 이동합니다. 19:25 45 0
7534150 잠수준비 어린이날.ver은 또 뭐여 ㅋㅋ [3] rlo갤로그로 이동합니다. 19:22 50 0
7534148 부산에서 우승팀 나오겠네 [2] 분홍신갤로그로 이동합니다. 19:20 38 0
7534147 퇴사하고 사업했다 망했다,,,,,,, 아갤러(222.114) 19:17 20 0
7534146 토일+일주일 잘하고 [병신]다육팠음갤로그로 이동합니다. 19:17 22 0
7534144 이거 핸냐 [2] 먼지o갤로그로 이동합니다. 19:15 61 0
7534143 쏘컴 끝까지 기부 안하네 ㅇㅇ(211.234) 19:14 21 0
7534142 4시간 48분남았네 [병신]다육팠음갤로그로 이동합니다. 19:13 16 0
7534141 오느릐 저녁 [15] 피치_갤로그로 이동합니다. 19:13 56 0
7534140 한화의 봄 [2] 윤태진갤로그로 이동합니다. 19:12 21 0
7534139 6기 가입 까먹은 한 풀었다 [9] 믕봉믕갤로그로 이동합니다. 19:11 80 0
7534138 대충 8만명언저리정도 되겠지 10만은 오바고 ㅇㅇ(223.62) 19:11 47 0
7534137 갬빛머냐.. [1] 1U갤로그로 이동합니다. 19:11 26 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2