디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

봉갤 통계 (03)

요한행자갤로그로 이동합니다. 2023.05.31 15:34:38
조회 102 추천 0 댓글 2
														

1. 자료의 분포를 히스토그램과 상자 수염 그림(박스 플롯)으로 알아봅니다.
flower <- c(95,67,28,32,65,65,69,33,98,96,76,42,32,38,42,40,40,69,95,92,75,83,76,83,85,62,37,65,63,42,89,65,73,81,49,52,64,76,83,92,93,68,52,79,81,83,59,82,75,82,86,90,44,62,31,36,38,42,39,83,87,56,58,23,35,76,83,85,30,68,69,83,86,43,45,39,83,75,66,83,92,75,89,66,91,27,88,89,93,42,53,69,90,55,66,49,52,83,34,36)
> par(mfrow=c(2,1))
> hist(flower)
> boxplot(flower, horizontal=TRUE)

a15714ab041eb360be3335625683746f0753452cd6a5eb89d53460f4991dcd6eaabb0ad97faf07be9289d9050b


상자 수염 그림에서 수염은 min, MAX, 상자는 Q1, Q3 그리고 가운데 선은 Q2(median)이며,
수염 밖의 점들은 outlier.


2. 경험적인 규칙(3시그마 규칙 혹은 empirical rule)을 알아봅시다.
> deviation<-c(1,2,3)
> pnorm(deviation)-pnorm(deviation)
68% 95% 99.7% 얻으십니다.


3. 신뢰구간 구할 때 필요한 z/t-score 찾기
conf <- c(0.90, 0.95)
df = 19
z_score <- qnorm(1-(1-conf)/2)

#[1] 1.644854 1.959964
t_score <- qt(1-(1-conf)/2,df)
#[1] 1.729133 2.093024

4. 눈치채셨다시피 확률 분포에 d/p/q/r 두문자를
더하면 각각 distribution, probability density, quantile, random (난수)를
생성/계산하실 수 있습니다.


5. 통계로 진행하는 신뢰구간 계산

5.1 비율

기본 함수를 이용하면 전문적인 방법으로 계산되므로 그냥 함수만드셔서 계산합니다.

x<-8

n<-43#43번 중 8번 스페이드 뽑는 경우

z_interval<-function(x,n,conf){

p_hat <-x/n;

SE_est <- sqrt(p_hat*(1-p_hat)/n);

z_score <- qnorm(1-(1-conf)/2);

margin_of_error <- z_score*SE_est;

conf_interval <- p_hat + margin_of_error*c(-1,1);

return(conf_interval);

}

#(.07,.30) 스페이드 카드 분포율의 95% 신뢰구간

5.2 평균

자료가 있으시다면 6.2로, 없으면 다음 함수를 이용해 보세요.

t_interval<-function(x_bar,Sx,n,conf){

df=n-1;

t_score <- qt(1-(1-conf)/2,df);

margin_of_error <- t_score*Sx/sqrt(n);

conf_interval <- x_bar+margin_of_error*c(-1,1);

return(conf_interval);

}



6. 자료로 구하는 신뢰구간

6.1 비율

자료 정리해서 7.1에서와 같이 통계로 신뢰구간을 구합니다.

#card_n = runif(43);#균등 분포를 따르는 43개의 난수 ... 자료 준비는 댓글을 보세요.

x<-length(which(card=="spade"))#에잇 나옵니다.

n<-length(card)#43


6.2 평균

#t.test(energy_bar_protein, mu=20, alternative=c("two.sided"), conf.level=.95)

t.test(energy_bar_protein, conf.level=.95)

#(20.46771, 22.33229)를 구하였네요.


7. 요약 통계로 진행하는 가설 검정

7.1 비율 (one sample)

#Ho: p = .25

#Ha: p !=.25

alpha = 0.05 #일 때, (x,n) 이 (8,43)인 경우

prop.test(8,43,p=.25,alternative=c("two.sided"),conf.level=1-alpha,correct=FALSE)

#p-value .3328

#신뢰구간이 비범하게 계산되므로 사용시 유의하시기 바랍니다. (참고 3)


7.2 비율 비교(2-proportion sample z-test)

#Ho: p1 = p2

#Ha: p1!= p2

alpha = 0.05 #일 때, (x1,n1)=(306,382), (x2,n2)=(321,382)인 경우

prop.test(x<-c(306,321),n<-c(382,382),alternative=c("two.sided"),conf.level=1-alpha,correct=FALSE)

#p-value는 .1572


7.3 평균

BSDA 라이브러리에 tsum.test 라고 있는데 (왠지 설치가 안 되어서) 그냥 함수를 만들어 씁니다.

ttest1<-function(x_bar,Sx,n,alternative,mu,conf.level){

df=n-1;

t_score<-(x_bar-mu)/(Sx/sqrt(n));

if (alternative=='less'){

p_value <- pt(t_score,df);

} else if (alternative == 'greater'){

p_value <- 1-pt(t_score,df);

}

else {

p_value <- pt(-abs(t_score),df)+(1-pt(abs(t_score),df));

}

#신뢰구간도 함께 계산

#t_interval 함수는 5.2를 보세요.

conf.interval = t_interval(x_bar,Sx,n,conf.level)

#결과값 출력

print(sprintf('t: %f', t_score));#이렇게 해야 출력이 됨

print(sprintf('df: %d', df));

print(sprintf('p-value: %f',p_value));

print(sprintf('%5.1f%% confidence interval: %s',conf.level*100, paste(conf.interval,collapse=' ')))#paste는 숫자를 문자열로 변환시켜 줍니다

}

(예)

> ttest1(9.91,.55,125,alternative<-c('less'),mu<-10,conf.level=.95)

#[1] "t: -1.829510"

#[1] "df: 124"

#[1] "p-value: 0.034863"


7.4 평균 비교

ttest2<-function(mean.x,S.x,n.x,mean.y,S.y,n.y,alternative,conf.level){

SEest = sqrt(S.x^2/n.x+S.y^2/n.y);

df = n.x+n.y-2;#고수의 근사치

#df = (S.x^2/n.x+S.y^2/n.y)^2/(S.x^4/(n.x^2)/(n.x-1)+S.y^4/(n.y^2)/(n.y-1));#이것은 웰치스 t-검정 때 사용되는 df

t_score = (mean.x-mean.y)/SEest;

if (alternative=='less'){

p_value <- pt(t_score,df);

} else if (alternative == 'greater'){

p_value <- 1-pt(t_score,df);

}

else {

p_value <- pt(-abs(t_score),df)+(1-pt(abs(t_score),df));

}

print(sprintf('t: %f', t_score));#이렇게 해야 출력이 됨

print(sprintf('df: %d', df));

print(sprintf('p-value: %f',p_value));

}



8. 자료로 진행하는 가설 검정

8.1 평균

자료준비는 자료 9.1를 보셔요.

t.test(energy_bar_protein, mu=20, alternative=c("two.sided"), conf.level=.95)


8.2 평균 비교

자료준비는 참고 4를 보셔요. 자료 사이에 쉼표 안 넣으셔도 됩니다.

t.test(Value~Group,data=Data, var.equal=FALSE, conf.level=.95)



9. 자료

9.1 비율의 신뢰구간 구할 때 사용해보는 카드 자료 (균등 분포를 따르는 난수를 사용하였습니다.)

card_n <- c(0.036590445,0.454104494,0.415237338,0.546043575,0.391643707,0.142640430,0.563935322,0.634059084,0.491580955,0.680692898,0.249468027,0.365051202,0.611381465,0.737182819,0.355852245,0.856451032,0.603791257,0.240798722,0.790983794,0.743826264,0.766156720,0.697951405,0.538654729,0.001202413,0.170650637,0.722026658,0.337674215,0.932576812,0.142190033,0.546902644,0.675102984,0.586704257,0.244876134,0.804343352,0.551903761,0.423398372,0.688877665,0.003871202,0.980567358,0.879892344,0.910341816,0.521254774,0.037317731)

card<-replicate(43,0)#0을 43번 반복해서 담고 있는 double 벡터 타입

card[which(card_n<.25)]="diamond";#.25보다 작은 수는 다이아몬드

card[intersect(which(card_n>=.25),which(card_n<.50))] = "club"

card[intersect(which(card_n>=.50),which(card_n<.750))] = "heart"

card[which(card_n>=.75)] = "spade"

9.2 한 집단의 평균 t-검정 자료

출처: https://www.jmp.com/en_us/statistics-knowledge-portal/t-test/one-sample-t-test.html

energy_bar_protein <- c(20.70,27.46,22.15,19.85,21.29,24.75,20.75,22.91,25.34,20.33,21.54,21.08,22.14,19.56,21.10,18.04,24.12,19.95,19.72,18.28,16.26,17.46,20.53,22.12,25.06,22.44,19.08,19.88,21.39,22.33,25.79)



참고:
1. R 중급 활용에 필요한 tidyverse 라이브러리의 위엄 https://www.andrew.cmu.edu/user/achoulde/94842/lectures/lecture07/lecture07-94842.html
2. 자료가 정규 분포를 따르는지 확인할 때 qqplot! https://cran.r-project.org/web/packages/distributions3/vignettes/one-sample-z-test.html
3. prop.test로 계산되는 신뢰 구간이 이상하다 https://stats.stackexchange.com/questions/183225/confidence-interval-from-rs-prop-test-differs-from-hand-calculation-and-resul

4. 두 집단 평균이 같은지 다른지 알아보는 t-검정 https://rcompanion.org/rcompanion/d_02.html


추천 비추천

0

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 열애설 터지면 큰 타격 입을 것 같은 아이돌은? 운영자 24/03/25 - -
7438959 커피 한 잔 [1] [병신]다육팠음갤로그로 이동합니다. 12:38 21 0
7438958 띠용냥이 [1] 라윤갤로그로 이동합니다. 12:37 25 0
7438957 관될 라클이든 7기공지든 오늘 내놔라 [4] 분홍신갤로그로 이동합니다. 12:36 43 0
7438956 이정도면 먼지비 아님? [3] 랑망이갤로그로 이동합니다. 12:35 46 0
7438955 주둥이 도태한남이론 공감한다 [6] 해바라기유갤로그로 이동합니다. 12:33 65 0
7438954 인생이 삭막해진 이유 깨달음 [3] 아스트로갤로그로 이동합니다. 12:32 42 0
7438953 어째 일본에서보다 일본 갔다와서 일식을 더 쳐먹는거같음 [4] 펩시제로갤로그로 이동합니다. 12:29 52 0
7438952 맛점해라 [2] 셀카봉갤로그로 이동합니다. 12:28 21 0
7438951 오늘 마스크 필수네 [1] [병신]다육팠음갤로그로 이동합니다. 12:27 24 0
7438950 점심 라멘 ㄱ다 [1] 펩시제로갤로그로 이동합니다. 12:26 32 0
7438948 우리은행 인스타그램 [12] 럽어택갤로그로 이동합니다. 12:23 567 44
7438947 대기질 꼬라지 [2] 갤로그로 이동합니다. 12:23 35 0
7438946 코노 같이 가실분? [5] 봉ㅎㅎ갤로그로 이동합니다. 12:18 62 0
7438945 나도 점심 100만년 만에 라면 먹어볼까 [2] Je_T'aime갤로그로 이동합니다. 12:18 29 0
7438944 나랑 도쿄돔 가실 분? [5] Je_T'aime갤로그로 이동합니다. 12:16 68 0
7438943 590 [1] [병신]다육팠음갤로그로 이동합니다. 12:14 14 0
7438942 벚꽃 마저 다 피겠다 [병신]다육팠음갤로그로 이동합니다. 12:14 22 0
7438941 날씨는 황사빼면 [2] [병신]다육팠음갤로그로 이동합니다. 12:13 27 0
7438940 점심시간 [1] [병신]다육팠음갤로그로 이동합니다. 12:12 13 0
7438939 점심인증 [5] 해바라기유갤로그로 이동합니다. 12:09 54 0
7438938 슬슬 알뜰폰 갈아타야하는데 [2] 탈론.갤로그로 이동합니다. 12:08 32 0
7438937 후즈팬 온다 엔조페갤로그로 이동합니다. 12:07 22 0
7438936 맛점하세요 [1] 신신갤로그로 이동합니다. 12:06 24 0
7438935 등교거부 끝난 ㅇㄹㅋ [3] 부엌밥갤로그로 이동합니다. 12:06 61 0
7438934 또 안 떠? [1] 분홍신갤로그로 이동합니다. 12:00 32 0
7438933 7기까지 아갤러(58.123) 11:59 16 0
7438932 볼캡 키링 기부좀요.. [1] 소풍유갤로그로 이동합니다. 11:59 29 0
7438931 내놔 제발 이담 1U갤로그로 이동합니다. 11:58 23 0
7438930 나 생선까스 안좋아했는데 [2] 랑망이갤로그로 이동합니다. 11:58 27 0
7438929 으랴캬 본가 [1] 피치_갤로그로 이동합니다. 11:58 34 0
7438928 3분전 분홍신갤로그로 이동합니다. 11:57 13 0
7438927 2만원대 5지 무제한요금제 등장 ㄷㄷㄷ [4] 쏘컴갤로그로 이동합니다. 11:57 70 0
7438926 생선돈까스 급식으로 나오면 식판던짐 [1] 해바라기유갤로그로 이동합니다. 11:57 24 0
7438925 미세먼지 무슨 일이야 베르가못갤로그로 이동합니다. 11:56 12 0
7438924 돈까스=남자임 [4] 랑망이갤로그로 이동합니다. 11:56 31 0
7438923 맛점해 [1] 부엌밥갤로그로 이동합니다. 11:56 19 0
7438922 요즘 커뮤니티에서 남녀갈등 조장하는 세력 ㅇㅇ(124.51) 11:53 33 0
7438921 지듣노 [1] 해바라기유갤로그로 이동합니다. 11:53 22 0
7438920 ㅇㄹㅋ님 본가 어디임? [3] 해바라기유갤로그로 이동합니다. 11:51 77 0
7438919 맛점용 [8] ㅇㄹㅋ.갤로그로 이동합니다. 11:48 65 0
7438918 마스크<-상게이 [2] 해바라기유갤로그로 이동합니다. 11:47 24 0
7438917 쏘컴 돈까스처돌이임? [2] 해바라기유갤로그로 이동합니다. 11:47 26 0
7438916 비오니까 윤세먼지좀 씻겨내려가려나? [2] 랑망이갤로그로 이동합니다. 11:46 29 0
7438915 3년전만해도 3080이면 지존이었는데 [3] 올해롯데우승갤로그로 이동합니다. 11:46 31 0
7438914 마스크 챙기십쇼 횐님들 [4] ㅇㄹㅋ.갤로그로 이동합니다. 11:45 56 0
7438913 비대면 굿 엔조페갤로그로 이동합니다. 11:45 19 0
7438912 우리 지은이 이번주 푹 쉬고 많이 먹고 운동 열심히하자~~~~ [1] ㅇㅇ(118.235) 11:43 55 0
7438911 지금 7800x3d는 별론가 셀카봉갤로그로 이동합니다. 11:42 22 0
7438910 정답) 오늘의 점심은 [7] 쏘컴갤로그로 이동합니다. 11:41 66 0
7438909 비 오는데 왜 이리 뿌옇냐 [1] 애순갤로그로 이동합니다. 11:41 26 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2