2014년 11월 16일 일요일

[통계]정규분포(Normal Distribution)

- 우리말로 정규분포라고 하며, 확률분포 중에서 가장 일반적이고 많이 쓰이는 확률분포 모델이다. 때론, Gaussian distribution 또는 생김새로 인해 Bell Curve라고도 불린다.

여기서 sigma는 표준편차(std.)이며, mu는 평균(mean)이다.

- 정규분포에서 사용되는 매개변수는 평균가 표준편차이며, 평균은 분포의 위치(정확히 말하면 분포의 중앙이 놓이는 위치가 결정된다. 표준편차는 분포의 모양(퍼지거나 좁혀지거나)을 결정한다.


Fig. 1. 평균의 변화에 따른 분포의 위치변화
(mean: -10 to 10)

















위 그림은, 평균이 어떻게 위치에 영향을 주는지를 보여주는 그림인데... 평균이 -10에서 10으로 바뀌면서 정균분포는 좌측에서 우측으로 바뀌는것을 알 수 있다.




정규분포와 더불어 같이 알아야할 사항으로 중심극한정리(central limit theorem)가 있다.

중심극한정리(Central Limit Theorem)
 - 모집단으로부터, 추출한 표본의 특성(평균,표준편차 등)은 추출한 표본의 갯수가 증가할 수록 그 특성은 정규분포를 따른다.
 - 즉 표본의 크기가 클수록 그 표본의 특성은 정규분포로 수렴되는 것을 의미함.






    다음번에는 그 외의 연속형 확률분포에 대해 소개. 그림 보여주기.
 
    1) 평균, 표준편차, 왜곡도, 첨도 1,2,3,4 모멘트에 대한 설명을 추가해서. 말해주기



2014년 11월 8일 토요일