반응형
클릭(회원 가입해야 다운 받을 수 있다. 통계교육원이라는 데서 만든 사이버 강의 자료인 듯함)
표본 데이터는 늘 표집오차가 있게 마련인데, 그럼에도 불구하고 우리는 우리가 가지고 있는 표본을 통해서 모집단 특성을 추론해 낸다.
이것을 가능하게 하는 핵심이 중심극한 정리 및 표준오차 개념인데 이해가 잘 안 된다.
표준오차 공식을 보면 모집단의 표준편차가 필요함을 알 수 있는데, 사실 모집단 표준편차를 안다는 건 쉬운 일이 아니다.
대부분의 연구에서 불가능하다.
예를 들어 서울시에 있는 모든 Major Depressive Disorder 환자의 BDI 평균과 표준편차를 구할 수 있겠는가?
결정적으로, 이 점수들을 알면 우리가 가진 표본으로 추론할 필요 자체가 없어지게 된다.
추론하고자 하는 값을 이미 다 아는데 뭐하러 굳이 통계 써가며 짱구를 굴리겠는가.
내가 본 어떤 자료에서는 모집단의 표준편차 대신 표본의 표준편차를 사용해서 표준오차를 추정할 수 있다고 하는데 이 또한 이해가 안 된다.
위에 링크한 자료는 내가 어디서부터 잘못 생각하고 있는 건지 모르겠어서 무지 답답하던 찰나에 발견한 자료인데, 10장 표본평균의 분포도 알아야 하는가 에 답이 있는 것 같다.
하지만 한글로 씌어 있어도 이해가 안 된다.
어제, 오늘 몇 시간째 머리 싸매고 이해해 보려 노력하고 있다. 답답해 죽을 것 같음.
추론 통계의 기본의 기본을 몰라도 졸업도 하고 논문도 쓰지만, 자신에게 부끄럽다.
꼭 알아내고 말 거야.
반응형
댓글