본문 바로가기
이것저것

통계의 방법

by SG.jun 2019. 11. 14.
반응형

교육통계의 목적

교육현상을 정확하고 간결하게 파악하여 교육의 합리화 이루는 것

 

 

측정치

명명척도 : 두 개체가 서로 다르거나 같다는 정보만 가짐/최빈치/전화번호,성별

서열척도 : 크기나 중요성에 따라 순위 부여/중앙치,사분편차,백분위점수/석차,키

동간척도 : 일정한 측정단위 갖고 있는 척도/절대영점 없음/가감O 승제X/평균치,표준편차/온도계눈금,고사의 원점수,IQ점수

비율척도 : 절대영점에서 출발/가장 완전한 척도/가감승제 가능/표준점수/길이,무게,시간

 

 

도수와 도수분포

점수범위 : 최고점-최저점+1

급간수는 10 내지 20, 급간 크기는 홀수로 결정

반드시 정수로 표시

 

 

문항분석

문항의 양호도를 결정→문항의 개선이 목적

선택형(객관형) 문항에 한함

상대평가에서는 변산도가 크면 클수록 좋음(표준편차가 클수록 의미있음)

절대평가에서는 관심 없음

 

1)문항반응분포 : 오답지 매력도에 관한 정보 제공

 

2)문항유형분석

-목표지향평가 분석방법

-가네의 학습위계나 블룸의 목표분류를 준거로 분석

 

3)문항곤란도 : 한 문항의 어려운 정도

=문항난이도=문항통과율=문항정답률

-상대평가 : 평균 50% 정도일 때 변별력 최대

-절대평가 : 문항곤란도 100%→학습 성공

-계산공식(써넣기)

 

 

 

 

4)문항변별도 : 문항 하나하나가 얼마나 피험자의 능력을 잘 변별해내는가

-곤란도 50%일 때 변별도 가장 큼

-총괄평가,형성평가에 모두 유용함

-문항내적 합치도 : 내적인 준거(검사의 총점 등)에 의해 문항을 변별하는 것

                          문항 하나하나를 독립된 개별검사로 간주

-문항외적 합치도 : 총점 이외에 교사나 전문가·관습의 판단,실용도 등 기타 변인들에 의한 판단

-계산공식(써넣기)

 

 

 

 

5)문항특성곡선

-기울이가 가파를수록 상하집단을 더 잘 변별하는 문항임

-기울기가 부적인 문항은 내재적인 결함을 가졌거나 채점과정에서 심각한 문제 있는 경우

-양호한 문항은 곡선이 경사가 높은 정적 기울기를 갖고 곤란도 수준은 중간 정도

 

 

백분위(백분율)

가감승제 불가능

각 집단내에서의 상대적인 위치는 알 수 있음(서열척도)

 

 

빈도분포자료

상대적 빈도분포 : 주어진 급간내의 빈도를 비율 또는 백분율로 나타낸 것

누가빈도분포 : 최저급간에서부터 각 급간의 빈도를 누가적으로 더해간 것

백분위와 백분점수

기둥빈도분포도

상자-수렴도표 : 중앙값 손쉽게 알 수 있는 분포도

시계열 분포도 : 동태적 자료파악 가능

 

 

 

 

집중경향

1)산술평균(평균치,M)

-모든 측정치의 합을 사례수로 나눈 것

-여러 통계처리의 기초

-가장 신뢰할 만한 집중경향치

-동간적·비율적 측정치의 자료일 때

-분포가 좌우대칭일 때

-동간성이 의심될 경우에는 계산이 무의미

 

 

2)중앙치(Mdn)

-한 분포의 수치들을 대소로 배열했을 때의 중간의 수치

-서열적·비율적·동간적 측정치의 자료일 때

-평균치 계산할 충분한 시간이 없을 때

-분포가 중심점에서 얼마나 떨어져 있는가는 관심이 없으나, 분포의 상반부와 하반부에 관심이 있을 때

-분포가 불완전한 상태로 주어졌을 때

-측정단위의 동간성이 의심될 때

-분포의 순서상의 위치를 알고 싶을

-자료가 짝수일 때는 2개의 수의 중간이 중앙치

 

 

3)최빈치(Mo)

-명명적·서열적·동간적·비율적 측정치의 자료일 때

-다른 방법으로 계산할 여유가 없을 때

-집중경향을 빨리 알고 싶거나 대략 짐작하고 싶을 때

-가장 손쉽고 빠르지만 신뢰성이 낮다

 

 

집중경향치의 비교

정상분포를 이루고 표집이 비교적 클 때에는 대표치로 최빈치를 사용해도 무방

얻어진 자료가 동간성이 전제될 경우에는 어느 대표치를 사용해도 무방

 

 

 

 

변산도

점수의 분포정도를 나타내는 지수

 

1)사분편차(Q)

-분포가 극단에서 절단되었거나 불완전할 때

-극단적인 수치가 있거나 분포가 심하게 편포되었을 때

-중앙부 50%의 사례가 차지하는 실제의 점수범위를 알고 싶을 때

-집중경향치로서 중앙치만이 보고되어 있을 때

 

 

2)평균편차(AD)

-한 집단의 산술평균으로부터 모든 점수까지의 거리의 평균

-사분편차보다는 신뢰할 수 있지만 표준편차와 같은 이론적·수리적 해석은 어려움

 

 

3)표준편차(SD)

-정상분포와 관련되어 여러 통계적 해석에 활용

-분포가 양극으로 편포되었을 때는 사용하지 않는 것이 좋음

-평균으로부터의 편차점수를 자승하여 합하고 이를 사례수로 나누어 그 제곱근을 얻어낸 것

-가장 신뢰로운 변산도

-분포상의 모든 점수의 영향을 받음

-표집오차가 최소

-한 집단의 모든 점수에 일정한 점수를 더하거나 빼도 표준편차는 변하지 않음

-한 집단의 모든 점수에 일정한 상수를 곱하면 표준편차도 그만큼 증가

-절대영점과 동간성이 있어서 가감승제 가능

-집단의 동질성을 알아보는데 필요한 통계치

 

 

 

 

검사점수의 표시방법

 

1)원점수

-시험 후 채점되어 나오는 점수

-기준점이 없어 교과간 점수 비교나 집단간 교육성취도 비교가 불가능

 

 

2)백점만점척

-원점수는 점수범위가 여러 가지인데 비해, 백점만점척은 0에서 100까지 점수범위가 하나

-의미있는 준거점이 없고 객관성과 일관성이 없음

 

 

3)등위점수

-상대적 위치만을 표시하여 줄 뿐 상대적 능력을 표시하지 못함

-집단의 성질이나 사례수가 달라지면 등위점수는 변하므로 직접비교 곤란

 

 

4)백분위점수

-대소서열,집단내의 상대적 위치,다른 집단과의 상호비교 가능

-점수와 점수간의 능력의 동간성은 없음

 

 

5)표준점수

-모든 척도의 문제점을 극복해주는 가장 바람직한 점수

-인위적으로 상대적 영점을 조작한 후 여기서 각 개인의 편차를 얻어 이것을 그 분포의 표준편차로 나누어

  각 개인의 점수의 위치가 어느 정도에 있는가의 비를 말함

-Z점수,T점수,H점수 등

-대소비교 및 가감승제 가능

-집단간 점수의 상호비교 가능

-단점 : 절대영점이 없기 때문에 점수의 간격이 능력의 간격과 일치하지 않음

 

 

6)문자점수

-수우미양가,ABCDEF 등

 

 

7)종합점수

-여러가지 검사의 결과를 종합해서 얻게 되는 단일점수

-종합점수=총무게점수/총무게

 

 

 

 

표준점수

 

Z점수=(원점수-평균)/표준편차

T점수=10Z+50(소수점과 음수부호가 나오는 Z점수의 불편함 덜기 위한 것.점수범위 20~80)

H점수=14Z+50

C점수=2Z+5(=스테나인 점수. 9단계 척도로서 최고점 9,최하점 1,중간점 5/표준점수를 가장 이해·활용하기 용이한 점수)

편차IQ(DIQ)=15Z+100

 

 

 

 

정상분포(가우스곡선)

-모든 정상곡선은 대칭적

-중요한 상황은 곡선의 양끝

-개인차 변별에 적합(상대평가 입장)

-수리적·통계적으로 편리

 

 

 

편포도

-분포가 기울어진 정도

-정상분포 : 점수수준과 상관없이 개인차 변별이 잘됨

-정적편포 : 소수의 최우수자만 선발하고자 할 때 적합

-부적편포 : 낮은 수준의 아동 변별에 용이, 완전학습에서의 분포곡선

 

 

 

 

상관도와 상관계수

 

1)상관도

-한 변인이 변동함에 따라 다른 변인이 어떻게 변동하느냐의 관계를 표시하는 통계치

-예언과 밀접한 관계

-변인간 상관정도 높을수록 보다 정확한 예언 가능

 

 

2)상관계수

-두 변인 사이의 상관관계를 하나의 값으로 요약하기 위하여 쓰이는 차수

-마이너스1과 플러스1 사이의 값을 가짐

-상관계수(r)=0이면 두변인이 완전히 서로 독립

-양의 값이든 음의 값이든 1에 가까울수록 상관도 높은 것

-플러스와 마이너스 부호는 두 가지 현상 사이의 관계 방향을, 상관계수의 크기는 관계의 정도를 나타내는 것

-결정계수 : 상관계수의 제곱에 100을 곱한 것

-0.90~1.00 : 극히 높은 상관

  0.70~0.90 : 높은 상관

  0.40~0.70 : 중위상관

  0.20~0,40 : 낮은 상관

  0.00~0.20 : 극히 낮은 상관

-스피어만의 순위차 상관계수 : 사례수가 30 이하이거나 서열척도로 표시되어 있는 경우의 상관도 계산법

-피어슨의 적률상관계수 : 가장 엄밀하고 정확한 상관도 계산법, X와 Y의 상관이 직선적이어야 함

 

 

 

 

T-test

집단간의 평균차이를 검증하는 방법

변인의 수가 1개, 비교집단이 2개, 사례수는 상관 없음

실험설계에서 많이 사용

이질적 두집단의 평균점수 비교에 사용

동일표본의 두 변인의 평균값 비교 가능

 

 

 

 

변량분석

변인과 비교집단이 둘 이상일 때 평균치의 차이도를 검증하는 방법

동질적 집단

 

 

 

 

공변량분석

이질적 집단

종속변인에 영향을 주는 잡음요인을 실험 후 통계적으로 제거시키는 것

 

 

 

 

회귀분석

하나 또는 두 개 이상의 독립변인과 종속변인의 상관 분석

예 : 광고시간과 판매원의 수에 따라 매출액이 어떻게 변화하고 있는가

회귀선 : 두 변인의 분산도에서 모든 점을 가장 잘 대표해주는 직선

            Y=aX+b에서 a는 회기계수, X와 Y는 두 변인의 상관계수

 

 

 

상관계수에 영향을 주는 요인과 이용

변산도 : 상관계수의 크기에 영향

중간집단이 제외되면 상관계수는 사실 이상으로 커짐

평균치가 다른 두 개의 집단을 통합하는 경우 상관계수는 여러 가지로 변함

극단적인 점수는 상관계수에 영향

공통요인을 발견하려는 연구에서 많이 이용

독립변인에 의한 종속변인에의 영향을 예언하려는 연구에서 많이 사용

교육평가 또는 심리검사의 신뢰도와 타당도 검증할 때 많이 사용

'이것저것' 카테고리의 다른 글

옛날 사탕 오리온 "쵸코맛"을 찾아서  (0) 2022.11.30
도시지역이 아닌 지역  (0) 2022.11.30
냉동건조(freeze drying)  (0) 2019.11.14
결혼기념일 명칭  (0) 2019.11.14
우리나라 행정 구역 기준  (0) 2019.11.14

댓글