시간 따라 변하는 효과를 통계로 확인하다 – 반복측정분산분석

하나의 실험 결과를 한 번만 측정하는 것으로는 부족할 때가 많다. 사람의 변화는 시간 속에서 일어나며, 개입의 효과 역시 시간에 따라 다르게 나타날 수 있기 때문이다. 이처럼 동일한 집단을 여러 시점에 걸쳐 반복적으로 측정한 데이터를 분석할 때 사용하는 기법이 바로 반복측정분산분석(Repeated Measures ANOVA)이다.

반복측정이란 무엇인가?

반복측정은 말 그대로 같은 대상에게 여러 번 데이터를 수집하는 것을 뜻한다. 예를 들어 다음과 같은 경우가 해당된다

  • 다이어트 프로그램 전/중/후 체중 변화 측정
  • 학생의 집중력 훈련 전과 후, 그리고 2주 후 재측정
  • 신약 복용 전, 1주 후, 1달 후 혈압 변화 확인

이처럼 하나의 집단에서 시간의 흐름에 따라 변화하는 양상을 비교할 때 그 결과를 통계적으로 분석하는 데 사용하는 방법이 바로 반복측정분산분석이다.

예시: 다이어트 프로그램의 효과 분석

가상의 예를 들어보자. 10명의 참가자가 6주짜리 다이어트 프로그램에 참여하였고, 각자의 체중을 다음 세 시점에서 측정했다.

  • T1: 시작 전
  • T2: 3주차
  • T3: 6주차 종료
참가자T1 (kg)T2 (kg)T3 (kg)
A807875
B858380

이 데이터를 단순히 평균만 비교하는 것은 의미가 부족하다. 왜냐하면 각 개인이 다르게 출발하고, 다르게 반응하기 때문이다. 그래서 필요한 것이 반복측정 ANOVA이다.

반복측정분산분석이 하는 일

반복측정분산분석은 다음과 같은 질문에 답해준다.

  • 전체적으로 참가자들의 체중은 시간이 지남에 따라 유의하게 감소했는가?
  • 그 변화가 우연일 가능성보다 통계적으로 의미가 있는 수준인가?
  • 시점 간의 차이가 유의미하다면 어느 시점에서 가장 큰 변화가 있었는가?

무엇보다 중요한 장점은 각 참가자의 출발점이 다르더라도 그들의 변화 자체에 주목함으로써 개인차를 통제하고 효과를 평가할 수 있다는 점이다.

반복측정분산분석과 일반 분산분석의 차이

항목일반 일원분산분석(ANOVA)반복측정분산분석(RM-ANOVA)
측정 대상서로 다른 집단동일한 대상에서 반복 측정
독립성각 그룹이 독립측정값 간 상관관계 존재
개인차 고려불가능가능 (개인 고정 효과 통제)
분석 목적집단 간 평균 비교시간/조건에 따른 변화 추적

반복측정에서 꼭 고려해야 할 사항들

반복측정분산분석은 강력한 분석 도구이지만 그 효과를 제대로 얻기 위해서는 실험 설계부터 해석까지 몇 가지 중요한 고려사항을 놓쳐서는 안된다.

1. 측정 시점의 간격

  • 시점 간의 시간 간격이 불균형하면 시간 효과(Time effect)를 정확히 반영하기 어렵다.
  • 예: 1주 후, 2주 후, 3개월 후와 같이 간격이 들쭉날쭉할 경우
    → 반복측정 ANOVA보다 혼합모형(LMM)이나 성장곡선모형이 더 적절할 수 있다.

2. 탈락 및 결측 데이터 관리

  • 시간이 흐르면서 참여자 이탈이나 누락된 데이터가 발생하기 쉽다.
  • 단순 평균대체(mean imputation)보다는 다중대체(Multiple Imputation)나 혼합모형 기반 보정이 더 타당하다.
  • 데이터가 완전무작위(MCAR)가 아닐 경우 분석 결과가 왜곡될 수 있으므로 결측 메커니즘 자체에 대한 검토가 선행되어야 한다.

3. 구형성(sphericity) 가정의 검토

  • 반복측정에서는 측정값들 간의 공분산 구조가 동일하다는 가정이 필요하다.
  • 이를 검정하기 위해 Mauchly의 sphericity 검정을 사용하며, 이 가정이 충족되지 않으면 결과의 신뢰도가 낮아지므로 반드시 확인해야 한다.
  • 구형성 위반 시에는 Greenhouse-Geisser 또는 Huynh-Feldt 보정을 적용하여 p값과 자유도를 보정해야 한다.

4. 교차효과(interaction effect) 해석

  • 단순히 시간에 따른 평균 차이만 보는 것이 아니라 조건 × 시간의 상호작용 효과도 함께 분석해야 실제 의미 있는 결과를 도출할 수 있다.
  • 예: 두 개의 다이어트 프로그램이 시간이 지남에 따라 체중 변화에 어떤 차이를 보이는지

5. 실험 설계의 구조적 일관성

  • 반복측정 설계는 무조건 반복한다고 좋은 것이 아니다.
  • 너무 많은 측정 시점은 참가자 피로도와 이탈률을 높이고, 너무 적은 시점은 시계열적 흐름을 놓칠 수 있다.
  • 보통 3~5시점이 안정적인 분석을 위한 최소 기준으로 제시된다.

마무리하며

반복측정분산분석은 개인차를 배제한 채 시간에 따른 변화 자체를 분석할 수 있는 유용한 도구이다. 반복측정분산분석은 그 자체로 훌륭한 도구이지만 그 성능은 얼마나 정교하게 설계되고, 주의 깊게 해석되었는가에 따라 크게 달라진다.

변화의 방향을 아는 것만큼 그 변화가 의미 있는 것인지 아닌지를 아는 일은 중요하다. 시간이 개입되는 모든 실험과 프로그램 평가에 있어 우리가 놓쳐서는 안 될 것은 ‘데이터의 흐름’만이 아니라 그 흐름을 관찰하는 통계적 감수성과 해석의 책임이다.

scroll to the top of the site