나혼빅(나혼자빅데이터)

[통계] 심슨의 역설('Simpon's Paradox')

기기괴괴발자 2021. 3. 9. 09:23

 < 데이터마이닝 시 분석할 때 고려해야 하는 통계 관련 정보 > 

 

- 데이터가 조건부 변수를 감추고 있을 때, 즉 잠복 변수가 있을때 결과에 중대한 영향을 미칠 수 있는 추가적 요인이 있을 수 있다. 

- 이러한 역설을 피하기에는 딱히 정해진 답이 없기도하고, 자료들은 수많은 기준에 따라 분류되기도 해서 오히려 데이터 전체가 정확한 그림을 보여줄 수도 있기도 할 때가 있다.

- 이를 항상 체감하면서 마이닝할 때 조심해야겠다. 

 

심슨의 역설 감 잡을 때 활용했던 자료들

 

    1) statkclee.github.io/statistics/stat-simpson.html

 

데이터 과학 – 기초 통계

 

statkclee.github.io

  2) speakerdeck.com/ysunmi0427/simseunyi-yeogseol

 

심슨의 역설

그 심슨 아닙니다. Edward Simpson 입니다.

speakerdeck.com