검색결과 리스트
[楞嚴] 생각 나누기/[平] 사회조사와 데이터분석에 해당되는 글 31건
- 2024.07.28 구글 스프레드 시트로 데이터 분석하기 1
- 2024.06.02 다중응답에 대한 카이제곱(χ²) 검정 방법 by SPSS
- 2024.05.27 Excel로 통계분석하기 #3
- 2023.12.11 알아두면 쓸모있는 통계관련 잡학상식
- 2023.11.01 표본오차(sampling error) 2
글
구글 스프레드 시트로 데이터 분석하기
구글 스프레드 시트를 이용해 데이터를 분석할 수 있도록 만들어 보았습니다.
2024.05.27 - [[楞嚴] 생각 나누기/[平] 사회조사와 데이터분석] - Excel로 통계분석하기 #3
이전에도 엑셀로 통계분석하는 파일을 만들기도 하였지만, 해당 파일은 결측값이 있는 경우에 대한 반영이 정확히 되어 있지 않습니다.
이번 버전에서는 결측값에 대한 처리를 SPSS의 결과 값과 비교하면서 보완을 해보았습니다.
https://docs.google.com/spreadsheets/d/1bvD_d5KbLt4yeyXHhg6FfbowdwjgjQHWTroWbvNYyag/edit?usp=sharing
현재 모수검정 중 구현이 가능한 부분은 완료한 상태이며,
추가로 비모수검정인 순위상관분석과 카이제곱검정은 어떻게 하면 좋을지 검토 중에 있습니다.
추가로 비모수 검정인 순위상관분석과 카이제곱검정을 추가하였습니다.(2024. 9. 1)
혹시 오류가 있다면 알려주시면 반영해보겠습니다.
이 문서의 활용은 Data Set에 분석할 데이터를 입력하시면 됩니다.
직접 수식을 수정해보시려면 "사본 만들기"를 하셔 테스트해보세요~
'[楞嚴] 생각 나누기 > [平] 사회조사와 데이터분석' 카테고리의 다른 글
다중응답에 대한 카이제곱(χ²) 검정 방법 by SPSS (0) | 2024.06.02 |
---|---|
Excel로 통계분석하기 #3 (0) | 2024.05.27 |
알아두면 쓸모있는 통계관련 잡학상식 (0) | 2023.12.11 |
표본오차(sampling error) (2) | 2023.11.01 |
리커트(Likert) 척도는 서열척도인가? (0) | 2023.11.01 |
설정
트랙백
댓글
글
다중응답에 대한 카이제곱(χ²) 검정 방법 by SPSS
SPSS 다중반응 변수를 처리하다보면 두 가지 불편한 점을 만나게 된다.
하나는 다중반응에 대한 변수군을 정의한 것은 저장되지 않는다는 사실이다. 따라서 컴퓨터를 껐다가 새로 켜서 분석을 하려하면 그때마다 매번 변수군을 새로 정의해야만 한다.
다른 하나는 다중반응에 대해 교차분석을 하면 교차표만 제공해줄 뿐 카이제곱검정 등 검정통계량을 알려주지는 않는다.
이 두 가지는 생각보다 불편하다.
이와 관련하여 두번째는 다음과 같은 절차를 통해서 확인할 수 있다.
1. 다중반응 변수군을 정의한다.
2. 사용자 정의 표를 통해 분석할 변수를 입력한다.
- 이때 독립변수를 행(W)에, 종속변수를 열(O)에 마우스를 이용해 끌어다 놓는다.
3. 검정통계량 탭에서 옵션을 선택한다.
- 여기서 [□ 독립성 검정(카이제곱)(T)]을 체크해준다.
4. 결과를 확인한다.
- 위 결과에서 보듯이, 성별에 따른 노인일자라시압 참여이유에 대한 검정결과 χ²=125.399(p<.01)로 나타난 것을 확인할 수 있다.
'[楞嚴] 생각 나누기 > [平] 사회조사와 데이터분석' 카테고리의 다른 글
구글 스프레드 시트로 데이터 분석하기 (1) | 2024.07.28 |
---|---|
Excel로 통계분석하기 #3 (0) | 2024.05.27 |
알아두면 쓸모있는 통계관련 잡학상식 (0) | 2023.12.11 |
표본오차(sampling error) (2) | 2023.11.01 |
리커트(Likert) 척도는 서열척도인가? (0) | 2023.11.01 |
설정
트랙백
댓글
글
Excel로 통계분석하기 #3
Excel(엑셀)은 데이터 분석을 위해, 추가기능을 통해 분석도구를 제공하고 있다.
2021.11.07 - [[정보] 복지 이야기/[福] 복지 배우기] - Excel로 통계분석하기 #1
또한 Add on을 사용하는 방법도 있다.
2021.11.07 - [[정보] 복지 이야기/[福] 복지 배우기] - Excel로 통계분석하기 #2
한편, 진짜로 통계를 공부하고 싶다면, 직접 함수를 통해 수식으로 만드는 것도 가능하다.
여기서 제공하는 파일은 단순한 기본수식만으로 회귀분석까지 가능하도록 만들어 본 것이다.
- ○ 정규분포곡선 그리기
- ○ 신뢰구간 공식
- ○ 적절한 표본의 크기
- ○ 검정통계량 공식
- ○ 모비율추정
- ○ 단일표본 t 검정(계산식)
- ○ 단일표본 t 검정(데이터분석)
- ○ 독립표본 t 검정
- ○ 등분산 검정
- ○ 대응표본 t 검정
- ○ ANOVA
- ○ ANOVA(2)
- ○ 카이제곱 검정
- ○ 산포도 그리기
- ○ 산포도 그리기2(추세선)
- ○ 상관분석
- ○ 회귀식의 이해(최소자승법)
- ○ 단순 회귀분석
- ○ 단순 회귀분석2
- ○ 순위상관분석
- ○ 다중 회귀분석
수식을 하나하나 뜯어보는 것만으로도 통계에 대한 이해를 높일 수 있지 않을까한다.
※ 기존 v3.3에서는 등분산 가정 t 검정에서 공분산을 구하는 수식에 오류가 있었습니다.
이를 바로잡은 수정버전을 배포합니다.
'[楞嚴] 생각 나누기 > [平] 사회조사와 데이터분석' 카테고리의 다른 글
구글 스프레드 시트로 데이터 분석하기 (1) | 2024.07.28 |
---|---|
다중응답에 대한 카이제곱(χ²) 검정 방법 by SPSS (0) | 2024.06.02 |
알아두면 쓸모있는 통계관련 잡학상식 (0) | 2023.12.11 |
표본오차(sampling error) (2) | 2023.11.01 |
리커트(Likert) 척도는 서열척도인가? (0) | 2023.11.01 |
설정
트랙백
댓글
글
알아두면 쓸모있는 통계관련 잡학상식
알아두면 쓸모있는 통계관련 잡학상식
- 검증(檢證)과 검정(檢正)
- 공(空)과 무(無), 0과 null
- 부등식의 표현 이해
- p value(유의확률)를 표기하는 방법
- p value(유의확률)와 통계량
- 왜 유의확률(p value)은 0.05를 기준으로 하는가?
- 확률(probability)과 가능도(likelihood)
- Z 점수(Z score, 표준점수)
- 평균 추론에 필요한 조건
- 표본이 정규분포(정규성)인지 여부를 어떻게 알 수 있는가? (수정) → https://welfareact.net/851
- 중심극한정리(central limit theorem, CLT)
- 부트스트랩(Bootstrap)
- 독립변수와 종속변수: 인과관계와 변수
- 측도와 척도
- 리커트(Likert) 척도는 서열척도인가?
- 무작위(random) 표본추출(표집, sampling)
- 표본오차(sampling error)
- 제1종 오류와 제2종 오류
- 통계에서 ‘로버스트(robust)’의 의미
- Mann Whitney U = .000
이전 포스팅을 포함해 한데 모아보았습니다.
'[楞嚴] 생각 나누기 > [平] 사회조사와 데이터분석' 카테고리의 다른 글
다중응답에 대한 카이제곱(χ²) 검정 방법 by SPSS (0) | 2024.06.02 |
---|---|
Excel로 통계분석하기 #3 (0) | 2024.05.27 |
표본오차(sampling error) (2) | 2023.11.01 |
리커트(Likert) 척도는 서열척도인가? (0) | 2023.11.01 |
측도와 척도 (0) | 2023.11.01 |
설정
트랙백
댓글
글
표본오차(sampling error)
일반적으로 우리는 모집단이 아닌 표본집단을 대상으로 분석을 실시한다. 하지만 이런 표본집단과 모집단 사이에는 작은 차이가 존재할 수밖에 없다. 이런 차이를 표본오차(sampling error)라 부른다.
예를들어 지난 20대 대통령선거 지상파 3사의 출구조사 결과를 살펴보자.
이를 하나하나 해석해보면 다음과 같다.
첫째, 신뢰수준 95%는 같은 조사를 100번 했을 때 95번은 같은 결과가 나올 것이라 기대할 수 있다는 뜻이다.
둘째, 표본오차 ±0.8%p는 윤석열 후보의 실제 득표율이 47.6%~49.2%, 이재명 후보의 득표율은 47.0%~48.6% 사이에서 결정될 것으로 기대된다는 의미이다.
그리고 이 말은 출구조사의 결과만 놓고 살펴본다면, 누가 최종적으로 대통령이 될 지에 대한 예측은 되지만 결과값이 오차범위 내에 있다는 뜻이다.
한편 이런 표본오차(e)는 표본의 크기와 관련이 있다.
그리고 이런 표본오차는 오차한계(margin of error), 최대허용오차, 오차범위, 표집오차 등과 같은 의미로 사용된다.
표본오차 = 오차한계(margin of error) = 최대허용오차 = 오차범위 = 표집오차
'[楞嚴] 생각 나누기 > [平] 사회조사와 데이터분석' 카테고리의 다른 글
Excel로 통계분석하기 #3 (0) | 2024.05.27 |
---|---|
알아두면 쓸모있는 통계관련 잡학상식 (0) | 2023.12.11 |
리커트(Likert) 척도는 서열척도인가? (0) | 2023.11.01 |
측도와 척도 (0) | 2023.11.01 |
표본이 정규분포(정규성)인지 여부를 어떻게 알 수 있는가? (1) | 2023.11.01 |
RECENT COMMENT