알아두면 쓸모있는 통계관련 잡학상식

반응형

아두면 모있는 계관련 학상식

 

  • 검증(檢證)과 검정(檢正)
  • 공(空)과 무(無), 0과 null
  • 부등식의 표현 이해
  • p value(유의확률)를 표기하는 방법
  • p value(유의확률)와 통계량
  • 왜 유의확률(p value)은 0.05를 기준으로 하는가?
  • 확률(probability)과 가능도(likelihood)
  • Z 점수(Z score, 표준점수)
  • 평균 추론에 필요한 조건
  • 표본이 정규분포(정규성)인지 여부를 어떻게 알 수 있는가? (수정) → https://welfareact.net/851
  • 중심극한정리(central limit theorem, CLT)
  • 부트스트랩(Bootstrap)
  • 독립변수와 종속변수: 인과관계와 변수
  • 측도와 척도
  • 리커트(Likert) 척도는 서열척도인가?
  • 무작위(random) 표본추출(표집, sampling)
  • 표본오차(sampling error)
  • 제1종 오류와 제2종 오류
  • 통계에서 ‘로버스트(robust)’의 의미
  • Mann Whitney U = .000

 

이전 포스팅을 포함해 한데 모아보았습니다.

 

알쓸통잡.pdf
0.36MB

 

반응형

[통계] 가중치를 활용한 회귀분석(WLS, Weighted Least Square, 가중최소제곱법)

반응형

※ 자료가 등분산성을 충족하지 못할 때, 즉 이분산일 때에는 OLS(최소제곱법)이 아니라 WLS 방식으로 보정하여 분석을 해야한다.

 

- 종속변수 : Y

- 독립변수: X1, X2, X3

- 가중치(weights) = 1/σ^2

 

SPSS를 활용해서 가중치를 구하고, 이를 통해 WLS의 방식으로 회귀분석 하는 방법

 

① 분석>회귀분석>선형
- 종속변수: Y
- 독립변수: X1, X2, X3
- 저장 > 예측값 > 비표준화 체크 # 예측값을 새 변수(PRE_1)수로 저장
- 저장 > 잔차 > 비표준화 체크 # 잔차를 새 변수(RES_1)수로 저장

② 변환>변수 계산
- 목표변수: absRES # 잔차의 절대값을 absRES로 생성
- 숫자표현식: abs(RES_1)

③ 분석>회귀분석>선형 # 잔차의 절대값과 예측치 간의 회귀분석
- 종속변수: absRES
- 독립변수: PRE_1
- 저장 > 예측값 > 비표준화 체크 # 예측값을 새 변수(PRE_2)수로 저장

④ 변환>변수 계산 # 가중치 계산
- 목표변수: weights # 가중치를 weights 변수로 생성
- 숫자표현식: 1/(PRE_2**2) # 1을 PRE_2의 제곱으로 나눔

⑤  분석>회귀분석>가중추정
- 종속변수: Y
- 독립변수: X1, X2, X3
- 가중변수: weights

 

--------------------------------------

 

R을 활용하는 방법: 가중치(weights) 구하는 두가지 계산식

 

① model <- lm(Y ~ X1+X2+X3, data="데이터") # 회귀분석 실시

 

 weights <- 1/fitted(lm(abs(residuals(model)) ~ fitted(model)))^2 # 가중치구하는 방법 첫번째
② weights <- 1/lm(abs(model$residuals) ~ model$fitted.values)$fitted.values^2 # 가중치 구하는 방법 두번째

- 둘중 어느 방법을 사용해도 결과값은 동일하다.

- residuals(model) # 회귀모델에서의 잔차 (SPSS에서 RES_1)

- fitted(model) # 회귀모델에서의 예측치 (SPSS에서 PRE_1)

- fitted(lm(abs(residuals(model)) ~ fitted(model))) # 잔차의 절대값과 예측치(PRE_1)간의 회귀모형에서의 예측치 (SPSS에서 PRE_2)

 

반응형
[하루] 일상과 독백 2021. 11. 23. 18:36

코로나19, 사회복지시설의 일상회복? 거리두기 강화!

반응형

코로나19 감염증 확산 추이를 검토해보았습니다.

전국 코로나19 감염증 확산 추이
부산 코로나19 감염증 확산 추이


1. 감소하는 치명률: 백신접종의 효과? 그리고 부스터 샷이 필요한 이유
확실히 누적 치명률은 2021년 2월 백신 접종을 기점으로 감소하고 있는 것이 맞습니다.
전국 기준 2%를 웃돌던 치명률이 1% 이하로 떨어졌기 때문입니다.
하지만 월간 치명률을 봤을 때, 지난 여름 0.17%까지 감소했던 치명률이 다시 0.8%대로 증가하였습니다. 확진자수가 많기 때문이기도 할터이지만, 기간이 지나면서 백신의 효능이 떨어지고 있기 때문은 아닌가 추측되기도 합니다.

2. 코로나19 확산정도: 계절의 영향?
코로나19가 계절과 관련이 있는진 모르겠지만, 지난 2년을 짧은 통계로 보건데, 통상 4개월을 주기로 증감을 반복합니다. 12월, 4월, 8월에 정점을 찍는 것으로 보입니다.
그리고 2021년의 코로나19 확진자 20일 추세선을 보면, 증가 추세인 것을 확인할 수 있습니다.

3. 이번 겨울 부산 사회복지시설은 어떻게 대응할 것인가?
수치상으로만 보면, 전국과는 별도로 부산은 지난 9~10월 확진자수가 감소하고 있었습니다. 전국 확산세가 있어 단계를 낮출 수 없었다고 볼 수도 있겠지만 분명 부산은 이때 충분히 안정적이었습니다. 굳이 2단계에 준하는데도 강화된 3단계를 적용할 이유는 없어보였습니다.

한데, 거꾸로 지금 11월부터 증가세에 있는데 단계적 일상회복을 이행한다고 합니다. 다소 이해가 가지 않는 대응입니다.

자영업자 등을 위해 필요하다고 판단했다는 점에서 어쩔 수 없다고도 생각합니다만, 사회복지시설은 자영업의 영리활동과도 관계가 없어 그 적용이 타당하지 않습니다.

 

만일 저라면 자영업과는 별도로 사회복지시설의 거리두기를 강화할 거 같습니다.

수치상으로 보면 부산은 이전의 거리두기 3단계에 준하는 상황입니다. 즉 지금은 조여야할 때입니다.
제가 있는 곳은 기본적으로는 정부 방침과 지자체 방침을 준용하겠지만, 내부 논의를 거쳐 조금더 강화된 이용기준을 적용할까 합니다.

1회 이용인원인원을 기준에 따라 줄이고, 방역을 강화하며, 백신 2차 접종자에 한해서만 이용을 허가할까 합니다.

또한 프로그램 및 행사는 최소화하고, 일정 인원 이상은 비대면을 중심으로 진행하는 것이 타당하다고 판단하고 있습니다.

 


계속적으로 코로나19 같은 감염병을 대응함에 있어 지자체의 자율적 판단과 대응, 사회복지시설 직능단체를 중심으로 별도의 능동적인 대응 방안을 만들 수 있어야 한다고 판단하는 이유입니다.

반응형

'[하루] 일상과 독백' 카테고리의 다른 글

반란  (0) 2022.07.22
내가 싫어하는 사람  (0) 2021.12.08
플레이톡(playtalk.net)  (0) 2021.07.06
구글 애드센스 계좌입금  (0) 2021.01.26
구글 애드센스 수표 도착  (0) 2020.09.22

Excel로 통계분석하기 #2

반응형

2021.11.07 - [[정보] 복지 이야기/[福] 복지 배우기] - Excel로 통계분석하기 #1

 

Excel로 통계분석하기 #1

굳이 비싼 통계 프로그램을 사용하지 않더라도, 업무에서 많이 사용하는 엑셀로도 간단한 통계분석은 충분히 할 수 있다. 그 방법 몇가지에 대해 안내하고자 한다. 첫째, 통계분석에 대한 수식

welfareact.net

 

마지막 세번째 방법은 바로 real statistics라는 add in을 설치하는 방법이다.

http://www.real-statistics.com

 

Home Page (Welcome) | Real Statistics Using Excel

What is Real Statistics Using Excel? Real Statistics Using Excel is a practical guide for how to do statistical analysis in Excel plus free statistics software. This software package extends Excel’s built-in statistical capabilities. This will enable yo

www.real-statistics.com

 

앞서 분석도구가 단지 계산된 값만을 보여준다면, real statistics는 그 계산을 위한 수식을 그대로 보여준다는 점이다.

통계를 공부하고자 하는 이들이 그 원리를 파악하는데 많은 도움이 된다.

또한 ANOVA의 경우 엑셀에서는 Post Hoc Test(사후검정)를 하는 것이 쉽지 않은데, 여기서는 Tukey HSD, Scheffe 등의 옵션을 제공해준다.

 

<설치방법>
Real Statistics Resource Pack을 설치하기 전에 Excel의 Solver 기능(해 찾기 추가 기능)이 컴퓨터에 설치되어 있는지 확인해야한다. 다음의 과정을 통해 확인할 수 있다.

첫째, Solver 기능(해 찾기 추가 기능)
1. 빈 Excel 스프레드 시트를 연다.
2. Alt-T I를 누른다(즉, Alt 키를 누른 상태에서 T 및 I 키를 누른다).
3. 나타나는 대화 상자에서 "해 찾기 추가 기능"이 선택되어 있는지 확인한다. 
4. "해 찾기 추가 기능"이 미리 체크되어 있지 않았다면, 다음 단계로 진행하기 전에 Excel을 종료했다가 다시 실행해야한다.


"해 찾기 추가 기능"이 설치되었는지 확인하였다면, 다음 단계를 사용하여 Real Statistics Real Pack을 설치한다.

둘째, 리소스 팩 설치

1. 리소스팩(resource pack)을 다운로드한다. // XRealStats.xlam

real statistics 다운로드하기

https://www.real-statistics.com/wp-content/uploads/2021/10/XRealStats.xlam

2. 리소스 팩을 컴퓨터의 원하는 위치로 옮긴다. (아래 권장) 
   권장 위치: C:\Users\사용자\사용자명\AppData\Roaming\Microsoft\AddIns
   ※ 주의: 특정 위치에 리소스 팩을 설치하고나면, 나중에 이동하기가 더 어려워진다.
3. Excel 을 실행한다. 단, 다운로드한 XRealStats.xlam 파일을 먼저 열려고 하면 안된다.
4. [ 파일 > 옵션> 추가 기능 ]을 클릭한 후, 하단의 관리(A) : Excel 추가 기능 [이동(G)]을 클릭한다.
   이 메뉴의 단축키는 Alt + T I 이다.
5. 이때 나타나는 대화 상자 에서 Xrealstats 를 선택하고, 확인 버튼을 클릭한다.
   ※ 주의: 이전에 Realstats를 활성화한 경우 Realstats  옵션을 선택 취소 해야한다 .
   이 옵션이 나타나지 않으면 찾아보기를 클릭 하여 xrealstats.xlam 파일을 찾아 선택한다. 
   그런 다음 위에서 설명한대로 4단계를 완료한다.

Excel: 추가기능 - real statistics

<사용방법>

1. "추가 기능"이라는 메뉴가 새롭게 생기고, 이를 클릭하면 "Real Statistics"라는 메뉴와 그 아래에 "Data Analysis Tools"가 나타난다.

Excel: 추가 기능 - Real Statistics - Data Analysis Tools

 

2. 다양한 통계분석을 위한 메뉴들이 나타난다.

Excel: Real Statistics 분석 메뉴

 

3. 구체적인 사용법은 직접 하나씩 배워보도록 하자.

다양한 예제와 활용법에 대한 워크북도 제공한다.

https://www.real-statistics.com/free-download/real-statistics-examples-workbook/

 

Real Statistics Examples Workbooks | Real Statistics Using Excel

Thirteen Excel workbooks can be downloaded for free which contain worksheets that implement the various tests and analyses described in the rest of this website. In parentheses is a list of the Real Statistics website main menu topics covered in each examp

www.real-statistics.com

Download

아래에 있는 다양한 파일들을 다운받아 확인하고 배워보자.

 

반응형

Excel로 통계분석하기 #1

반응형

굳이 비싼 통계 프로그램을 사용하지 않더라도, 업무에서 많이 사용하는 엑셀로도 간단한 통계분석은 충분히 할 수 있다.

그 방법 몇가지에 대해 안내하고자 한다.

 

첫째, 통계분석에 대한 수식을 직접 입력하여서 구하는 방법

이건 조금 숙련도를 요구하는데, 이에 대해 가르쳐주는 곳이 있다.

통계청의 통계교육원(https://sti.kostat.go.kr/)이라는 곳이다.

굳이 엑셀뿐만 아니라 통계관련 프로그램에 대해 전반적으로 잘 설명해주고 있다.

이러닝을 통해 관심있는 분야를 배워보는 것도 좋을 것이다.

이 포스팅과 관련하여서는 "엑셀로 배우는 통계분석(2021)"라는 강좌가 있다.

기본적인 개념도 잘 설명해주고 내용도 충실하다. 강력추천!!!

 

둘째, 엑셀의 추가기능으로 "분석도구"를 사용하는 방법

"엑셀 + 분석도구"로 구글 검색하면 방법이 많이 나오니 참고하자.

엑셀: 옵션 - 추가기능
엑셀: 옵션 - 추가기능 - 분석도구
엑셀 메뉴: 데이터 - 데이터 분석
엑셀 데이터 분석 메뉴

셋째, real statistics 애드온(add on)을 추가설치

 

... to be contineued

반응형