1-3. 통계학의 개념
1.3.1. 의사결정과 통계적 사고
문제해결을 위한 의사결정 프로세스
- 핵심(관심) 이슈 정리
- 조사 대상 선별
- 필요 데이터 규명, 실험/조사 방법 수립
- 데이터 수집, 정리, 통계 처리 ->정보
- 중요한 요인 발견
- 통계적 모형 개발 및 추정
- 적합성 검증, 모형 최적화 -> 해답
- 결론 도출, 의사결정 제안
=>> 2단계까지는 해당 분야의 지식과 경험을 활용하여 수행, 3단계부터 실험을 설계하고 데이터를 분석하여 의미 있는 정보를 도출해내는 통계적 방법론이 요구됨
1.3.2. 통계학이란
통계학
: 불확실한 상황 하에서 데이터에 근거하여 과학적인 의사결정을 하기 위한 이론과 방법의 체계
- 실험과 조사를 통하여 수집한 데이터로부터 관심 대상의 특성을 찾아내는 것
- 통계적 기법 : 실험계획, 데이터의 요약 및 해석의 근거를 제공하는 학문
통계학의 활용분야
- 데이터의 수집, 분류, 표현, 분석, 추론, 해석
통계학자의 역할
- 필요한 데이터의 형태 및 데이터를 수집하는 방법 연구
- 문제에 대한 최선의 답을 구하기 위한 분석 방법 연구
통계학의 연구분야
- 통계적 이론과 방법론 개발 : 통계학의 기초가 되는 이론들을 연구하고 응용분야에 필요한 통계적 방법론을 개발하는 분야 (EX. 확률론, 확률과정론, 수리통계, 점근적 추론, 선형/비선형 모델, 회귀분석, 실험계획, 통계계산, 베이지안 추론, 비모수추론, 시계열 분석)
- 통계적 방법론 응용 : 다양한 분야에서 발생하는 실제적인 무넺를 해결하기 위해 효율적으로 통계이론과 방법론을 적용하는 분야 (EX. 생물통계, 생명정보학, 품질관리, 공업통계, 계량경제, 금융통계, 보험통계, 기상통계)
1.3.3. 모집단과 표본
모집단과 모수
모집단(population)
: 통계분석의 연구대상이 되는 모든 대상의 집합으로 통계처리를 위해 수집할 데이터를 모두 포함하는 데이터의 집합이나 수행하는 실험(시행)에서 나타날수있는 모든 결과의 집합
모수(parameter)
: 모집단의 특성을 나타내는 수치
- 평균, 분산, 표준편차, 비율(ex 주사위 확률) 등이 주된 특성
=> 모평균, 모분산, 모비율
분류 모집단(population)
-> 유한(finite) 모집단(ex 유한 공정(로트(lot)), 지역구(동별)유권자, 지역(병원)내 암환자)
-> 무한(infinite) 모집단(ex 무한 공정, 유권자(투표권자 전체), 암환자(전국의 환자))
=> 무한의 경우는 조사가 불가능에 가까움, 모두 다 조사할때는 전수조사라고 함
표본과 통계량
표본(sample)
: 모집단의 특성을 파악하기 위해 모집단으로부터 일정한 규칙에 의해 추출한 모집단의 부분집합
통계량(statistic)
모수를 추정하기 위해 대응되는 표본에서 함수
통계적 추론(inference)
표본의 담긴 정보를 사용하여 모집단의 특성(평균, 분산, 비율 등)을 추측하는 것
추정(estimation), 가설검정(hypothesis)으로 나뉨
모집단->표본->모집단의 특성(모수 추정/가설 검정)->모집단
추정량(estimator)
모수를 추정하는데 사용하는 통계량
표본평균, 표본분산, 표본비율들이 사용됨
표본 평균, 표본 분산, 표본비율 -> 모평균, 모분산, 모비율
1.3.4. 데이터의 분류
: 데이터 척도의 유형 : 보강 필요
실험 설계(design of experiment) : 데이터를 수집하기 전에 미리 어떻게 실험할것인지를 계획하여 원하는 데이터를 정확하게 수집하고 기록할 수 있도록 하는 것
명목 척도(nominal scale)
- 순서, 크기 등의 의미 없음, 사칙연산 불가
ex) 교과 코드, 차번호, 성별, 주민번호 뒷자리, 복권 번호
순서 척도(ordinal scale)
- 순서 의미는 있고, 간격 의미는 없음, 사칙연산 불가
ex) 직급, 계급, 우선순위, 선호도
구간 척도(interval scale)
- 순서와 간격에 의미가 있으나 절대 영점이 없어서 비율의 의미는 없음. + - 가능
ex) 대기표 번호, 화씨온도 지능지수, 표준 점수
비율 척도(ratioscale)
- 순서, 간격, 비율(혹은 절대 0) 등의 의미가 모두 있음. 사칙연산 가능
ex) 절대온도, 농도, 몸무게, 키, 길이, 압력, 속도, 지지율
1.3.5. 기술 통계와 추측 통계
기술(descriptive) 통계학
데이터 정리, 요약 -> 통계량 계산, 그래픽 표현
추측(infernetial) 통계학
모수추정, 가설검정, 분산분석, 회귀분석, 적합도 검정
통계적 의사결정 절차
'확률과 통계' 카테고리의 다른 글
확률과 통계 2장 : 데이터 정리와 요약 (0) | 2025.03.15 |
---|