티스토리 뷰

Note

통계학이란무엇인가?

poupdat 2023. 2. 9. 16:29

통계학이란무엇인가?


불확실성(uncertainty)하의의사결정(decision making)을다루는학문
통계학의두가지영역
•기술통계학(descriptive statistics) 현상의기술
–자료의수집, 정리, 요약의방법론: 탐색적자료분석
•추측통계학(inferential statistics) 현상의일반화
–모집단의일부인표본을추출하여, 표본을분석하고이를통해모집단의특성을추론하며, 그추론을토대로의사결정대안을제시하는데필요한이론적체계: 추정과가설검정

데이터값의여러유형
•오류값(error) 변수가가질수없는값이나불가능한조합및일관성없는잘못된코드값등.
•특이값(outlier) 정상이아닌값으로오류에의해발생할수도있고, 그렇지않을수도있음.
•결측값(missing) 관찰되지않은값을의미하며, 그원인과기록방법을정밀하게조사하여자료를정정하고기록방법을변경해야하며, 필요하다면자료를보정해야함.

데이터형태에따른분류
데이터의형태를왜구분하는가?
•데이터의형태에따라분석방법이다르기때문임
범주형데이터(categorical data)
•수학적관계식을정의할수없는데이터⇒ 질적데이터(qualitative data)
•관측결과가몇개의범주가운데하나로분류되는데이터
–명목형(nominal) : 한단위가특성에대해어떤계층에속하는가를나타내며, 분리적이고비수치적인범주를갖는변수를나타낼때사용⇒ 성별(남/녀), 지역(서울,부산,광주,…), 혈액형(A,B,AB,O)
–순서형(ordinal) : 측정대상을속성의정도에따라범주화하여순서대로배열하는데, 순서는범주들간의상대적서열만나타냄⇒ 성적(A,B,C,D,F), 순위(1등,2등,…)
척도형데이터(scale data)
•수학적관계식을정의할수있는데이터⇒ 양적데이터(quantitative data)
•관측결과자체가숫자로표현됨
–이산형(discrete) : 인구수, 상품의개수처럼정수로표현(countable)
–연속형(continuous) : 몸무게, 길이등과같이실수로표현(uncountable)

데이터의시간흐름과측정여부에따른구분
횡단면데이터(cross-sectional data) 특정시간에다양한항목에대하여획득된자료
종단면데이터(time series data) 시간의흐름에따라동일항목에대하여획득된자료
패널데이터(panel data) = 횡단면데이터+ 종단면데이터(시계열데이터)

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/07   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함