회귀분석 review
·
통계
1. 회귀분석의 기본 개념회귀분석은 변수들 사이의 함수적 관계를 탐색하는 것이다.회귀분석의 목적은 독립 변수(설명 변수)들이 종속 변수(반응 변수)에 미치는 영향을 추정하고, 이를 기반으로 종속 변수를 예측하는 것입니다. 종속 변수와 독립 변수 간의 관계는 수학적 모델을 통해 표현됩니다. (1) 회귀모형의 기본 형태일반적인 회귀모형은 다음과 같이 표현됩니다:Y = β₀ + β₁ X₁ + β₂ X₂ + ... + βnXn + ϵ여기서,Y는 종속 변수(예: 판매량, 수익 등), X₁ , X₂ ,...,Xn은 독립 변수(예: 광고비, 가격, 온도 등),β₀ 는 절편(intercept), 즉 독립 변수가 0일 때의 종속 변수 값, β₁ , β₂ ,...,βn​은 각각의 독립 변수에 대한 회귀계수(regressi..
기초통계학 review
·
통계
1. 통계학 개론통계학 특정 목적을 이루기 위하여 올바른 자료를 수집하고 생성하는 효과적인 방법을 연구하고, 이러한 자료를 효과적으로 정보화하여, 이를 바탕으로 과학적인 의사결정 방법을 연구하고 개발하는 학문 통계적 자료 : Statistical Data (sample) 통계적 연구를 목적으로 수집한 자료를 통계적 자료라고 한다. 특히 조사대상 전체에서 수집한 자료를 모집단자료(population data)라고 하며 조사대상의 일부에서 수집한 자료를 표본자료(sample data)라고 한다. 기술통계학 자료를 정리하고 요약하여 그 특성을 정확하게 기술하는 분야야 추론통계학대부분의 통계적 자료는 표본자료이고 따라서 표본자료로부터 모집단 전체의 특성을 파악하기 위한 분야 표본추출모집단의 특성을 정확히 파악하..
탐색적 자료분석 review
·
통계
탐색적 자료분석(EDA)이란?데이터의 특징과 내재하는 구조적 관계를 알아내기 위한 기법자료를 모형에 적합시키기보다는 데이터를 있는 그대로 보려는 데에 중점을 둠 자료분석탐색 : 데이터의 특징과 구조 파악 - 기술통계학확증 : 모형이나 효과적 재현성 - 추론통계학-Tukey(1977) : 단순한 계산과 그래프에 집중하여 자료가 무엇을 말하려는 지를 보기 위한 것탐색적 자료분석의 4가지 주제1. 저항성 강조 - 중위수(Median)데이터의 일부 변동에 따른 영향을 비교적 적게 받음중위수는 산술평균보다 이상치의 영향을 덜 받음 2. 잔차(residual) 계산실제값 - 예측값각 개별 관측값이 자료의 주 경향으로부터 얼마나 벗어났는지개별 잔차에도 신경을 써야한다 3. 자료의 재표현 - 변수변환적당한 척도로 변환..