목록Data Science/[도서] 통계101 데이터분석 (9)
트위티의 열하일기

3.1) 데이터 유형a. 모집단과 표본(2장 정리본 참고) b. 변수- 통계학에서 변수의 개수를 '차원'이라고 표현하기도 함- 고차원 데이터일수록 데이터 분석 난도가 높음 c. 다양한 데이터 유형- 변수는 크게 '양적 변수', '질적 변수'로 나눌 수 있음- 양적변수 (수치형 변수) : 숫자로 나타낼 수 있는 변수 - 이산형 양적 변수(이산변수): 얻을 수 있는 값이 점점이 잇는 변수 ex. 주사위, 사람 수, 횟수 - 연속형 양적 변수(연속변수0: 간격 없이 이어지는 값으로 나타낼 수 있는 변수 ex. 키, 몸무게- 질적변수 (범주형 변수) : 숫자가 아닌 범주로 변수를 나타낼 때 ex. 설문조사_예/아니요, 동전_앞/뒤, 날씨_맑음/흐림/눈/비 - 변..
2.1) 데이터 분석의 목적과 알고자 하는 대상a. 데이터 분석의 목적구체적인 데이터 분석 목적을 정하는 것이 중요하다.b. 알고자 하는 대상데이터 분석의 목적이 정해졌다면, 알고자 하는 대상을 명확히 하는 것이 중요하다. 2.2) 모집단모집단은 알고자 하는 대상 전체를 표현하는 말이다.알고자 하는 대상을 모집단으로 설정한다.딘, 얻을 가능성이 없는 요소를 포함한 모집단은 적절하지 않아 이에 따라 모집단을 수정해야 한다. a. 모집단 크기모집단에는 알고자 하는 대상의 많은 요소(element)가 포함되는데, 이러한 요소들의 수를 모집단 크기라 한다.- 유한모집단: 모집단 중 한정된 요소만 포함한 것(ex. 반대항 1반 & 2반의 학생수, 한국인의 수)- 무한모집단: 모집단 중 포함된 요소의 개수가 무한한..
1.1) 데이터를 분석하다데이터는 수치의 모음으로, 막연히 바라보기만 해서는 무엇인지 제대로 알 수 없다. 데이터 분석의 목적은 크게 3가지로 나눌 수 있다.- 데이터를 요약하는 것- 대상을 설명하는 것- 새로 얻을 데이터를 예측하는 것 a. 데이터 요약 ex. 평균값 계산 데이터의 요약된 값을 통해 수치의 경향을 대략적으로 알 수 있음 b. 대상 설명 = 대상이 가진 성질과 관계성을 명확히 밝히고 이를 이해한다- 통계학을 통해 데이터를 정량적/객관적으로 평가하여 대상이 가진 성질과 관계성을 찾고자 한다 c. 미지의 데이터 예측 : 이미 얻은 데이터를 기반으로, 새로운 데이터 셋에도 예측을 할 수 있는 것 1.2) 통계학의 역할a. 통계학은 데이터 퍼짐 정도가 클수록 힘을 발휘한다 -> 퍼짐 (..