본문 바로가기

전체 글

(35)
[머신러닝 - 트리모델]#4 보호되어 있는 글입니다.
[머신러닝 - 트리모델] 결정트리: 분류, 회귀 방법이 둘 다 가능한 학습 모델이다. Y/N + 숫자형 Data등의 특성들을 기준으로 샘플을 분류한다. 특성들의 수치를 가지고 Impurity(불순도)를 최소화 하는, 정답 클래스를 찾아간다. Impurity: Gini Impurity(지니 불순도), Entropy(엔트로피) 등이 있다. 여러 범주가 섞여 있는 정도. A,B라는 2개의 클래스가 있을 때 A:B = 45:55 -> 불순도 높음 A:B = 20:80 -> 상대적으로 불순도 낮음 ※ 속도: Gini Impurity > Entropy 고른 분포: Gini Impurity 1인경우 I..
[note] 파이프라인 from sklearn.pipeline import Pipeline ##파이프라인 생성, 실행 순서는 함수 입력 순서대로 실행된다. ## OrdinalEncode의 이름을 ord로 지정해주었다. 만약 지정하지 않았다면 default로 풀네임(소문자)이다. pipe = Pipeline([ ('ord',OrdinalEncoder()), ('sim',SimpleImputer()), ('rnd',RandomForestClassifier()) ]) ##파이프라인 내부의 함수들의 파라미터를 설정 ##함수명__파라미터 로 지정을 해주어야한다. param_grid = [ { 'sim__strategy': ['mean'], 'rnd__max_depth' : [None, 5, 10], 'rnd__n_estimators' ..
[머신러닝 - 선형모델]#4 목차 #1 선형회귀(Linear Regression) 기준 모델(Baseline Model) 예측 모델(Predictive Model) Scikit-learn을 이용한 선형회귀모델 - 단순 선형 회귀(Simple Linear Regression) 선형 회귀 모델 계수, 회귀계수 (Coeeficients) #2 다중선형회귀(Multiple Linear Regression) Scikit-learn을 이용한 선형회귀모델 - 다중선형회귀(Multiple Linear Regression) 1)Categorical한 데이터를 수치화 시키는법 2)하나의 데이터에서 Train/Test를 나누는 방법 3)다중선형회귀 모델링 4)회귀계수 해석 Overfitting과 Underfitting 다항회귀모델 #3 릿지회귀 (Ri..
[머신러닝 - 선형모델]#3 목차 #1 선형회귀(Linear Regression) 기준 모델(Baseline Model) 예측 모델(Predictive Model) Scikit-learn을 이용한 선형회귀모델 - 단순 선형 회귀(Simple Linear Regression) 선형 회귀 모델 계수, 회귀계수 (Coeeficients) #2 다중선형회귀(Multiple Linear Regression) Scikit-learn을 이용한 선형회귀모델 - 다중선형회귀(Multiple Linear Regression) 1)Categorical한 데이터를 수치화 시키는법 2)하나의 데이터에서 Train/Test를 나누는 방법 3)다중선형회귀 모델링 4)회귀계수 해석 Overfitting과 Underfitting 다항회귀모델 #3 릿지회귀 (Ri..
[머신러닝 - 선형모델]#2 목차 #1 선형회귀(Linear Regression) 기준 모델(Baseline Model) 예측 모델(Predictive Model) Scikit-learn을 이용한 선형회귀모델 - 단순 선형 회귀(Simple Linear Regression) 선형 회귀 모델 계수, 회귀계수 (Coeeficients) #2 다중선형회귀(Multiple Linear Regression) Scikit-learn을 이용한 선형회귀모델 - 다중선형회귀(Multiple Linear Regression) 1)Categorical한 데이터를 수치화 시키는법 2)하나의 데이터에서 Train/Test를 나누는 방법 3)다중선형회귀 모델링 4)회귀계수 해석 Overfitting과 Underfitting 다항회귀모델 #3 릿지회귀 (Ri..
[머신러닝 - 선형모델]#1 목차 #1 선형회귀(Linear Regression) 기준 모델(Baseline Model) 예측 모델(Predictive Model) Scikit-learn을 이용한 선형회귀모델 - 단순 선형 회귀(Simple Linear Regression) 선형 회귀 모델 계수, 회귀계수 (Coeeficients) #2 다중선형회귀(Multiple Linear Regression) Scikit-learn을 이용한 선형회귀모델 - 다중선형회귀(Multiple Linear Regression) 1)Categorical한 데이터를 수치화 시키는법 2)하나의 데이터에서 Train/Test를 나누는 방법 3)다중선형회귀 모델링 4)회귀계수 해석 Overfitting과 Underfitting 다항회귀모델 #3 릿지회귀 (Ri..
[CodeStates] Section1 리뷰 한달 간의 수업을 통해 Section을 배우고 Project를 진행하고나서 배운 내용을 빠르게 훑어 볼 수 있도록 마인드 맵을 그려 보았다. 자세한 내용은 앞 글에 설명해두었다.