본문 바로가기

CodeStates

(15)
[머신러닝 - 트리모델] 결정트리: 분류, 회귀 방법이 둘 다 가능한 학습 모델이다. Y/N + 숫자형 Data등의 특성들을 기준으로 샘플을 분류한다. 특성들의 수치를 가지고 Impurity(불순도)를 최소화 하는, 정답 클래스를 찾아간다. Impurity: Gini Impurity(지니 불순도), Entropy(엔트로피) 등이 있다. 여러 범주가 섞여 있는 정도. A,B라는 2개의 클래스가 있을 때 A:B = 45:55 -> 불순도 높음 A:B = 20:80 -> 상대적으로 불순도 낮음 ※ 속도: Gini Impurity > Entropy 고른 분포: Gini Impurity 1인경우 I..
[note] 파이프라인 from sklearn.pipeline import Pipeline ##파이프라인 생성, 실행 순서는 함수 입력 순서대로 실행된다. ## OrdinalEncode의 이름을 ord로 지정해주었다. 만약 지정하지 않았다면 default로 풀네임(소문자)이다. pipe = Pipeline([ ('ord',OrdinalEncoder()), ('sim',SimpleImputer()), ('rnd',RandomForestClassifier()) ]) ##파이프라인 내부의 함수들의 파라미터를 설정 ##함수명__파라미터 로 지정을 해주어야한다. param_grid = [ { 'sim__strategy': ['mean'], 'rnd__max_depth' : [None, 5, 10], 'rnd__n_estimators' ..
[머신러닝 - 선형모델]#4 목차 #1 선형회귀(Linear Regression) 기준 모델(Baseline Model) 예측 모델(Predictive Model) Scikit-learn을 이용한 선형회귀모델 - 단순 선형 회귀(Simple Linear Regression) 선형 회귀 모델 계수, 회귀계수 (Coeeficients) #2 다중선형회귀(Multiple Linear Regression) Scikit-learn을 이용한 선형회귀모델 - 다중선형회귀(Multiple Linear Regression) 1)Categorical한 데이터를 수치화 시키는법 2)하나의 데이터에서 Train/Test를 나누는 방법 3)다중선형회귀 모델링 4)회귀계수 해석 Overfitting과 Underfitting 다항회귀모델 #3 릿지회귀 (Ri..
[머신러닝 - 선형모델]#3 목차 #1 선형회귀(Linear Regression) 기준 모델(Baseline Model) 예측 모델(Predictive Model) Scikit-learn을 이용한 선형회귀모델 - 단순 선형 회귀(Simple Linear Regression) 선형 회귀 모델 계수, 회귀계수 (Coeeficients) #2 다중선형회귀(Multiple Linear Regression) Scikit-learn을 이용한 선형회귀모델 - 다중선형회귀(Multiple Linear Regression) 1)Categorical한 데이터를 수치화 시키는법 2)하나의 데이터에서 Train/Test를 나누는 방법 3)다중선형회귀 모델링 4)회귀계수 해석 Overfitting과 Underfitting 다항회귀모델 #3 릿지회귀 (Ri..
[머신러닝 - 선형모델]#2 목차 #1 선형회귀(Linear Regression) 기준 모델(Baseline Model) 예측 모델(Predictive Model) Scikit-learn을 이용한 선형회귀모델 - 단순 선형 회귀(Simple Linear Regression) 선형 회귀 모델 계수, 회귀계수 (Coeeficients) #2 다중선형회귀(Multiple Linear Regression) Scikit-learn을 이용한 선형회귀모델 - 다중선형회귀(Multiple Linear Regression) 1)Categorical한 데이터를 수치화 시키는법 2)하나의 데이터에서 Train/Test를 나누는 방법 3)다중선형회귀 모델링 4)회귀계수 해석 Overfitting과 Underfitting 다항회귀모델 #3 릿지회귀 (Ri..
[머신러닝 - 선형모델]#1 목차 #1 선형회귀(Linear Regression) 기준 모델(Baseline Model) 예측 모델(Predictive Model) Scikit-learn을 이용한 선형회귀모델 - 단순 선형 회귀(Simple Linear Regression) 선형 회귀 모델 계수, 회귀계수 (Coeeficients) #2 다중선형회귀(Multiple Linear Regression) Scikit-learn을 이용한 선형회귀모델 - 다중선형회귀(Multiple Linear Regression) 1)Categorical한 데이터를 수치화 시키는법 2)하나의 데이터에서 Train/Test를 나누는 방법 3)다중선형회귀 모델링 4)회귀계수 해석 Overfitting과 Underfitting 다항회귀모델 #3 릿지회귀 (Ri..
[선형대수학]#2 #1 Vector & Matrix Caluclation Unit Vectors Identity Matrix Determinant Inverse matrix 벡터와 매트릭스의 기본 연산 Span, Basis, Rank Linear Projection #2 분산과 표준편차 공분산 상관계수 Vector Transformation EigenVector , EigenValue PCA High dimension Data와, 이로 인한 이슈 Feature Extraction / Selection #3 Scree Plot Supervised / Unsupervised Learning K-means clustering Variance 분산 : 분산이란 데이터가 얼마나 퍼져있는지에 따른 정도를 나타낸 것이며 관측값에서 평..
[선형대수학] #1 목차 #1 Vector & Matrix Caluclation Unit Vectors Identity Matrix Determinant Inverse matrix 벡터와 매트릭스의 기본 연산 Span, Basis, Rank Linear Projection #2 분산과 표준편차 공분산 상관계수 Vector Transformation EigenVector , EigenValue PCA High dimension Data와, 이로 인한 이슈 Feature Extraction / Selection #3 Scree Plot Supervised / Unsupervised Learning K-means clustering #1 #1 Vector & Matrix Caluclation Vector Caluclation 벡..