본문 바로가기

전체 글

(35)
[선형대수학]#3 #1 Vector & Matrix Caluclation Unit Vectors Identity Matrix Determinant Inverse matrix 벡터와 매트릭스의 기본 연산 Span, Basis, Rank Linear Projection #2 분산과 표준편차 공분산 상관계수 Vector Transformation EigenVector , EigenValue PCA High dimension Data와, 이로 인한 이슈 Feature Extraction / Selection #3 Scree Plot Supervised / Unsupervised Learning K-means clustering PCA PCA : 주성분 분석이라는 뜻으로 여러 차원의 데이터에서 주요한 부분만을 차원 축소하는 기법을..
[선형대수학]#2 #1 Vector & Matrix Caluclation Unit Vectors Identity Matrix Determinant Inverse matrix 벡터와 매트릭스의 기본 연산 Span, Basis, Rank Linear Projection #2 분산과 표준편차 공분산 상관계수 Vector Transformation EigenVector , EigenValue PCA High dimension Data와, 이로 인한 이슈 Feature Extraction / Selection #3 Scree Plot Supervised / Unsupervised Learning K-means clustering Variance 분산 : 분산이란 데이터가 얼마나 퍼져있는지에 따른 정도를 나타낸 것이며 관측값에서 평..
[선형대수학] #1 목차 #1 Vector & Matrix Caluclation Unit Vectors Identity Matrix Determinant Inverse matrix 벡터와 매트릭스의 기본 연산 Span, Basis, Rank Linear Projection #2 분산과 표준편차 공분산 상관계수 Vector Transformation EigenVector , EigenValue PCA High dimension Data와, 이로 인한 이슈 Feature Extraction / Selection #3 Scree Plot Supervised / Unsupervised Learning K-means clustering #1 #1 Vector & Matrix Caluclation Vector Caluclation 벡..
[통계] #3 통계의 목차 #[1] Hypothesis Test : 가설검정 T-test : T 검정 P-Vlaue [#2] Chi Square Test : 카이제곱 검정 Empirical Analysis : 경험적 분석 Kolmogorov-Smirnov Test Multivariate testing : 다변수 테스트 ANOVA Confiednce Interval : 신뢰구간 CLT : Central Limit Theorem : 중심 극한 정리 [#3] 베이즈 정리 조건부 확률 몬티홀의 역설 Naive Bayes Classifier : 나이브 베이즈 분류 오늘은 통계에 대한 설명중 [#3]을 진행하겠다. #3 총 확률의 법칙 : A라는 특정 확률 변수에 대해 발생 가능한 일들의 총 확률은 1이다, P(A) = 1 P(..
[통계] #2 통계의 목차 #[1] Hypothesis Test : 가설검정 T-test : T 검정 P-Value [#2] Chi Square Test : 카이제곱 검정 Empirical Analysis : 경험적 분석 Kolmogorov-Smirnov Test Multivariate testing : 다변수 테스트 ANOVA Confiednce Interval : 신뢰구간 CLT : Central Limit Theorem : 중심 극한 정리 [#3] 베이즈 정리 조건부 확률 몬티홀의 역설 Naive Bayes Classifier : 나이브 베이즈 분류 오늘은 통계에 대한 설명중 [#2]을 진행하겠다. #2 ※ DoF(Degree of Freedom) DOF 란 주어진 조건하에서 통계적 제한을 받지 않고 자유롭게 변..
[통계] #1 통계의 목차 #[1] Hypothesis Test : 가설검정 T-test : T 검정 P-Vlaue [#2] Chi Square Test : 카이제곱 검정 Empirical Analysis : 경험적 분석 Kolmogorov-Smirnov Test Multivariate testing : 다변수 테스트 ANOVA Confiednce Interval : 신뢰구간 CLT : Central Limit Theorem : 중심 극한 정리 [#3] 베이즈 정리 조건부 확률 몬티홀의 역설 Naive Bayes Classifier : 나이브 베이즈 분류 오늘은 통계에 대한 설명중 [#1]을 진행하겠다. #1 가설이란? 가설이란 확인 할 수 있는 아이디어를 뜻한다. 사과가 값이 나간다 라는 것은 증명이 불가능 하지만,..
[Python] 데이터 시각화 데이터를 시각화 하는 방법을 알아보자 내가 알고 있는 시각화 방법은 크게 두가지가 있다 01. Seaborn : 편리하게 다룰 수 있다. 02. Matplotlib : 자세하게 다룰 수 있다. 데이터 시각화는 어느 데이터를 어떻게 보이고 싶을지에 대한 가능성이 너무나도 열려있어 설명을 해주기는 어렵다. 그래서 몇가지 유용한 레퍼런스를 위주로 설명하고자한다. 먼저 Seaborn에 대해서 알아보겠다. 먼저 깃허브의 mwaskom 에서 제공하는 csv데이터를 이용해 시각화를 해보자. https://github.com/mwaskom/seaborn-data/blob/master/penguins.csv mwaskom/seaborn-data Data repository for seaborn examples. Cont..
[Pandas] DataFrame 조작하기 다음시간에는 저번시간에 이어 브랜드 별 할인율을 다르게 적용하여 할인액을 구하고, 같은 제품 & 사이즈별로 묶어 중복되는 행을 삭제하고 재고 수로 표시하는 방법을 배우겠다. 추가적으로 여러개로 쪼개진 DatFrame을 하나로 합쳐 사용을 하거나, 데이터의 Feature에 따라 데이터를 정리(?)하는 법을 배우겠다. 1.데이터를 합치는 방법. 좌측의 데이터는 지난 시간에 만든 매장에 입고된 신발의 정보이다. 우측의 데이터는 브랜드 별 할인율을 나타내는 데이터이다. 좌측의 Data를 우측과 합치기 위해선 여러가지 명령어가 있는데 이것에 대해 배워 보겠다. 데이터를 합치는 방법 concat과 Join/merge Concat 위에서 사용한 concat은 DataFrame 두개를 붙이는 기능이다. 위는 axis ..