본문 바로가기

전체 글

(35)
[Pandas] DataFrame 다루기 이번 시간에는 DataFrame을 다루는 방법에 대해서 공부하려한다. 1. Index삽입 2. 행렬 Transpose 3. DataFrame의 Data 특정 행과 열의 데이터 변경 4. 새로운 Feature 생성 Index삽입 지난 시간에 생성하고 저장한 DataFrame을 호출한 사진이다. 이 DataFrame을 보면 짱구는 이름이라고 추측할 수 있지만 5와 500, 흰둥이는 무엇을 뜻하는지 파악하기 어렵다. 이에 대한 정보를 추가해주기 위해서 Index를 삽입하여 Data의 정보를 명시해준다. df.index = ['이름','나이','용돈', '애완동물이름(없으면0)'] df 행렬 Transpose 또한 데이터를 위에서 아래로 읽는 것이 아닌 책과 같이 좌에서 우로 읽고 싶으면 행과 열을 Transp..
[Pandas] DataFrame 생성, 저장 및 로드 Pandas에 대한 설명 Pandas는 파이썬 언어로 작성된 데이터의 분석 및 조작을 위해 만들어진 S/W라이브러리다. 판다스는 R에서 사용되던 data.frame 구조를 본뜬 DataFrame이라는 구조를 사용하기 때문에, R의 data.frame에서 사용 하던 기능 상당수를 무리없이 사용할 수 있도록 만들었다. 더욱이 파이썬이라는 접근성이 좋은 언어 기반으로 동작하기 때문에 데이터 분석을 파이썬으로 입문하는 사람들이 필수적으로 사용하는 라이브러리가 되었다.[1] Pandas의 데이터 구조 Demension Name 1D Series 1차원 배열의 데이터 2D DataFrame 2차원 배열의 데이터 (행과 열) DataFrame 생성, 저장 및 로드 Pandas의 DataFrame 생성하기 위와 같이 ..
Git과 GitHub 그리고 Colab ●Git과 Github을 이용하자. S/W의 버전 관리를 위해 코드를 수정하다보면 중간 세이브는 필수다. 이러한 백업을 반복하다보면 용량 문제, 관리의 번거로움이 발생한다. 또한 프로젝트 진행 시 프로젝트의 규모가 커지게 되면 개발자가 한명이 아닌 여러명이 작업을 하 게 된다. 여기서 각자의 파트에 맞게 작업을 하고 작업된 파일들을 취합하여야 하는데 이 과정에서 파일 관리의 어려움 이 발생한다. 이러한 문제들을 해결할 수 있는 것이 바로 Git이다. 여기서 Git은 소프트웨어를 뜻하고 GitHub는 이 Git으로 저장되어 서 원격 전송된 내역들이 저장되는 공간을 저장하는 서비스다. GitHub는 무료이지만! GitHub에 올라간 코드는 공유가 되니 주의하자. ●Colab을 이용하자. Colab은 구글에서..