분류 전체보기(37)
-
[시각화] matplotlib, seaborn 라이브러리 비교
오늘은 파이썬에서 그래프를 그려 시각화를 할 수 있는 라이브러리 matplotlib와 seaborn에 대해서 복기해보도록 하겠습니다. 사실 시각화라는 것은 다양한 그래프도 있고, 시각화 하기 전에 데이터 전처리 파트도 있기 때문에 최대한 다른 데이터를 가지고 글 마다 타겟 그래프 하나를 잡아서 정리해보겠습니다. 우선 이번 글에서는 각 라이브러리의 특징, 그리고 간략한 사용방법에 대해서 다뤄보겠습니다. 1. 라이브러리 받기 우선 두 라이브러리 모두 기본 라이브러리가 아니기때문에 설치를 해야합니다. 설피는 다음과 같이 진행할 수 있습니다 # virtualenv 환경 !pip install matplotlib seaborn # conda 환경 conda install matplotlib seaborn 2.라이..
2024.01.08 -
[Pandas] 외부 파일 불러오고 내보내기
이번에는 Pandas를 이용해서 외부 파일(csv, xlsx 등)을 읽어오는 방법에 대해서 정리해보고자 합니다. 우선 데이터를 배포하면 대부분 .csv(comma-separated values)가 확장자인 경우가 많은데, csv파일부터 시작해 보겠습니다. https://github.com/ghkstod/TIL/blob/main/ipynb/24-01-05PandasFile.ipynb + https://github.com/ghkstod/TIL/blob/main/ipynb/24-01-08pandasdatamerge.ipynb 1.CSV파일 불러오고 내보내기 CSV파일은 read_csv() 메서드를 이용하여 가능합니다. 사용방법은 df_name=pd.read_csv('file path')입니다. 저는 주피터 노..
2024.01.08 -
[Pandas] iloc vs loc의 차이
지난 글 마무리에 정리해본다고 한 loc 와 iloc의 차이를 정리해보도록 하겠습니다. 데이터는 저번에 이용했던 titanic 데이터를 그대로 이용하도록 하겠습니다. 우선 loc는 저번 글에서 다뤘기 때문에 이번 글에서는 iloc와 loc와의 차이점에 대해서 다뤄보겠습니다. 1. iloc iloc는 integer location의 약자입니다. 그래서 integer가 들어간 만큼 데이터프레임에서 정수를 이용하여 특정 값을 추출하는 방법입니다. 사용 방법은 df.iloc[row,col]입니다. 그래서 titanic데이터에서 첫번째 행의 데이터를 가지고 오고 싶다면 다음과 같이 작성 가능합니다. titanic.iloc[0] 그러면 첫번째 행의 모든 컬럼의 값들이 출력이 되고, 특정 컬럼의 값만 보고 싶다면 예..
2024.01.08 -
[Pandas] 기초 문법
오늘은 Python의 라이브러리 중에 하나인 Pandas에 대해서 리마인드 작성을 해볼까합니다. 교육 중에 작성한 전체적인 코드는 저의 github에서 확인할 수 있습니다. https://github.com/ghkstod/TIL/blob/main/ipynb/24-01-04Pandas.ipynb 우선 Pandas 라이브러리는 프로젝트 할 때 데이터를 불러오고 전처리 할 때 많이 써봤고, 그만큼 많이 공부해 본 라이브러리이기 때문에 이번에도 중요한 부분 그리고 프로젝트 할 때 어떻게 썻지? 하고 구글링을 해봤던 것들을 위주로 리마인드 해보겠습니다. 1. 데이터 프레임의 정보 알아보기 Pandas 라이브러리에서는 데이터 프레임을 직접 만들 수 있고 그것이 가장 기본적이지만 직접 데이터 프레임을 만들어서 프로젝..
2024.01.06 -
[Numpy] 기초 문법
이 내용은 1월 3일에 공부한 내용인데,, github에만 코드를 올리고 여기에서 리마인드 한다는 느낌으로 중요하다고 생각되는 부분, 조금 헷갈렸던 부분, 학부 시절에 프로젝트 할 때 ' 어?? 이거 어떻게 했더라?' 하고 구글링 했던 부분들을 중심으로 다시 정리했습니다. 전체적인 코드는 저의 github에서 보실 수 있습니다. https://github.com/ghkstod/TIL/tree/main/ipynb 1.np.arange() Numpy에서 정말 기본적으로 array를 만들 수 있는 방법, 범위를 지정해서 array를 만들고 저장하는 매서드 정말 기본중에 기본이지만 여기에 쓰는 이유는 가끔씩 헷갈리는 적이 있었기 때문입니다,, 예전에 만들때도 r을 하나 더 써서 arrange라고 해서 에러를 내..
2024.01.05