분류 전체보기(37)
-
[ML] Gradient Descent
1. 경사하강법 경사하강법(Gradient Descent)는 함수의 최소값 또는 극소값을 찾기 위한 반복적인 최적화 알고리즘입니다. 쉽게 말하면, 산을 내려가는 가장 빠른 길을 찾는 방법이라고 생각할 수 있습니다. 여기서 산은 최소화하고자 하는 함수를 말합니다. 2. 경사하강법의 단계 임의의 시작점 선택 : 우선 함수의 그래프 상에서 임의의 점을 선택합니다. 이 점은 우리가 최적화를 시작하는 위치입니다. $x_0$ 경사 계산 : 선택한 점에서 함수의 기울기를 계산합니다. 여기서 기울기는 어떤 방향으로 이동하면 함수의 값이 가장 빠르게 감소하는지를 나타냅니다. $$x_{\text{current}}$$ 이동 : 계산된 경사의 반대 방향으로 작은 단계를 이동합니다. 경사가 급한 곳으로 이동하면 함수의 값이 빠..
2024.02.22 -
[ML] Python Wrapper API & Scikit-Learn Wrapper API
오늘은 Python Wrapper API & Scikit-Learn Wrapper API 이 두가지에 대해서 알아보고자 합니다. 이 두가지를 이해하는 것은 파이썬에서 머신러닝에 대한 코드를 작성할 때 더 효율적으로 작업하고, 필요에 따라 적절한 도구를 선택하는데 도움이 됩니다. 1. Python Wrapper API Python Wrapper API는 머신러닝 라이브러리의 기본 Python 인터페이스를 의미합니다. 이 API는 라이브러리가 제공하는 원시적이고 강력한 기능에 직접 접근할 수 있게 해줍니다. 사용자는 라이브러리의 세부 설정을 자유롭게 조정할 수 있으며, 복잡한 모델과 알고리즘을 세밀하게 제어할 수 있습니다. 예를 들어, XGBoost 라이브러리의 Python Wrapper API를 사용하면,..
2024.02.21 -
[데이터 분석]Confusion matrix 평가 지표 해석 + 생성
오늘은 학습 모델의 평가 지표로 사용되는 Confusion Matrix를 통해 얻을 수 있는 평가 지표들에 대해서 그리고 Python에서 어떻게 생성할 수 있는지 그리고 어떻게 해석할 수 있는지에 대해서 정리하고자 합니다. 1. Confusion Matrix Confusion Matrix, 혼동 행렬은 학습모델 중에서 지도학습 모델에 대한 이진분류 문제에서 많이 사용합니다. 혼동 행렬은 실제 값과 모델 예측 값을 기준으로 생성되며, 다음 네 가지 요소를 가지고 있습니다 참 양성(True Positive) : 실제 양성을 양성으로 올바르게 예측 거짓 양성(Flase Positive) : 실제 음성을 잘못하여 양성으로 예측 참 음성(True Negative) : 실제 음성을 음성으로 올바르게 예측 거짓 음성..
2024.02.20 -
[가상환경] conda에서 pycaret설치
Pycaret은 머신러닝 워크플로우를 자동화할 수 있는 오픈소스 라이브러리입니다. 요즘 virtualenv 환경에서만 작업을 했기 때문에 conda 환경 다시 익숙하지 않아 졌는데 오늘은 conda로 환경을 설정해보겠습니다. + virtualenv 환경에서는 pycaret이 정상 작동을 안 할 수도 있다고 하기 때문에,,ㅎ 1. 폴더 생성 환경을 만들기 위한 폴더를 생성합니다. 저는 test라는 폴더를 생성했습니다. 2. 아나콘다 프롬프트 실행 후 폴더 찾기 아나콘다 프롬프트를 실행 한 후에 해당 폴더로 이동한다. cmd에서는 ls로 파일들을 조회했지만 conda에서는 dir을 통해서 조회한다. 이를 이용해서 만든 폴더에 접근합니다. 3. conda 가상환경 생성 및 접속 $ conda create --..
2024.02.15 -
[시각화]plotly choropleth gis시각화
merge_gdf=gdf.merge(df,left_on='SIG_KOR_NM', right_on='SGG_NM') 오늘은 미니프로젝트 때 한번 간단하게 다뤄본 gis시각화에 대해서 정리해볼까 합니다. GIS는 지도를 이용한 시각화로 좌표 정보를 제공하는 geojson 파일이 필요하며, 해당 파일은 geopandas를 이용하여 읽을 수 있습니다. 읽어오는 코드는 아래와 같습니다. import geopandas as gpd gdf=gpd.read_file('FILE_PATH') 그럼 다음과 같은 혹은 비슷한 자역 코드, 지역 이름, 지역 좌표 등의 데이터가 저장되어 있습니다. 이것을 시각화하고 싶다면 시각화 하고자 하는 데이터를 지역이름 혹은 코드를 통해 조인트를 걸어주면 됩니다. 저는 서울열린데이터광장에서..
2024.02.05