분류 전체보기(37)
-
[Linux] Linux 기본명령어
이 글에서는 리눅스의 기본적인 명령어에 대해서 다뤄볼까합니다. 1.pwd (Print Working Directiry) - 현재 디렉토리의 경로를 표시합니다. 2.cd (Change Directory) + 디렉토리 이름/ + ... - 디렉토리의 경로를 변경합니다. cd + 디렉토리이름/ 을 입력하면 디렉토리이름의 폴더로 경로를 이동합니다. cd ..을 입력하면 현재 디렉토리에서 상위 디렉토리로 이동이 가능합니다. 3.ls(List) - 현재 디렉토리에 존재하는 파일 목록을 조회한다. 추가 매서드 ls -a : 현재 디렉토리의 존재하는 파일 목록을 숨긴 파일을 포함하여 조회한다. ls 디렉토리이름: 디렉토리이름에 존재하는 파일을 조회한다. ls -l : 현재 디렉토리의 목록을 자세하게 조회한다.(읽고쓰기..
2024.01.23 -
[통계] 정규모집단에서의 표본분포- 1.카이제곱분포
정규분포 $N(\mu,\sigma^2)$으로부터 확률표본을 $X_1,...,X_n)이라고 할 때, 표본분산 $$S^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2$$ 에 대한 표본분포는 $\sigma^2$의 추론에 유용하게 쓰인다. 이 때 표본분산 $S^2$에 관계되는 분포로 카이제곱분포(chi-square distribution)이 있다. 1.카이제곱분포 정의 카이제곱분포의 정의: 확률변수 $Z_1,...,Z_k$가 각각 표준정규분포 $N(0,1)$을 따르고 서로 독립일 때, $$Z_1^2,...,Z_k^2$$ 의 분포를 자유도 $k$인 카이제곱분포라고 한다. 이때 기호로서 $$ Z_1^2+...+Z_k^2~\chi^2(k)$$ 로 나타낸다. 2.카이제곱분포의 ..
2024.01.22 -
[데이터 분석]보건의료빅데이터분석 데이터 전처리
제가 학부생 4학년 1학기에 보건의료빅데이터분석이라는 강의를 들었습니다. 그 때 강의를 수강하는 학우들과 같이 특정 음료를 마시고 혈당, 혈압, 체온 등을 측정한 데이터입니다. 강의 때 잠깐 며칠 투자해서 수집한거기도 하고 그렇게 큰 데이터가 아니기 때문에 간단하게 이 데이터를 가지고 분석을 진행할 건데, 이 글에서는 전처리 단계까지 진행하겠습니다. 1. 데이터 읽어오기 먼저 데이터를 읽어오도록 하겠습니다. 해당 csv파일에는 전처리를 해봐야겠지만 encoding='cp949'로 설정해야 읽어 올 수 있습니다. df=pd.read_csv('/content/drive/MyDrive/보건의료/beverage.csv',encoding='cp949') df.head() 2. 데이터 설명 데이터 설명입니..
2024.01.19 -
[데이터 분석] Kaggle Data Report
5조:김수현, 나한울, 정혜원, 한대희, 황유진 1.프로젝트 목표 최근 은행 고객 이탈률의 증가로 여러가지 문제들이 생겨났습니다. 고객의 이탈 최소화하고 고객 유지율 증가시키기 위해 여러가지 문제점들을 파악 후 해결하며 더 나아가서 신규 회원 유치까지 노려보려 합니다. 고객 이탈률 증가의 원인을 파악하기 위해서 여러가지 컬럼들을 분석하고 문제점을 파악하여 어느 부분에서 문제점이 있는지 파악하고 그 문제를 해결 및 보완하고자 합니다. 2.데이터 설명 및 확인 데이터의 수는 총 165034개의 데이터이며 , 13개의 컬럼으로 구성되어 있습니다. 컬럼의 내용은 아래와 같습니다 1 .Customer ID: 각 고객의 ..
2024.01.16 -
[통계] 표본 평균의 분포와 중심극한정리
1. 표본평균의 평균과 표준편차 $X_1,...,X_n$을 모평균 $\mu$, 모분산 $\sigma^2$인 모집단으로부터의 확률표본이라고 할 때, 이 확률표본으로부터의 표본평균 $\overline{X}= \sum_{i=1}^{n}X_i/n$을 생각해본다. 분포에 대한 성질을 알기 위해 표본평균의 기대값과 분산을 구해본다. 기대값의 가법성으로부터 표본평균의 기대값은 $$E(\overline{X})=\frac{1}{n}E(X_1+...+X_n)=\frac{1}{n}[(E(X_1)+...+E(X_n)]=\frac{1}{n}n\mu=\mu$$ 이고, $\overline{X}$의 분산은 $X_1,...,X_n$이 서로 독립이므로 분산의 가법성을 이용하여 $$Var(\overline{X})=\frac{1}{n^2}..
2024.01.15