Quiz 2
in Til on Til
- X: PCA, clustering → 비지도
- X: Logistic regression → classification
- 상관관계 분석 기본 가정 아닌 것은? → 비선형성
- O: PCA 로 M→ N dim reduc 시 선택하는 SVD comp 수는 N
- O: k-means cluster centroid = average of the samples allocated
ML Process
5 단계
- Data collection
- Data preprocessing
- EDA
- 문제 처리
- 결측치
- 이상치 - 변수 처리
- 연속형
- 범주형 - Feature engineering 파생 변수 생성 - 함수 변환, scaling 등 - 단순 합성 아닌, 문제 도메인 지식 연관 - 변수 선택 - Deploy
Programming
- Refactoring 체계 정리 중
- python 환경 관리 pip / conda environment setup
- pip: pip freeze > .txt / pip install -r .txt
pip freeze > requirements.txt 전체 기록 pip list --format=freeze > requirements.txt 패키지 이름과 버전만이 기록 pip install -r requirements.txt - conda: conda env export > .yml / conda env create -f .yml
conda env export > environment.yml conda env create -f environment.yml- Git
- pip: pip freeze > .txt / pip install -r .txt
- Github Process Routine 정리 및 실습 중
- 정리 중
- Leader/member 역할
- Trouble shooting