1. 머신러닝이란?
머신러닝은 인공지능(AI)의 한 분야로, 컴퓨터가 명시적으로 프로그래밍되지 않아도 데이터로부터 학습하고, 패턴을 인식하며, 결정을 내릴 수 있게 하는 기술입니다. 머신러닝 모델은 대량의 데이터를 처리하여 그 안의 숨겨진 규칙이나 패턴을 찾아낼 수 있으며, 이를 기반으로 예측(prediction)이나 분류(classification), rnswlq(clustering) 알고리즘 등의 작업을 수행할 수 있습니다.
예로 들면, 주가, 환율 등 경제지표 예측, 은행에서 고객을 분류하여 대출을 승하거나 거절하는 문제, 비스산 소비패터을 가진 고객 유형을 군집으로 묶어내는 문제 등이 있다.
2. 지도학습, 비지도학습이란?
- 지도학습(Supervised Learning): 지도학습은 입력과 그에 해당하는 출력(레이블)이 주어지며, 이 데이터를 기반으로 입력에서 출력을 예측하는 방법을 학습하는 과정입니다. 학습된 모델은 새로운 입력에 대해 정확한 출력을 예측할 수 있습니다. 지도학습의 대표적인 예로는 분류(Classification)와 회귀(Regression)가 있습니다.
- 비지도학습(Unsupervised Learning): 비지도학습은 입력은 주어지지만, 출력(레이블)이 주어지지 않는 경우입니다. 모델은 데이터 내에서 패턴이나 구조를 스스로 찾아내야 합니다. 비지도학습의 주요 사용 사례로는 군집화(Clustering), 차원 축소(Dimensionality Reduction) 등이 있습니다.
구분 | 지도 학습(supervised learning) | 비지도 학습(unsupervised learning) |
알고리즘 (분석모형) |
• 회귀분석 • 분류 |
• 군집분석 |
특징 | • 정답을 알고 있는 상태에서 학습 •모형평가 방법이 다양한 편 |
• 정답이 없는 상태에서 서로 비슷한 데이터를 찾아서 그룹화 • 모형 평가 방법이 제한적 |
3. 회귀, 분류?
- 회귀(Regression): 회귀는 연속적인 값을 예측하는 지도학습 방법입니다. 예를 들어, 집의 크기, 위치, 방의 수 등을 기반으로 집의 가격을 예측하는 것이 회귀 문제입니다.
- 분류(Classification): 분류는 주어진 입력을 미리 정의된 여러 클래스 중 하나로 할당하는 지도학습 방법입니다. 예를 들어, 이메일이 스팸인지 아닌지를 판별하거나, 손으로 쓴 숫자 이미지를 0부터 9까지의 숫자 중 하나로 분류하는 것이 분류 문제입니다.
4. 머신러닝 프로세스
머신러닝 프로세스는 일반적으로 다음 단계를 포함합니다:
- 데이터 수집: 분석할 데이터를 수집합니다.
- 데이터 전처리: 누락된 값 처리, 특성 선택 및 변환 등 데이터를 분석에 적합한 형태로 만듭니다.
- 모델 선택: 문제에 맞는 머신러닝 알고리즘을 선택합니다.
- 학습: 학습 데이터를 사용하여 모델을 학습시킵니다.
- 평가: 검증 데이터나 테스트 데이터를 사용하여 학습된 모델의 성능을 평가합니다.
- 조정 및 최적화: 모델의 성능을 개선하기 위해 파라미터를 조정하고, 필요한 경우 모델을 재학습합니다.
- 배포: 학습된 모델을 실제 환경에 배포하여 예측이나 분류 작업을 수행합니다.
머신러닝 프로젝트는 이러한 단계를 반복적으로 수행하며, 문제에 대한 해결책을 점진적으로 개선해 나갑니다.
'데이터 공부 > 머신러닝 공부' 카테고리의 다른 글
파이썬 머신러닝 완벽 가이드 (권철민) - 분류 - ① 결정트리 (0) | 2024.05.02 |
---|---|
파이썬 머신러닝 완벽 가이드(권철민) - Chapter 03 평가 -② (0) | 2024.04.19 |
통계적 머신러닝 - Sklearn /데이터 인코딩 (0) | 2024.04.18 |
통계적 머신러닝 - Sklearn / 교차분석/ KFold / cross_val_score (0) | 2024.04.17 |