본문 바로가기
데이터 공부/머신러닝 공부

01. 머신러닝(marchine learning)이란?

by 스터디마형 2024. 4. 15.

1. 머신러닝이란?

머신러닝은 인공지능(AI)의 한 분야로, 컴퓨터가 명시적으로 프로그래밍되지 않아도 데이터로부터 학습하고, 패턴을 인식하며, 결정을 내릴 수 있게 하는 기술입니다. 머신러닝 모델은 대량의 데이터를 처리하여 그 안의 숨겨진 규칙이나 패턴을 찾아낼 수 있으며, 이를 기반으로 예측(prediction)이나 분류(classification), rnswlq(clustering) 알고리즘 등의 작업을 수행할 수 있습니다.

예로 들면, 주가, 환율 등 경제지표 예측, 은행에서 고객을 분류하여 대출을 승하거나 거절하는 문제, 비스산 소비패터을 가진 고객 유형을 군집으로 묶어내는 문제 등이 있다.

2. 지도학습, 비지도학습이란?

출처 : https://busy.org/@urobotics/5bksow

 

 

출처 : https://brunch.co.kr/@hansungdev/9 / 머신러닝 정의 분류

 

  • 지도학습(Supervised Learning): 지도학습은 입력과 그에 해당하는 출력(레이블)이 주어지며, 이 데이터를 기반으로 입력에서 출력을 예측하는 방법을 학습하는 과정입니다. 학습된 모델은 새로운 입력에 대해 정확한 출력을 예측할 수 있습니다. 지도학습의 대표적인 예로는 분류(Classification)와 회귀(Regression)가 있습니다.

 

  • 비지도학습(Unsupervised Learning): 비지도학습은 입력은 주어지지만, 출력(레이블)이 주어지지 않는 경우입니다. 모델은 데이터 내에서 패턴이나 구조를 스스로 찾아내야 합니다. 비지도학습의 주요 사용 사례로는 군집화(Clustering), 차원 축소(Dimensionality Reduction) 등이 있습니다.
구분 지도 학습(supervised learning) 비지도 학습(unsupervised learning)
알고리즘
(분석모형)
• 회귀분석
• 분류
• 군집분석
특징 • 정답을 알고 있는 상태에서 학습
•모형평가 방법이 다양한 편
• 정답이 없는 상태에서 서로 비슷한 데이터를 찾아서 그룹화
• 모형 평가 방법이 제한적

 

3. 회귀, 분류?

  • 회귀(Regression): 회귀는 연속적인 값을 예측하는 지도학습 방법입니다. 예를 들어, 집의 크기, 위치, 방의 수 등을 기반으로 집의 가격을 예측하는 것이 회귀 문제입니다.

출처 : https://velog.io/@dohyunkyoung  // 회귀(Regression)

 

 

 

 

  • 분류(Classification): 분류는 주어진 입력을 미리 정의된 여러 클래스 중 하나로 할당하는 지도학습 방법입니다. 예를 들어, 이메일이 스팸인지 아닌지를 판별하거나, 손으로 쓴 숫자 이미지를 0부터 9까지의 숫자 중 하나로 분류하는 것이 분류 문제입니다.

출처 : https://velog.io/@dohyunkyoung  // 분류(Classification)

 

4. 머신러닝 프로세스

머신러닝 프로세스는 일반적으로 다음 단계를 포함합니다:

  1. 데이터 수집: 분석할 데이터를 수집합니다.
  2. 데이터 전처리: 누락된 값 처리, 특성 선택 및 변환 등 데이터를 분석에 적합한 형태로 만듭니다.
  3. 모델 선택: 문제에 맞는 머신러닝 알고리즘을 선택합니다.
  4. 학습: 학습 데이터를 사용하여 모델을 학습시킵니다.
  5. 평가: 검증 데이터나 테스트 데이터를 사용하여 학습된 모델의 성능을 평가합니다.
  6. 조정 및 최적화: 모델의 성능을 개선하기 위해 파라미터를 조정하고, 필요한 경우 모델을 재학습합니다.
  7. 배포: 학습된 모델을 실제 환경에 배포하여 예측이나 분류 작업을 수행합니다.

머신러닝 프로젝트는 이러한 단계를 반복적으로 수행하며, 문제에 대한 해결책을 점진적으로 개선해 나갑니다.