티스토리 뷰

KNOU/머신러닝

머신러닝 소개

비용러브 2022. 9. 5. 12:51

1. 머신러닝의 개념
- 인공지능(강인공지능, 약인공지능) ⊃ 머신러닝 ⊃ 딥러닝
- 인공지능 → 인간의 지능을 모방하여 문제해결을 위해 사람처럼 학습하고 이해하는 기계를 만드는 분야
- 머신러닝 → 인간의 학습능력을 기계를 통해 구현하는 분야
- 딥러닝 → 심층 신경망 기반의 머신러닝 방법

 

2. 머신러닝의 처리 과정
- 학습 단계 → 학습 데이터 집합의 분석을 통해 원하는 입․출력의 관계를 알려주는 매핑 함수(결정함수)를 찾는 과정
- 추론 단계 → 학습을 통해 찾은 매핑 함수를 실제 데이터(“테스트 데이터”)에 적용하여 결과를 얻는 과정

 

3. 머신러닝의 기본 요소
- 각 데이터는 n차원의 열벡터로 표현 → 데이터 처리는 벡터 연산으로 정의됨
- 전체 데이터 집합에 대한 분포 특성을 고려하여 학습을 수행하는 것이 중요함
- 특징추출 → 데이터에서 불필요한 정보를 제거하고 처리를 위한 핵심적 정보를 얻는 것
- 목적함수 → 주어진 데이터 집합을 이용하여 학습 시스템이 달성해야 하는 목표를 기계가 알 수 있는 수학적 함수로 정의한 것
- 오차함수 → 학습 시스템의 출력과 원하는 출력의 차이(“오차”)로 정의되는 목적함수
- 성능 평가 기준 → 학습오차, 테스트 오차, 일반화 오차
- 교차검증법 → 제한된 데이터 집합을 이용하여 일반화 오차에 좀 더 근접한 오차값을 얻어 내는 방법

 

4. 머신러닝에서의 주제
- 머신러닝이 다루는 주제 → 분류, 회귀, 군집화, 특징추출
- 분류 → 입력 데이터가 어떤 부류(클래스)에 속하는지를 자동으로 판단하는 문제
→ 학습 데이터는 입력 데이터와 클래스 레이블(“목표 출력값”)의 쌍으로 구성됨
- 회귀 → 학습을 통해 입력변수와 원하는 출력변수 사이의 매핑 관계를 찾는 것 → 출력은 연속적인 실수값임
- 군집화 → 주어지는 클래스 정보 없이 단순히 하나의 덩어리로 이루어진 데이터를 받아서, 데이터의 성질 또는 분포 특성 등을 바탕으로 유사한 데이터끼리 묶어서 임의로 복수 개의 그룹(“클러스터”, “군집”)으로 만드는

 

5. 학습 시스템 관련 개념
- 머신러닝의 유형 → 지도학습, 비지도학습, 강화학습 등
- 지도학습(교사학습) → 학습을 수행할 때 시스템이 출력해야 할 목표 출력값(“교사”)을 함께 제공하는 방식 → 분류와 회귀 문제에 적합한 유형
- 비지도학습(비교사학습) → 학습할 때 목표 출력값에 대한 정보가 제공되지 않는 방식 → 군집화 문제에 적합
- 강화학습 → 원하는 출력값을 모르거나 알 수 없는 경우 출력값에 대해 정확한 값의 형태로 교사 신호를 줄 수 없어서 출력값에 대한 교사 신호를 보상 형태로 주는 방식
- 과다적합 → 학습 시스템이 학습 데이터에 대해서만 지나치게 적합한 형태로 결정경계를 형성하는 문제 → 일반화 성능의 저하를 초래

 

 

참고문헌

● S. Russell, P. Norvig, Artificial Intelligence: A Modern Approach, 3/E, Pearson Education, 2017.
● E. Alpaydin, Introduction to Machine Learning, 3/E, MIT Press, 2015.
● I. Goodfellow, MIT Press(MA), 2016. Deep learning: Adaptive Computation and Machine Learning, MIT Press(MA), 2016.

댓글