머신러닝은 데이터로부터 학습하여 예측, 분류, 군집화, 감지 등 다양한 작업을 수행하는 인공지능 기술입니다. 머신러닝 알고리즘은 크게 지도학습, 비지도학습, 강화학습으로 나눌 수 있습니다.
지도학습(Supervised Learning)
지도학습은 라벨링된 데이터를 이용하여 학습하는 방식입니다. 입력 데이터와 출력 데이터(정답)가 주어지면 모델은 입력 데이터와 출력 데이터의 관계를 학습하여 새로운 입력 데이터가 주어졌을 때 출력 데이터를 예측합니다. 대표적인 알고리즘으로는 선형회귀, 로지스틱 회귀, 의사결정트리, 랜덤포레스트, 서포트 벡터 머신 등이 있습니다.
비지도학습(Unsupervised Learning)
비지도학습은 라벨링되지 않은 데이터를 이용하여 학습하는 방식입니다. 입력 데이터만을 이용하여 모델 스스로가 데이터의 패턴을 찾아 학습합니다. 대표적인 알고리즘으로는 클러스터링, 주성분분석, 자기조직화지도, K-Means 등이 있습니다.
강화학습(Reinforcement Learning)
강화학습은 에이전트가 주어진 환경과 상호작용하며 보상을 최대화하는 의사결정을 내리는 방식입니다. 에이전트는 시행착오를 통해 보상을 최대화하는 의사결정 방법을 스스로 학습합니다. 대표적인 알고리즘으로는 Q-Learning, SARSA 등이 있습니다.
머신러닝의 특성은 다음과 같습니다.
데이터 기반: 머신러닝은 데이터를 기반으로 학습하고 예측합니다. 데이터가 많으면 머신러닝 모델의 성능이 좋아집니다.
자동화: 머신러닝은 자동화되어 있어 인간의 개입이 줄어듭니다.
일반화: 머신러닝은 학습 데이터를 기반으로 새로운 데이터에 대해 예측할 수 있습니다. 즉, 일반화된 모델을 만들 수 있습니다.
확률 기반: 머신러닝은 확률 기반 모델이기 때문에 예측 결과에 대한 신뢰도를 제공합니다.
'데이터 분석 > 머신러닝' 카테고리의 다른 글
Transformer 모델이란? (0) | 2023.04.10 |
---|---|
Scikit-learn으로 머신러닝 모델 만들기: 분류 예측 (0) | 2023.03.30 |
PyTorch RNN 모델 경로 예측/완성 (샘플 코드) (0) | 2023.02.23 |
RNN LSTM 모델 문장 완성 / 각 아이템의 확률 예측 (샘플 코드) (0) | 2023.02.23 |
대세 추천 알고리즘 밴딧 알고리즘(Bandit Algorithm)의 개념 (0) | 2023.02.23 |