상세 컨텐츠

본문 제목

[K-DIGITAL] 인공지능과 머신러닝

PYTHON/K-DIGITAL

by ranlan 2021. 6. 28. 22:59

본문

728x90

 

 

인공지능 (Artificial Intelligence, AI)

 

인공지능이란

 Artificial intelligence(AI), sometimes called machine intelligence, is intelligence demonstrated by machines, in contrast to the natural intelligence displayed by humans and other animals.
 In computer science AI research is defined as the study of "intelligent agents": any device that perceives its environment and takes actions that maximize its chance of successfully achieving its goals.

 

자신을 둘러싼 환경을 지각, 인식하고 적절한 행동을 취하여 목표를 성취할 가능성을 최대화 하는 기계(기계가 가진 지능, 기술)

인간의 학습능력, 추론능력, 지각능력등을 인공적으로 구현한 컴퓨터 프로그램 또는 이를 포함한 컴퓨터 시스템을 의미하며 하나의 기술이자 연구 분야를 의미하기도함

 

약한 인공지능 (weak AI)

- 어떠한 목적에 최적화된 알고리즘과 적당한 규칙 설정, 기계가 단순히 지능적으로 작동하게 함(실제로 인간처럼 행동하는 것은 아님)

 

강한 인공지능 (strong AI)

- 인간과 유사하게 생각하고 기능할 수 있는 기술, 인간처럼 사고하고 답을 찾아내는 방식

 

초 인공지능 (super AI)

- 인간의 지식보다 뛰어난 인공지능

 

 

 

 

머신러닝 (Machine Learning)

컴퓨터가 스스로 학습하여 인공지능의 성능을 향상시키는 기술 방법, 자동화된 프로그램

어떠한 과제를 해결하는 과정에서 특정한 평가 기준을 바탕으로 학습의 경험을 쌓아나가는 프로그램

데이터 분석을 위한 모델 생성을 자동화하여 소프트웨어가 데이터를 바탕으로 학습하고 패턴을 찾아나감

 

모델

- 데이터를 가장 잘 표현하는 모델을 찾는 과정, 데이터로 학습이 완료된 기계학습 알고리즘

 

알고리즘

- 어떤 문제를 풀기 위해 명확히 명시된 계산 시퀀스

- 데이터 내에서 패턴을 찾고 데이터에서 학습하는데 사용되는 절차

 

학습(model fitting)

- 데이터에 맞는 모델을 찾는 과정으로 결과를 평가하며 계속해서 수정한다, 즉 실제 정답과 예측 사이 오차를 줄여나가는 최적화 과정

 

과적합 (overfitting)

- 데이터를 과하게 학습하여 학습 데이터에 대해서는 오차가 감소하나 실제 데이터에 대해서는 오차가 증가함

 

*교차 검증 (cross validation)

새로운 데이터들에 대해 좋은 결과를 얻기 위해

test data에 과적합하게 되는 것을 막기 위해 test set을 중복 없이 전체 데이터에서 일부분 선택해 바꿔가며 평가 진행

모든 데이터 셋을 평가에 활용할 수 있으나 시간이 오래 걸림

 

* 비용함수 (cost function, 손실함수)

비용: 가설이 얼마나 정확한지 판단하는 기준

예측 값에서 실제 값 사이 차이로 예측 모델의 성능 척도

 

 

머신러닝 알고리즘의 분류

 

 

1) 지도 학습 (Supervised Learning)

데이터에 대한 정답(label, targer)이 있으며 그 정답을 예측하기 위해 학습

output 형태에 따라 회귀 분석과 분류 분석으로 나눌 수 있음

- 회귀(Regression) 분석: output이 연속적인 값으로 (실수 영역 전체에서) 나타남

  >> 비용함수 MSE

- 분류(Classification) 분석: output이 불연속적인 값으로 나타남, 데이터 클래스의 수에 따라 이진분류(binarry)와 다중분류(multi-class)로 나뉨

  >> 비용함수 교차 엔트로피(Cross-Entropy)

더보기

multi-class : 여러 분류 중 하나의 input 데이터에 대응되는 하나의 분류만 있어야함 (ex. 동물 구별 문제)

multi-label : 하나의 데이터에 둘 이상의 카테고리에 속함 (ex. 한장의 사진에 강아지와 고양이가 있는 경우)

 

대표 알고리즘) Linear/Logistic Regression, Desicion Tree, Bayesian Classificatioin, (Basic) Neural Network ...

활용 예) 스팸 문자 분류기, 주식 가격 예측, 유방암 진단, 이미지 인식 등

 

2) 비지도 학습 (Unsupervised Learning)

정답(label, target)이 없으며 데이터에 숨어있는 규칙성을 찾기 위해 학습

대표 알고리즘) K-Means Clustering, kNN, Principal Component Analysis(PCA), Linear Discriminant Analysis(LDA) ...

활용 예) 고객군 분류, 장바구니 분석, 취향 분석 추천 시스템 등

 

3) 강화 학습 (Reinforcement Learning)

주위 환경과 자신의 행동사이 반복적인 상호작용을 바탕으로 최종적으로 얻게 될 기대 보상을 최대화 하기 위한 행동 선택 정책 학습

현재 상태에서 어떤 행동을 취하는것이 최적인지 학습하는 것

대표 알고리즘) Monte Carlo methods, Markov Decision Processes, Q-learning, Dynamic Programming ...

활용 예) 로봇 제어, 공장 최적화 등

 

 

 

딥러닝 (Deep Learning)

컴퓨터가 사람처럼 생각하고 배울 수 있도록 하는 인공지능 기술

인간의 인공신경망에서 발전한 형태의 인공지능으로 뇌의 뉴런과 유사하게 정보 입출력 계층을 활용해 데이터 학습

 

728x90

관련글 더보기

댓글 영역