supergravity
머신러닝 이란? 본문
머신러닝은 데이터를 트레이닝 시켜 얻은 모델이다.
많이 알고 있는 뉴로네트워크의 경우 머신러닝의 서브셋이다.
이둘은 잘정의 되어있지만 ai경우 잘정의 되지 않은 넌센스한 개념이라고 한다.
트레이닝 방법은 수학적으로
optimization : 특정의 집합 위에서 정의된 실수값, 함수, 정수에 대해 그 값이 최대나 최소가 되는 상태를 해석하는 문제이다
regression : 여러 개의 독립변수와 한 개의 종속변수 간의 상관관계를 모델링하는 기법을 통칭한다
linear algebra : 선형대수 이다.
를 기초로 하고 있다.
위의 태크닉을 이용하여 모델을 만들면 새로운 데이터에 대해서 아웃풋 데이터를 얻을수 있다.
input ---> model ----> output ( predict )
데이터로 부터 학습시키는 방법
데이터를 학습용과 테스트용으로 나누어야 한다.
보통 80대 20으로 한다고 한다. (이를 cross-vaildation이라 한다.)
만약 데이터가 적은 경우 랜덤으로 학습용과 테스트용으로 나누어 수십 수백번 반복한다.(이를 k-ford cross-vaildation이라한다.)
머신러닝으로 부터 얻고자 하는 것
1. 미래에 유용한가
2. 정확한가
3. 빠른가
4. 일반화가능성
5. 머신러닝의 output에 대한 설명
6. 모델의 증명 또는 보증
머신러닝 타입
embedding은 한정된 데이터를 이용하여 smoth maniford를 만드는 것이다.
다른 말로 패턴 찾는다고 한다.
'데이터 과학' 카테고리의 다른 글
데이터 생태계 (0) | 2021.08.12 |
---|---|
데이터 사이언스가 뭘까? (0) | 2021.08.12 |
데이터 사이언스 역사 (0) | 2021.08.12 |
Comments