supergravity
데이터 사이언스가 뭘까? 본문
데이터 사이언스가 뭘까?
역사적으로 배운 내용을 바탕으로 이해해 보자.
데이터 사이언스는 질문을 통해 문제를 정의하고 데이터를 이용하여 해결하는 일이다.
그래서 데이터 사이언스는 현상에 대한 질문, 데이터를 관리하는 부분 그리고 데이터를 이용하는 부분으로 나뉜다.
데이터 사이언스는 아래와 같은 피드백 시스템으로 진행이 된다.
현상에 대한 질문 -> 데이터 관리 -> 데이터 이용 -> 현상에 대한 질문 -> 데이터 관리 -> 데이터 이용
현상에 대하여 질문을 하고 일을 진행하다 보면 데이터로부터 현상의 질문이 잘못된 것을 알게 된다.
그러면 다시 데이터로 돌아가 시작한다.
현상에 대한 질문
1. 과거로부터 미래를 알 수 있나?
2. 무슨 모델을 얻고 싶나?
3. 모델은 누가 사용하게 될까?
4. 어떤 데이터가 필요하고 나는 무슨 데이터를 가지고 있나?
5. 데이터 얻기는 얼마나 어렵나?
데이터 관리
1. collecting : 데이터 수집하기
2. curating : 다양한 소스에서 수집된 데이터의 구성 및 통합하기
3. cleaning : 데이터 깔끔하게 만들기
데이터 이용1. Visualize : 커뮤니케이션을 위해서 많이 사용된다.2. Analyze : 데이터를 분석하여 유용한 정보로 만든다.3. model : 머신러닝과 같은 기술을 이용하여 미래를 예측하는 모델을 만든다.
'데이터 과학' 카테고리의 다른 글
머신러닝 이란? (0) | 2021.08.12 |
---|---|
데이터 생태계 (0) | 2021.08.12 |
데이터 사이언스 역사 (0) | 2021.08.12 |
Comments