-
머신러닝 - 기본상식_1카테고리 없음 2019. 10. 24. 20:49반응형
판별해야 될 개개의 데이터인 이메일, 고객, 거래는 행이 되며,
데이터를 구성하는 각 속성인 나이, 가격, 지역은 열이 된다.
Ex) 흑백 이미지로 된 종양 데이터
데이터: 흑백 이미지
속성: 크기, 모양, 색상의 진하기
( 샘플, 데이터 포인트 ) - 하나의 개체 혹은 행
특성 - 샘플의 속성(열)
중요한 부분:
머신러닝 프로세스에서 가장 중요한 과정 -
사용할 데이터를 이해하고, 데이터가 해결해야할 문제와 어떤 연관이 있는지 이해해야한다.
데이터셋으로 무엇을 하는 것인지 머신러닝 모델을 만들기 전에 이해해야한다.
-> 아무 알고리즘을 선택하여 데이터를 입력하는 것은 옳지 못한 방법이다.
* 머신러닝 알고리즘이나 방법론은 특정 문제를 푸는 전체의 과정의 일부분일 뿐 항상 전체 시스템에 대한 큰 그림을 담아야한다.
반응형