신경망 학습을 명령하는 함수인 Fit 에 반드시 들어 가야 할 인자값중 하나이다.
X, Y를 Train 인자값도, Test 인자값도 같은 쌍으로 들어 가게 되는데, 이 X가 무엇인지 Y가 무엇인지
명확히 모르고 있어서 정리겸 글을 적는다.
X 는 실제 테스트에 수행되는 데이터 이다.
Y 는 X 가 소속되는 데이터, 즉 카테고리 혹은 label 이다.
예를들자면, 이미지를 분류하는 신경망의 경우,
X는 이미지 데이터, Y는 이미지가 속한 분류 (예 : 신발, 옷, ....) 의 카테고리를 의미한다.
예를 하나 더 들자면,
학생들의 신체 데이터를 분류 할때, 해당 신체데이터가 초등학교,중학교, 고등학교의 분류를 가진다.
여기서 신체 데이터 자체는 X, 초등,중,고등학교 의 분류 카테고리는 Y 값이다.
Fit 이후, predict 로 결과값을 받았을 경우, Y의 카테고리를 통해 어느것으로 분류 했는지 알 수 있을듯 하다.
X 에 들어 갈 수 있는 데이터 형식으로는,
- numpy array, array 리스트
- 텐서플로우 tensor, tensor 리스트
- dictionary (키 : 이름, value 는 array 혹은 tensor)
- 튜플 (tf.data 데이터셋)
- keras.utils.Sequence 리턴값 등 tensorflow 에서 생성하는 데이터 셋 형식
'딥러닝(텐서플로우)' 카테고리의 다른 글
Object Detection 및 Semantic Segmentation (FCN) (1) | 2023.04.05 |
---|---|
keras.layers.concatenate (0) | 2023.04.04 |
Predict (0) | 2023.03.31 |
이미지 (영상) 딥러닝 CNN (0) | 2023.03.30 |
경사하강법 (0) | 2023.03.28 |