상세 컨텐츠

본문 제목

[Machine Learning] Multiclass / Multilabel classification

IT Convergence Engineering/AI

by Soo_buglosschestnut 2020. 9. 10. 11:47

본문

Multiclass / Multilabel classification


데이터 분석에서는 input(입력)값과 output(출력)값이 존재한다~

 

입력  X

= independent variable

= covariates, regressor, explanatory, feature, attributes, stimulus

 

출력 Y

= dependent variable

= response, regressand, target, label, tag

 

 

class : 전체 데이터를 분류하는 군집

label : 데이터가 속하는 분류 군집

 

binary classification : 클래스가 단 두 개일 경우


  • Multiclass classification

예를 들어 버섯이 5개가 있다고하면, 각각의 버섯은 이름을 가진다.

느타리버섯, 양송이버섯, 새송이버섯, 표고버섯, 송로버섯

그러면 각각의 버섯은 이 중 하나일 것이다.

  느타리버섯 양송이버섯 새송이버섯 표고버섯 송로버섯
버섯 1 1 0 0 0 0
버섯 2 0 1 0 0 0
버섯 3 0 0 1 0 0
버섯 4 0 0 0 1 0
버섯 5 0 0 0 0 1

(One-Hot Encoding으로 표현)

 

One-Hot Encoding :  단어 집합의 크기를 벡터의 차원으로 하고, 표현하고 싶은 단어의 인덱스에 1의 값을 부여하고, 다른 인덱스에는 0을 부여하는 단어의 벡터 표현 방식

 

버섯이 될 수있는 모든 class는 5개지만 각 버섯의 label은 1개인것!!

 


  • Multilabel Classification

여기서도 위와 마찬가지로 버섯 5가지가 있는데~ 100g, 200g, 300g으로도 분류해본다고 하면~

  느타리버섯 양송이버섯 새송이버섯  표고버섯 송로버섯 100g 200g 300g
버섯 1 1 0 0 0 0 1 0 0
버섯 2 0 1 0 0 0 0 1 0
버섯 3 0 0 1 0 0 0 0 1
버섯 4 0 0 0 1 0 1 0 0
버섯 5 0 0 0 0 1 0 1 0

 

multilabel은 버섯1이 느타리버섯이면서 100g인것~ label을 1개 이상 가진다는거다!!

 

 

이 차이점이 있다~

 


참고: m.blog.naver.com/PostView.nhn?blogId=nomadgee&logNo=220819616738&proxyReferer=https:%2F%2Fwww.google.com%2F

 

multilabel vs multiclass classification

처음 무언갈 배울 때 개념적으로 헷갈리는 게 있다.이번 포스트에서 다룰 multilabel과 multiclass도 그 중...

blog.naver.com

qastack.kr/stats/11859/what-is-the-difference-between-multiclass-and-multilabel-problem

 

멀티 클래스와 멀티 라벨 문제의 차이점

 

qastack.kr

blog.naver.com/PostView.nhn?blogId=tlaja&logNo=221287540582&parentCategoryNo=&categoryNo=43&viewDate=&isShowPopularPosts=false&from=postView

 

<머신러닝> multi class , multi label

classification을 공부하다 보면 만나는 multi class, multi label 헷갈릴 수 있어 정리한다.​우선 class...

blog.naver.com

 

관련글 더보기