420.00 b

Description: Let's look at the characteristics of categorical data in structured data. It's similar to numeric data, but it uses categories, or categories.

#400#ML_Engineer_Basic#420#Data#420.00#Structured_Data#420.00 b#Categorical_Data_(Ordinal_and_Nominal)

범주형 데이터(Catrgorical)

서수 데이터(Ordinal):

정의: 서수 데이터는 범주 간의 관계가 명확하고 정렬된 범주형 데이터의 한 유형입니다. 각 범주에는 의미 있는 순서가 있지만 범주 간의 간격이 반드시 같을 필요는 없습니다.
예시 고객 만족도 평점(예: 매우 불만족, 불만족, 중립, 만족, 매우 만족), 교육 수준(예: 고등학교, 학사, 석사, 박사).
사용법: 서수 데이터는 설문조사, 순위, 선호도 목록 등 카테고리의 순서가 중요한 시나리오에서 사용됩니다. 카테고리 간 비교는 가능하지만 산술 연산은 지원하지 않습니다.

명목 데이터(Nominal):

정의: 명목 데이터는 카테고리에 특정 순서나 순위가 없는 범주형 데이터의 한 유형입니다. 각 카테고리는 고유하며 정량적으로 비교할 수 없습니다.

예시: 예: 성별(예: 남성, 여성), 요리 종류(예: 이탈리아, 중국, 멕시코), 색상(예: 빨강, 파랑, 초록).
사용법: 명목 데이터는 서로 다른 카테고리를 구분하는 것이 필수적이지만 순서는 중요하지 않은 경우에 사용됩니다. 일반적으로 인구 통계 정보, 분류 작업 및 라벨링에 사용됩니다.
\

요약

서수 데이터와 명목 데이터를 모두 포괄하는 범주형 데이터는 구조화된 데이터 분석에 필수적입니다. 구조화된 형식은 숫자 데이터와 비슷하지만, 숫자 값보다는 범주에 의존합니다. 범주를 나누는 기준등은 생각해볼만한 문제.