정형 데이터 중 범주형 데이터의 두 가지 분류와 사례
범주형 데이터의 정의
범주형 데이터의 두 가지 분류
범주형 데이터의 활용과의의
새로운 데이터 환경에서의 범주형 데이터 확장
정형 데이터 중 범주형 데이터는 명목 척도와 순서척도로 구분된다.
정형 데이터 중 범주형 데이터의 두 가지 분류와 사례
데이터는 크게 정형 데이터와 비정형 데이터로 나눌 수 있으며, 이 중 정형 데이터는 구조화된 형식으로 체계적 저장과 분석이 가능하다는 특징을 가진다.
정형 데이터 안에서도 숫자로 표현되는 수치형 데이터와 속성 중심의 범주형 데이터로 다시 구분된다.
본 보고서에서는 범주형 데이터의 두 가지 분류인 명목 척도와 순서척도를 구체적으로 살펴보고, 교재 외의 다양한 사례를 제시하며 그의의와 활용 가능성을 고찰하고자 한다.
명목 척도 데이터는 단순히 집단이나 항목을 구분하기 위해 부여된 값이다.
예를 들어, 서울·부산·대구라는 지역구분은 단순한 명목일 뿐, 어느 지역이 더 크거나 우위에 있다는 의미를 가지지 않는다.
음식 취향 : 채식주의, 잡식주의, 비건 등은 식습관을 구분하는 범주형 데이터이며, 어느 것이 우열을 가리지 않는다.
교통수단 선택 : 버스, 지하철, 자가용, 택시 등은 단순한 이동수단의 명목 구분이다.
순서척도 데이터는 명목 척도와 달리 서열이나 순위를 내포한다.
예컨대 선거연구에서 성별, 연령대, 지역과 같은 명목 척도는 유권자 집단을 구분하는 데 쓰이고, 정치성향(진보-중도-보수)은 순서척도로 분석되어 투표 패턴을 설명하는 데 활용된다.
명목 척도로 고객의 성별이나 거주지역을 구분하고, 순서척도로 구매 만족도나 충성도를 분석한다.
또한 자연어처리 분야에서는 문장을 특정 감정범주(긍정·중립·부정)로 분류하는 데 순서척도 적사고가 반영된다.
명목 척도 데이터는 단순히 '종류'를 구분하는 역할을 하고, 순서척도 데이터는 '서열'을 내포하되 간격은 일정하지 않다.
특성과 빅데이터 활용사례분석 및 빅데이터 문제점과 미래전망 연구 빅데이터의 특성
빅데이터 주요 기법분석
빅데이터 활용 사례
빅데이터의 미래 전망
이처럼 기존의 정형 데이터뿐만 아닌 비정형 데이터의 수집과 분석, 활용을 통해 최근 야구경기에서 빅데이터의 중요성은 더욱 ..
인코텀즈의 제정과 개정 과정 인코텀즈의 제정과 개정 과정
1. 인코텀즈의 제정 (1936)
20세기에 들어 와서 국제무역의 당사자들간에는 각국의 법률, 언어, 관습 등이 서로 다른 데서 야기되는 무역분쟁을 극소화하고 상관습을 국제적으로 통..
인코텀즈 2010의 문제점과 미숙지로 인한 피해사례 본 자료는 <인코텀즈 2010의 문제점과 미숙지로 인한 피해사례>에 대해 서술한 자료로 Incoterms 2010의 개정 필요성, Incoterms 2010의 주요 내용과 각 조건별 문제점, Incoterms 2010 미숙지로 인한 피해사례 등..