정형 데이터와 비정형 데이터의 의미 비교
범주형 데이터의 두 가지 분류와 사례
데이터 품질의 의미와 데이터 품질관리 실패 사례 분석
데이터 시각화의 의미 및 성공과 실패 사례 비교
데이터 주도권의 의미
데이터 품질의 의미
데이터 시각화의 의미
데이터는 구조화의 정도에 따라 정형 데이터(StructuredData)와 비정형 데이터(Unst ructuredData)로 구분된다.
반면 비정형 데이터은 일정한 구조나 형식이 없는데이터로, 텍스트, 이미지, 음성, 영상, 소셜미디어 글, 이메일 내용 등이 이에 해당한다.
비교하자면, 정형 데이터는 '데이터베이스 중심의 관리형 정보'라면, 비정형 데이터는 '현실 속 감정, 의견, 이미지 등 비언어적 정보'를 담고 있다는 점에서 상호 보완적이다.
범주형 데이터는 명목형(Nominal)과 서열형 (Ord inal)으로 나뉜다.
명목형 데이터는 순서나 크기 개념이 없는 단순 분류형 데이터이다.
서열형 데이터는 범주간 '순서'가 존재하는데이터이다.
데이터 주도권은 개인과 조직이 데이터를 생산, 관리, 분석, 활용함으로써 데이터를 통제하고 주도적으로 의사결정을 내릴 수 있는 역량을 의미한다.
교재에서는 '데이터를 단순히 소비하는 존재가 아니라, 데이터 흐름의 중심에서 주체적으로 다루는 능력'을 데이터 주도권이라 정의한다.
데이터 주도권을 가지려면 단순히 데이터를 '수집'하는 것보다 '해석'하는 능력이 중요하다.
결국 데이터 주도권은 단순한 기술 습득이 아니라, '비판적 사고+윤리적 인식'의 결합을 통해 완성된다고 할 수 있다.
보잉사의 항공기 추락 사고는 기술적 오류뿐 아니라, '데이터 관리 실패'의 대표적 사례로 평가된다.
이 사례는 단순한 기술적 결함이 아니라 데이터 품질관리의 실패에서 비롯된 재난이었다.
이러한 사례들은 데이터 품질관리가 단순한 기술 문제가 아니라, 조직 전체의 리스크 관리 및 경영전략의 핵심임을 보여준다.
데이터 시각화의 핵심은 정보의 효율적 전달이다.
실패 사례-2020 미국 대선 여론조사 지도시각화
성공사례는 '정확한 데이터 +명확한 시각적 구조+ 신뢰할 수 있는 출처'의 조합을 갖춘 반면, 실패 사례는 '비율 정보 누락+시각적 과장+해석의 오류'가 있었다.