[빅데이터분석기사 기출2] DIKW피라미드와 빅데이터 특징(3V, 5V)
빅데이터 관련된 강의나 서적을 조금이라도 접해본 사람이라면
한번쯤은 접해봤을 개념에 대해 소개하고자 한다.
바로 DIKW와 3V, 5V이다.
DIKW 피라미드
DIKW의 의미
데이터(Data): 가공되기 전의 순수한 수치나 기호를 의미한다.
정보(Information): 데이터의 가공 및 처리를 통해 의미가 부여된 데이터를 의미한다.
지식(Knowledge): 정보의 구조화를 통해 도출되는 고유의 아이디어를 의미한다.
지혜(Wisdom): 지식의 축적과 아이디어가 결합된 창의적 산물을 의미한다.
DIKW 피라미드 구조
DIKW 피라미드의 구조에 대해서 과거에는 가치 위계 모형(Value Hierarchy Model)으로 보았다.
가치 위계 모형은 가치사슬모형(Value Chain Model)이라고도 하며, 데이터에서 위로 올라갈수록 가치가 올라간다.
즉, 데이터보보다 정보의 가치가 높고, 정보의 가치보다 지식의 가치가 높으며, 지식의 가치보다 지혜의 가치가 높다.
하지만, 빅데이터가 크게 발전한 현재에는 이러한 위계에 대한 의문을 갖는 경우가 늘고 있다.
관점에 따라서 정보나 지식보다 데이터 자체가 더 큰 가치를 창출한다고 볼 수 있기 때문이다.
빅데이터 분석기사를 공부하는 입장에서 DIKW 피라미드 구조의 의미보다는,
각각의 의미와 사례들을 학습하여 문제를 푸는 것이 중요하다.
→ 내가 풀었던 빅데이터 분석기사 자격증 관련 문제에서는 보통 예시가 주어지고, 그 예시가 DIKW 중 어떤 것에 해당하는지 물어봤다. 처음 풀게되면 헷갈리니, 꼭 문제를 풀어보면서 익히는 것을 추천!
빅데이터의 특징(3V, 5V)
빅데이터의 특징은 주로 3V(Volume, Variety, Velocity), 5V(Volume, Variety, Velocity, Veracity, Value)로 설명한다.
Volume(규모): 데이터의 규모가 매우 크다.
Variety(다양성): 다양한 유형의 데이터를 처리한다.
Velocity(속도): 데이터의 수집, 분석, 활용의 속도가 매우 빠르다.
Veracity(신뢰성): 데이터 처리를 통해 데이터의 신뢰성 확보한다.
Value(가치): 수집된 데이터를 처리함으로써 다양한 가치 창출을 한다.
→ 이와 관련해서는 주로 '다음 중 빅데이터의 특징에 해당하지 않는 것은?' 과 같은 문제를 접해왔다!