데이터스케일링1 [빅데이터분석기사 기출11] 파생변수와 변수변환(로그/지수변환, 비닝, 더미변수화, 스케일링) 데이터를 사용할 때에는 분석 기획에 맞도록 적절하게 변수를 재정의하거나, 분석방법에 맞게 변수를 연속형 또는 범주형 데이터로 변환하는 과정이 필요하다. 오늘 포스팅에서는 파생변수 생성방법과 변수변환 방법을 살펴봄으로써 필요한 데이터를 처리하는 방법을 공유하고자 한다. 파생변수 정의 : 기존 변수에 함수, 조건문 등을 사용하여 재정의한 변수 파생변수 생성 방법 1. 변수 분해 : 기존 데이터를 분해하여 일부만 사용하는 방법 ex) '서울특별시마포구' → '서울특별시' 2. 변수 결합 : 두 개 이상의 변수를 결합하여 사용하는 방법 ex) 키, 몸무게, 나이 데이터를 이용하여 비만도 계산 3. 조건문 사용 : 특정 조건에 따라 기존변수를 재정의하는 방법 ex) 성적데이터를 90점 이상이면 A, 80~90점이.. 2023. 2. 12. 이전 1 다음