(I410-113-24-02-088004046) 데이터 분석을 잘하기 위해서 데이터 분석에 들어가기 전에 데이터 전처리가 매우 중요한데 그중에 이상치와 결측치 처리가 있다. 정상적인 범위를 벗어난 데이터인 이상치를 판단하기 위하여 데이터의 제3사분위수와 제1사분위수의 차이인 IQR의 1.5배를 제1사분위수에서 뺀 값부터 IQR의 1.5배를 제3사분위수에 더한 값까지의 범위를 벗어난 값으로 이상치를 삼는 것이 일반적이다. 이를 위해 이러한 작업을 시각적으로 표현해주는 상자 수염 도표를 이용하면 편리하다. 결측치는 데이터 값이 알려지지 않은 것인데 해당 열이나 행을 삭제하거나 결측치를 다른 값으로 대체하는 방식으로 처리한다. 이때 데이터의 삭제나 대체로 전체 데이터가 교란되지 않도록 주의해야 한다.