목차 개요 이번 포스트에서는 Response surface methodology (RSM) 반응표면법에 대해서 알아본다. 또한 전체적인 개념을 그려놓아야 이해가 쉽기에 로드맵 형식으로 작성해볼까 한다. 정의 RSM(Response Surface Methodology)은 시스템의 응답을 최적화하는데 사용되는 실험계획법과 회귀 모델링을 포함하는 방법론 그렇다. RSM은 Methodology 방법론이었다. 총 네가지의 프로세스를 거쳐 시스템 성능최적화와 응답 표현을 분석한다. 각 프로세스에 대해 (로드맵) Design of Experiments (DoE) 실험 데이터를 수집하기 위한 적절한 실험 설계를 선택하고 구성합니다. 이를 통해 시스템의 응답에 영향을 주는 주요 변수들과 그들 사이의 관계를 조사합니다. ..
Machine Learning
목차 개요 이번 포스트에서는 RSM방법론 중 3번째 프로세스인 Model Evaluation방식 중 예측성능을 시각적으로 나타내는 Scatter plot 산점도를 통한 방식에 대해 알아본다. 잔차 대비 예측 값 산점도 y축에 잔차(실제 값 - 예측 값)를, x축에 예측 값을 표시 이를 통해 잔차의 분포와 예측 값 사이의 관계를 살펴볼 수 있습니다. 만약 모델이 데이터를 잘 적합하고 있다면, 잔차는 x축 주변에 무작위로 분포해야 합니다. 잔차에 패턴이 있다면, 모델이 데이터의 일부 패턴을 포착하지 못한 것으로 간주할 수 있다. x 축 주변에 무작위 분포하는 모습을 볼 수 있다. 실제 값 대비 예측 값 산점도 y축에 실제 값을, x축에 예측 값을 표시 이를 통해 실제 값과 예측 값 사이의 관계를 살펴볼 수 ..
목차 개요 이번 포스트에서는 RSM방법론 중 3번째 프로세스인 Model Evaluation방식 중 예측성능 수치화에 이용되는 MAR,MARR MaxAR,MaxARR 에 대해 알아본다. Mean of Absolute Residuals (MAR) 잔차의 절대값의 평균으로, 예측 오차를 양수로 취급하여 모델의 전반적인 오차를 평가 이 값이 작을수록 모델이 데이터를 더 정확하게 예측하고 있다고 판단할 수 있다. MAR을 계산하는 공식은 다음과 같다. MAR = (Σ|y_i - ŷ_i|) / n 여기서 y_i는 실제 관측값, ŷ_i는 회귀 모델에 의한 예측값, n은 관측값의 개수 Mean of Absolute Relative Residuals (MARR) 절대값 잔차의 평균을 실제 값으로 나눈 후에 평균을 구합..
목차 개요 이번 포스트에서는 RSM방법론 중 3번째 프로세스인 Model Evaluation방식중 가장 많이 쓰이는 R2 결정계수에 대해 알아본다. SST, SSR, SSE 개념 SST (Sum of Squares Total) 전체 변동성을 의미하며, 종속 변수(y)의 개별 값이 평균과 얼마나 차이가 있는지의 제곱합 SST = Σ(y_i - ȳ)^2 여기서 y_i는 종속 변수의 i번째 관측값, ȳ는 종속 변수의 평균 SSR (Sum of Squares Regression) 회귀 변동성을 의미하며, 회귀 모델에 의해 예측된 값이 종속 변수의 평균과 얼마나 차이가 있는지의 제곱합 SSR = Σ(ŷ_i - ȳ)^2 여기서 ŷ_i는 회귀 모델에 의한 i번째 관측값의 예측값 SSE (Sum of Square..
목차 개요 이번 포스트에서는 머신러닝에서 중요한 훈련 데이터(training data)와 테스트 데이터(testing data)에 대해 알아보고 그 차이에 대ㅐ해서도 알아다. 개념 훈련 데이터 기계 학습 알고리즘이 학습하기 위해 사용되는 데이터로, 알고리즘의 파라미터를 조정하고 모델 성능을 최적화하는 데 사용된다. 테스트 데이터 모델이 새로운 데이터에 얼마나 잘 일반화하는지 평가하기 위해 사용되며, 이를 통해 과적합을 감지할 수 있다. 훈련 데이터와 테스트 데이터를 나누는 것은 모델의 일반화 성능을 평가하기 위한 중요한 과정이다. 머신러닝에서의 데이터셋 머신러닝에서 훈련 데이터와 테스트 데이터를 나누고 사용하는 구체적인 방법은 다음과 같다. 데이터셋 분할 전체 데이터셋을 훈련 데이터와 테스트 데이터로 나..
목차 개요 이번 포스트에서는 RSM방법론 중 1번째 프로세스인 DoE의 방법론중 FFD(부분 요인 설계)에 대해 알아본다. 기본 개념 DoE의 일종으로, 모든 가능한 요인 조합을 실험하지 않고 일부만 선택하여 실험하는 기법 이 방법은 고차원 문제에서 시간과 비용을 절약할 수 있으며, 주요한 효과와 상호 작용을 식별하는 데 사용된다. FFD의 기본 개념은 k개의 요인을 조사할 때, 각 요인이 l개의 수준을 가지고 있다고 가정한다. 이 때, 모든 요인의 조합을 실험하려면 l^k 번의 실험을 수행해야 하지만, FFD를 사용하면 적은 수의 실험만으로도 요인들의 영향을 추정할 수 있다. 주요 개념은 generator, defining relation, resolution 등이 있다. Generator 실험의 구조..