Stacking & Blending
1.Stacking
Introduction
스태킹(Stacking) 또는 stacked generalization으로 알려진 기법입니다. 현실 모델에 적용하는 경우는 적으나, 대회에서 높은 순위를 위해 많이 사용된다.
스태킹(Stacking) 또는 stacked generalization으로 알려진 기법입니다.
Silver Medal, 47th <Paracetamol> Team
가장 핵심 아이디어는 머신러닝 알고리즘으로 훈련 데이터셋을 통해 새로운 데이터셋을 만들고, 이를 데이터셋으로 사용하여 다시 머신러닝 알고리즘을 돌리는 것입니다. 보통은 서로 다른 타입의 모델들 을 결합합니다.
현실 모델에 적용하는 경우는 적으나, 대회에서 높은 순위를 위해 많이 사용됩니다.
이 노트북을 리뷰한 이유
스태킹에는 총 2가지 종류의 모델이 필요하다.
가장 핵심 아이디어는 머신러닝 알고리즘으로 훈련 데이터셋을 통해 새로운 데이터셋을 만들고, 이를 데이터셋으로 사용하여 다시 머신러닝 알고리즘을 돌리는 것입니다. 보통은 서로 다른 타입의 모델들 을 결합합니다.
가장 핵심적인 EDA, Feature Engineering, Ensemble을 다루며, 내용이 풍부하기에 리뷰하였습니다.
개별적인 기반 모델 : 성능이 비슷한 여러 개의 모델
최종 메타 모델 : 기반 모델이 만든 예측 데이터를 학습 데이터로 사용할 최종 모델
스태킹에는 총 2가지 종류의 모델이 필요합니다.
Mechanisms of Action (MoA) 예측
다시 정리해서 말하면 여러 개의 개별 모델들이 생성한 예측 데이터를 기반으로 최종 메타 모델이 학습할 별도의 학습 데이터 세트와 예측할 테스트 데이터 세트를 재 생성하는 기법다.
개별적인 기반 모델 : 성능이 비슷한 여러 개의 모델
최종 메타 모델 : 기반 모델이 만든 예측 데이터를 학습 데이터로 사용할 최종 모델
이 대회에서는 유전자 발현과 세포 생존 정보를 바탕으로 신약의 작용 메커니즘을 결정하는 모델을 개발합니다. 이 대회에서는 5,000개 이상의 약물에 대한 MoA 주석 외에도 유전자 발현과 세포 생존 데이터를 결합한 고유 한 데이터 세트에 접근할 수 있습니다.
모델을 통해 input을 만들고, 다시 모델에 넣는 구조때문에 meta-model 이라고도 부른다.
다시 정리해서 말하면 여러 개의 개별 모델들이 생성한 예측 데이터를 기반으로 최종 메타 모델이 학습할 별도의 학습 데이터 세트와 예측할 테스트 데이터 세트를 재 생성하는 기법입니다.
Last updated
Was this helpful?