TL;DR:
ラベル付き画像が少ないとき、MixUpという「画像を混ぜるテクニック」が驚くほど効きます。過学習防止にも効果あり!
MixUpとは?
pythonコピーする編集する# 画像A, B とそのラベル yA, yB を使って
lam = 0.7 # 混合比率
mixed_image = lam * imageA + (1 - lam) * imageB
mixed_label = lam * yA + (1 - lam) * yB
➡ 「2 つの画像とラベルを線形合成」して学習することで、
中間的なデータをモデルに学習させる技術。
なにが嬉しいの?
メリット | 内容 |
---|---|
🎯 少量データでも汎化しやすい | データの“間”を補完するので、決定境界が自然に |
🛡️ ラベルノイズや過学習を防ぐ | 極端な特徴に引っ張られにくくなる |
⚡ 実装超シンプル | NumPy / PyTorch 1 行で完結可能 |
覚えておこう!
「少ないデータしかない」時の最強コンボは、
転移学習 × MixUp augmentation!
特に分類タスクでは効果絶大です。