El Espejismo de la Abundancia: Por Qué la Data Augmentation Exige Más Que Intuición
El artículo explora cómo la *data augmentation*, tradicionalmente basada en la intuición, debe evolucionar hacia un enfoque riguroso que considere las invariancias implícitas en cada transformación de datos. Destaca que cada modificación de datos implica un supuesto sobre qué aspectos son irrelevantes para la etiqueta final, y que estos supuestos pueden ser beneficiosos o destructivos según la tarea. Se enfatiza la importancia crítica de validar estas transformaciones para evitar la corrupción de la señal informativa, incluso si la etiqueta técnica permanece inalterada. Finalmente, aboga por un diseño consciente y validado de los pipelines de *augmentation* para construir modelos más robustos y generalizables.

