Resumen
Aprende el flujo completo del reconocimiento de imágenes: datasets, transformaciones, arquitecturas convolucionales, métricas y un mini-despliegue para probar tu modelo entrenado.
Resultados de aprendizaje
- Crear pipelines reproducibles de preprocesamiento y augmentation.
- Entrenar y evaluar CNNs y aplicar transfer learning.
- Interpretar métricas (accuracy, F1, ROC) y evitar errores comunes.
- Exportar y ejecutar un modelo en una mini-app o script.
Contenidos (12 semanas)
Mes 1 — Fundamentos de visión
- Espacios de color, resize, normalización.
- Data augmentation: flips, crops, brillo/contraste.
- CNNs: convolución, pooling, activaciones.
- Álgebra lineal aplicada I: vectores, matrices y operaciones básicas.
Mes 2 — Modelado
- Arquitecturas base (VGG/ResNet — visión panorámica).
- Transfer learning y fine-tuning.
- Métricas, curvas y regularización.
- Álgebra lineal aplicada II: productos matriciales, tensores y capas lineales.
Mes 3 — Pulido y prueba
- Buenas prácticas y seguimiento de experimentos.
- Exportar y probar tu modelo con demo.
- Presentación de proyectos.
- Álgebra lineal aplicada III: interpretación geométrica y relación con el espacio de características.
Requisitos
- Nociones de Python (listas, funciones, paquetes).
- Laptop personal (8 GB RAM mínimo recomendado).
Preguntas frecuentes
¿Puedo cubrir más del 50% con trabajo?
El tope estándar es 50%. Casos especiales se revisan con
coordinación académica y disponibilidad de proyectos.