Certificación Online
Visión Artificial y Asistente de Voz en ESP32-S3
Domina la Arquitectura Edge AI (IA sin nube) para realizar aplicaciones de Visión Artificial, audio y TinyML con ESP32 y ESP-IDF.
Incluye (SIN COSTO) clases de nivelación de C/C++
Clases EN VIVO
Podrás resolver todas tus dudas en las clases ONLINE en vivo. Aula virtual de acceso ilimitado.
Hardware
Aprenderás a correr las prácticas en placas reales y recibirás libros oficiales de ayuda.
Certificado Internacional
Certificado internacional avalado por Espressif con verificación por Blockchain y OBv3.0
Descripción del Curso
Course Details
Instructor
M.T.I. Jorge Gutiérrez
Nivel
Intermedio
Duración
40 horas
Formato
Clases en vivo y asíncrono
Precio
$2,970 MXN ($156 USD) sin tarjeta y $3,770 con tarjeta ($198 USD)
Edge AI con ESP32
La ESP32-S3-EYE es una de las herramientas más potentes para el desarrollo de Edge AI (Inteligencia Artificial en el borde) gracias a las instrucciones vectoriales del chip S3, que aceleran el procesamiento de redes neuronales.
Permite ejecutar inferencia en tiempo real para modelos compactos
Certificado Avalado por Espressif Systems verificable por Blockchain
Podrás verificar tu certificado con la tecnología Blockchain, la cual hace tu certificado único e irrepetible, y te protege de alteraciones y falsificaciones.
Otorgamos certificados e insignias digitales bajo el estándar OB v3.0, el cual se alinea con el modelo de datos de credenciales verificables con un formato más enfocado a la empleabilidad.
Podrás compartir tu certificado e insignia digital en tus redes sociales como LinkedIn, así como integrar tu insignia digital en tu firma de correo electrónico, CV digital, y en cualquier lugar donde los demás puedan validar tus competencias y habilidades y realizar la verificación a través de Blockchain.

Problemas del mundo real
El material del curso y los exámentes de evaluación reflejan problemas del mundo real a los que se enfrenta en un trabajo profesional

Entrevistas laborales
Incluye clases donde desarrollarás las aptitudes necesarias para tener éxito en entrevistas de trabajo en el área tech y sistemas embebidos.
Impulsa tu carrera profesional
Adquiere aptitudes para los escenarios técnicos más demandados y retos técnicos críticos al que se enfrentan las organizaciones.
Enaltece tu perfil
Comparte tus credenciales digitales y habilidades desarrolladas en toda tu red profesional, sin dejar lugar a dudas sobre su valor y experiencia.
Contenido de la Certificación
Clases de nivelación C/C++
Clases de nivelación C/C++
Estudiaremos todas las bases del lenguaje C/C++. Si tienes conocimientos bases de estos lenguajes, aquí te enseñaremos las bases sin costo.
Fundamentos de Hardware y Captura de Imagen
Enfoque: Entender cómo la luz se convierte en datos digitales y cómo gestionarlos en la memoria del ESP32-S3.
Teoría y Fundamentos:
-
Arquitectura ESP32-S3: Diferencias con el ESP32 clásico, instrucciones vectoriales (SIMD) para aceleración de IA, gestión de memoria (SRAM vs PSRAM Octal).
-
Sensor de Imagen (OV2640/OV5640): Interfaces DVP vs CSI, formatos de píxel (RGB565, YUV422, Grayscale, JPEG), configuración de registros (resolución vs framerate).
-
Drivers y Buses: El componente
esp32-camera, configuración de pines y DMA (Direct Memory Access). Bus SPI para pantallas.
Prácticas:
– Práctica 1: “El Inspector de Cámara” (Camera Shutter Check)
- Objetivo: Crear proyecto vacío, integrar
esp32-camera, inicializar sensor y tomar un snapshot. - Resultado: Reporte en Serial Monitor de resolución, tamaño en bytes, formato y dirección de memoria del buffer.
– Práctica 2: “Visión Matricial” (ASCII Art)
- Objetivo: Acceso a píxeles crudos (RAW). Conversión de RGB565 a Escala de Grises (Luminancia). Algoritmo de mapeo de intensidad a caracteres ASCII.
- Resultado: Visualización de la imagen capturada renderizada como texto en la terminal serie en tiempo real.
– Práctica 3: “El Espejo Digital” (Integración LCD ST7789)
- Objetivo: Pipeline de video completo: Cámara (DVP) -> PSRAM -> SPI -> LCD. Configuración de
esp_lcdy manejo de buffers para evitar tearing.
Resultado: Un visor de cámara fluido en la pantalla de la tarjeta a 240×240 px.
Conectividad y Transmisión (IoT Video)
Enfoque: Sacar la imagen del dispositivo hacia el mundo exterior.
Teoría y Fundamentos:
- Protocolos de Streaming: HTTP vs WebSocket vs RTSP.
- Compresión: Concepto de MJPEG (Motion JPEG). Estructura de paquetes HTTP (Multipart responses).
- Optimización Wi-Fi: Modos de alto rendimiento para transmisión de datos masiva.
Prácticas:
– Práctica 4: Transmisión de Video en Tiempo Real (Video Streaming)
- Desarrollo: Crear un servidor HTTP ligero usando
esp_http_server. Implementar el handler GET para servir el stream MJPEG. - Caso de Uso: Dashcam para Robótica. Montar el ESP32 en un chasis móvil, permitiendo navegación FPV (First Person View) a través de Wi-Fi.
Visión Artificial Algorítmica (Sin Redes Neuronales)
Enfoque: Procesamiento clásico de imágenes para tareas rápidas y deterministas.
Teoría y Fundamentos:
-
Procesamiento de Imagen: Binarización, Detección de Bordes, Umbralización.
-
Decodificación de Patrones: Estándares QR y Code128. Librerías ligeras (Quirc / ZBar portado).
-
Detección de Movimiento: Algoritmos de diferencia de fotogramas (Frame Differencing) y regiones de interés (ROI).
Prácticas Sugeridas:
– Práctica 5: Seguridad y Vigilancia Inteligente
- Desarrollo: Implementar algoritmo de comparación de buffers (Frame actual vs Frame anterior). Si la diferencia de píxeles supera un umbral, disparar una alerta.
- Caso de Uso: Cámara de Seguridad Wi-Fi de Bajo Consumo. El sistema permanece en espera y solo transmite/graba cuando detecta cambios en la escena.
– Práctica 6: Lector Industrial de Códigos
- Desarrollo: Integrar librería de decodificación. Capturar frame, recortar ROI central, binarizar y pasar al decodificador.
- Caso de Uso: Lector de Códigos QR y Barras. Escanear un código de producto y enviar el ID a un servidor MQTT simulando un control de inventario.
Deep Learning con ESP-WHO (Detección y Reconocimiento)
Enfoque: Uso de Redes Neuronales Convolucionales (CNN) optimizadas por Espressif.
Teoría y Fundamentos:
- Redes Neuronales en el Borde: Qué es un Modelo (Pesos y Arquitectura). Cuantización (Float32 vs Int8) para microcontroladores.
- ESP-DL y ESP-WHO: Estructura de la librería ESP-WHO. Modelos incluidos (MNNet para detección, MobileFaceNet para reconocimiento).
- Pipeline de IA: Pre-procesamiento (Resize/Normalization) -> Inferencia -> Post-procesamiento (Non-max suppression).
Prácticas:
Práctica 7: Monitoreo de “Presencia Humana”
- Desarrollo: Implementar el modelo de Detección de Personas (Human Face/Body Detection).
- Caso de Uso: Ahorro Energético Inteligente. Si el modelo detecta una persona durante 10 segundos, activa un relé (LED); si no detecta a nadie por 1 minuto, apaga el sistema.
Práctica 8: Control de Acceso por Reconocimiento Facial
- Desarrollo: Pipeline de dos etapas: Detección de Rostro -> Alineación -> Extracción de ID (Embedding). Uso de NVS (Flash) para guardar los vectores de características de usuarios “Autorizados”.
- Caso de Uso: Cerradura Inteligente. Botón de “Enrolar” para guardar una cara nueva. Al detectar esa cara posteriormente, muestra “Acceso Concedido” en la LCD y mueve un servomotor.
Práctica 9: Interacción Humano-Máquina (HMI) sin contacto
- Desarrollo: Utilizar modelos de detección de manos y clasificación de landmarks (puntos clave de la mano).
- Caso de Uso: Detección de Gestos. Controlar el menú de la LCD (Arriba/Abajo/Seleccionar) simplemente moviendo la mano frente a la cámara (Palma abierta vs Puño cerrado).
TinyML y Modelos Personalizados
Enfoque: Salir de los modelos pre-fabricados de Espressif y crear soluciones propias.
Teoría y Fundamentos:
- Ciclo de Vida TinyML: Recolección de Datos -> Entrenamiento -> Conversión (TFLite) -> Despliegue (C++ Header).
- Plataformas: Introducción a Edge Impulse o TensorFlow Lite for Microcontrollers.
- Clasificación de Imágenes (Transfer Learning): Reutilizar redes como MobileNetV2 cortadas para tareas específicas.
Prácticas Sugeridas:
Práctica 10: Clasificación de Objetos Industriales
- Desarrollo: Recolectar dataset propio (ej. tuercas vs tornillos, o manzanas rojas vs verdes). Entrenar modelo en Edge Impulse. Exportar librería C++. Integrar en ESP-IDF.
- Caso de Uso: Clasificación en Línea de Ensamblaje. El sistema identifica qué objeto pasa y lo cuenta en la pantalla LCD.
Práctica 11: Digitalización de lo Analógico (OCR / Regresión)
- Desarrollo: Entrenar un modelo para reconocer la posición de una aguja o leer dígitos de 7 segmentos.
- Caso de Uso: Lectura de Medidores Analógicos. Apuntar la cámara a un manómetro y enviar el valor numérico (PSI/Bar) vía Wi-Fi.
Audio e Interacción por Voz (ESP-Skainet)
Enfoque: Aprovechar el micrófono digital de la tarjeta ESP32-S3-EYE.
Teoría y Fundamentos:
- Audio Digital: Protocolo I2S, PDM vs PCM. Frecuencia de muestreo.
- Procesamiento de Voz: Algoritmos AEC (Acoustic Echo Cancellation), NS (Noise Suppression), VAD (Voice Activity Detection).
- Modelos de Audio: Palabras clave (KWS – Keyword Spotting) y Redes Neuronales Recurrentes (RNN/LSTM) simplificadas.
Prácticas Sugeridas:
Práctica 12: Comandos de Voz Offline
- Desarrollo: Implementar
MultiNet(modelo de comandos de voz de Espressif). Definir comandos personalizados en español o inglés. - Caso de Uso: Asistente de Voz Local. Sistema que espera la palabra clave “Hi ESP” (Wake Word) y luego ejecuta comandos como “Encender Luz” (Switch inteligente).
Práctica 13: Seguridad Acústica
- Desarrollo: Entrenamiento o uso de red pre-entrenada para clasificación de espectrogramas de audio.
- Caso de Uso: Reconocimiento de Sonidos Anómalos. Monitor que ignora la voz humana pero dispara una alarma si detecta frecuencias de rotura de vidrio o alarmas de incendio.
Proyecto Integrador
Enfoque: Unir Visión, Audio, Conectividad y Gestión de Energía.
-
Práctica Final: El “Ojo” Autónomo Industrial
-
Desafío: Integrar lo aprendido.
-
Modo Deep Sleep por defecto.
-
Despertar por Audio (Ruido fuerte) o Timer.
-
Al despertar, tomar foto y analizar Ocupación de Espacios (contar personas).
-
Si hay cambios, conectarse a Wi-Fi y enviar telemetría e imagen.
-
Volver a dormir.
-
-
Objetivo: Demostrar dominio completo del hardware y software SDK.
-
Qué incluye
40 horas de clases online
Sesiones online EN VIVO
Presentaciones en PDF
Códigos de las prácticas
Guías de instalación
Acceso a la plataforma de alumnos 24/7
Libros de consulta
Requerimientos
-
Programación en C/C++ (Nivel Intermedio).
-
Conceptos básicos de electrónica digital (GPIO, SPI, I2C).
-
Familiaridad básica con entornos de desarrollo (VS Code).
Acerca de la certificación
Al finalizar el curso y aprobar el examen de certificación, obtendrás 2 certificados que avalan los conocimientos adquiridos. El primer certificado podrás rastrearlo y validarlo en la plataforma Dignal Academy, el segundo certificado podrás rastrearlo y validarlo en la página oficial de Espressif Systems, así como también en la plataforma verificadora por blockchain.
Tarjeta de Desarrollo ESP32-S3 EYE
Basada en el ESP32-S3 con conjunto de instrucciones vectoriales
Tarjeta ESP32-S3-EYE
Basada en el SoC ESP32-S3 de Espressif. Cuenta con una cámara de 2 megapíxeles, una pantalla LCD y un micrófono, que se utilizan para el reconocimiento de imágenes y el procesamiento de audio. ESP32-S3-EYE ofrece un amplio almacenamiento, con 8 MB de PSRAM octal y 8 MB de memoria flash. También admite la transmisión de imágenes por Wi-Fi.
Envío a cualquier parte del mundo
Envíos a cualquier parte del mundo por DHL y FedEx.
- ESP32-S3 Dual-Core con instrucciones vectoriales 100%
- Aceleración por hardware, inferencia en tiempo real 100%
- Cámara de 2 MP 100%
- Pantalla LCD 100%
- Acelerómetro 100%
- MicroSD card slot 100%
Fecha
14,15,21,22 y 28 de febrero, 7,8,14,15, 21 y 22 de marzo.
Días de clase
Sábado y Domingo
Número de sesiones
12 sesiones
Horario
11 am a 2 pm
Horas por clase
3 horas
Horas de curso
40 horas (36 en vivo + 4 asíncronas)
¿No se te acomoda la fecha?
Si no puedes conectarte a las clases online en vivo por tema de fecha y horario, con nuestra aula virtual puedes hacer el curso de forma asíncrona a tu ritmo.
Aula Virtual
Adicional a las clases online EN VIVO, tu inscripción también incluye acceso aula virtual de alumnos en donde podrás visualizar todas las clases grabadas y descargar las presentaciones y prácticas.
El descuento finaliza en:
Day(s)
:
Hour(s)
:
Minute(s)
:
Second(s)
Elige el Paquete que más te Convenga!
En la caja de tu carrito de compras podrás elegir la forma de pago que prefieras.
Adquiérelo ahora!
Aceptamos pago por tarjeta de Crédito y Débito a través de PayPal y Stripe. Aceptamos 3 meses sin intereses a través de PayPal y Mercado Pago con tarjetas de crédito participantes. También aceptamos pagos directamente por Apple Pay/ Google Pay, Link de Stripe y depósito o transferencia bancaria y depósito en tiendas Oxxo.
Pagos fuera de México: Aceptamos pago por tarjeta de Crédito y Débito a través de PayPal, Stripe y DollarApp. Puedes pagar con tarjeta sin tener cuenta PayPal. También aceptamos pagos por depósito en efectivo por Western Union.
Precios en Pesos Mexicanos (MXN) y Dólares Americanos (USD)
BASIC
$156 USD- De
$4,243.00 MXNa $2,970.00 MXN - De
$260 USDa $156 USD - Certificado al finalizar el curso
- Acceso al Aula Virtual de Alumnos
- Doble Certificado
- Certificado verificable por Blockchain
- Insignia de Certificación
PREMIUM
$198 USD- De
$6,270.00 MXNa $3,770.00 MXN - De
$330 USDa $198 USD - Certificado al finalizar el curso
- Acceso al Aula Virtual de Alumnos
- Tarjeta ESP32-S3-EYE
- Doble Certificado
- Certificado verificable por Blockchain
- Insignia de Certificación
¿Tienes dudas?
Contáctanos por WhatsApp, estaremos muy contentos de chatear contigo!
Únete a nuestro grupo de WhatsApp para recibir notificaciones de nuestros eventos gratuitos
Grupo WhatsApp
Acerca del Instructor
MTI. David Gutiérrez
Application Engineer
Desarrollador de múltiples herramientas de software para Microcontroladores y sistemas embebidos. Más de 12 años de experiencia en el área. Dentro de sus desarrollos se encuentran protocolos de comunicación IoT ultra ligeros para el sector privado, Tarjetas de Evaluación como Alteri, Xatellite, QuadX, así como sus respectivas UI. Software de monitoreo para aplicaciones TCP/IP y Bluetooth. Algoritmos para soluciones biomédicas y Machine Vision.
Empresas que han confiado en nosotros
Recibe en tu correo información de nuestros eventos
Recibe en tu correo electrónico información de nuestros cursos, eventos y nuevos lanzamientos.
Únete a nuestro canal de Telegram en donde podrás enterarte de nuestros eventos, becas, webinars y más.
Otros cursos que te pueden interesar
dsPIC Dual-Core DSP
Programación dsPIC Dual-Core y Procesamiento Digital de Señales DSP
Programación ARM SAMD21
Aprender a programar microcontroladores ARM SAMD21 en C
Pantallas HMI Nextion
Desarrollo con pantallas Touch HMI para aplicaciones electrónicas e industriales
ESP32 con Arduino
Aprende a programar ESP32 utilizando Arduino
¿El costo del curso incluye alguna tarjeta?
Si, el paquete premium incluye la tarjeta ESP32-S3-EYE. El paquete basic no incluye la tarjeta.
¿Cuál lenguaje de programación se utilizará en el curso?
Lenguaje C/C++ utilizando el SDK oficial de Espressif ESP-IDF.
¿Necesito conocimientos previos para tomar este curso?
Si, se recomiendan tener bases de programación en C y electrónica digital.
¿Cuál editor de texto se utilizará para realizar las prácticas?
Visual Studio Code.
¿Tiene algún costo adicional los programas a utilizar?
No, todos los programas que utilizaremos son sin costo.
¿Para quién está dirigido este curso?
Estudiantes, entusiastas, técnicos y profesionales de carreras a fines de tecnología.
¿En cuántas exhibiciones puedo pagar el curso?
Aceptamos 3 MESES SIN INTERESES a través de PayPal con tarjetas de crédito participantes. También puedes pagar directamente con nosotros (por depósito/transferencia bancaria y depósito en Oxxo) en 2 exhibiciones. Para más información mándanos un correo a cursos@dignal.com
Preguntas Frecuentes
Contáctanos si tienes más dudas
Contáctanos en cursos@dignal.com.
Estaremos felices de atenderte!
Curso Visión Artificial ESP32-S3

Escríbenos o llámanos! será un placer atenderte.
(+52) 9931196566



