Certificación Online

 

Visión Artificial y Asistente de Voz en ESP32-S3

Domina la Arquitectura Edge AI (IA sin nube) para realizar aplicaciones de Visión Artificial, audio y TinyML con ESP32 y ESP-IDF.

Incluye (SIN COSTO) clases de nivelación de C/C++

Clases EN VIVO

Podrás resolver todas tus dudas en las clases ONLINE en vivo. Aula virtual de acceso ilimitado.

Hardware

Aprenderás a correr las prácticas en placas reales y recibirás libros oficiales de ayuda.

Certificado Internacional

Certificado internacional avalado por Espressif con verificación por Blockchain y OBv3.0

Descripción del Curso

40% de DESCUENTO válido hasta el 13 de febrero 2026

Este curso sumerge al estudiante en el mundo del Edge AI (Inteligencia Artificial en el Borde), centrándose en la visión artificial y el procesamiento de audio directamente en el microcontrolador, sin depender de la nube. Utilizando la potente tarjeta ESP32-S3-EYE, los estudiantes aprenderán a capturar, pre-procesar y analizar imágenes y audio utilizando redes neuronales convolucionales optimizadas.

Prácticas que aprenderás a desarrollar:

  • Control de Acceso por Reconocimiento Facial: Crear una cerradura inteligente que solo se abra al reconocer rostros autorizados.
  • Lector de Códigos QR y Barras: Implementar escáneres para inventarios o validación de tickets.
  • Detección de Gestos: Usar la mano para controlar dispositivos (ej. subir volumen, pasar diapositivas).
  • Clasificación de Objetos: Entrenar un modelo ligero (usando Edge Impulse o TensorFlow Lite Micro) para distinguir entre productos en una línea de ensamblaje.
  • Asistente de Voz Local: Crear un interruptor inteligente que responda a comandos como “Luz encendida” o “Abrir persianas”.
  • Reconocimiento de Sonidos Anómalos: Un monitor de seguridad que detecte el sonido de cristales rotos o el llanto de un bebé
  • Cámara de Seguridad Wi-Fi de Bajo Consumo: detección de movimiento por software para activar la transmisión de video solo cuando ocurra algo.
  • Dashcam para Robótica: Montar la tarjeta en un robot móvil para tener una vista.
  • Lectura de Medidores Analógicos: Usar la cámara para tomar fotos de medidores de agua o gas antiguos y procesar la imagen para digitalizar la lectura mediante OCR (Reconocimiento Óptico de Caracteres).
  • Sensor de Ocupación de Espacios: Para oficinas inteligentes o estacionamientos, determinando si un lugar está ocupado mediante el análisis de imagen local.
  • Detector de gatos para dispensador automático de alimentos: garantiza que el sistema funcione incluso si se cae el Wi-Fi y protege la privacidad de tu hogar.

Course Details

Instructor

M.T.I. Jorge Gutiérrez

Nivel

Intermedio

Duración

40 horas

Formato

Clases en vivo y asíncrono 

Precio

$2,970 MXN ($156 USD) sin tarjeta y $3,770 con tarjeta ($198 USD)

 

Edge AI con ESP32

La ESP32-S3-EYE es una de las herramientas más potentes para el desarrollo de Edge AI (Inteligencia Artificial en el borde) gracias a las instrucciones vectoriales del chip S3, que aceleran el procesamiento de redes neuronales.

Permite ejecutar inferencia en tiempo real para modelos compactos

Certificado Avalado por Espressif Systems verificable por Blockchain

 

Podrás verificar tu certificado con la tecnología Blockchain, la cual hace tu certificado único e irrepetible, y te protege de alteraciones y falsificaciones.

Otorgamos certificados e insignias digitales bajo el estándar OB v3.0, el cual se alinea con el modelo de datos de credenciales verificables con un formato más enfocado a la empleabilidad.

Podrás compartir tu certificado e insignia digital en tus redes sociales como LinkedIn, así como integrar tu insignia digital en tu firma de correo electrónico, CV digital, y en cualquier lugar donde los demás puedan validar tus competencias y habilidades y realizar la verificación a través de Blockchain.

Problemas del mundo real

El material del curso y los exámentes de evaluación reflejan problemas del mundo real a los que se enfrenta en un trabajo profesional

Entrevistas laborales

Incluye clases donde desarrollarás las aptitudes necesarias para tener éxito en entrevistas de trabajo en el área tech y sistemas embebidos.

Impulsa tu carrera profesional

Adquiere aptitudes para los escenarios técnicos más demandados y retos técnicos críticos al que se enfrentan las organizaciones.

Enaltece tu perfil

Comparte tus credenciales digitales y habilidades desarrolladas en toda tu red profesional, sin dejar lugar a dudas sobre su valor y experiencia.

Contenido de la Certificación

Clases de nivelación C/C++

Clases de nivelación C/C++

Estudiaremos todas las bases del lenguaje C/C++. Si tienes conocimientos bases de estos lenguajes, aquí te enseñaremos las bases sin costo.

Fundamentos de Hardware y Captura de Imagen

Enfoque: Entender cómo la luz se convierte en datos digitales y cómo gestionarlos en la memoria del ESP32-S3.

Teoría y Fundamentos:

  • Arquitectura ESP32-S3: Diferencias con el ESP32 clásico, instrucciones vectoriales (SIMD) para aceleración de IA, gestión de memoria (SRAM vs PSRAM Octal).

  • Sensor de Imagen (OV2640/OV5640): Interfaces DVP vs CSI, formatos de píxel (RGB565, YUV422, Grayscale, JPEG), configuración de registros (resolución vs framerate).

  • Drivers y Buses: El componente esp32-camera, configuración de pines y DMA (Direct Memory Access). Bus SPI para pantallas.

Prácticas:

– Práctica 1: “El Inspector de Cámara” (Camera Shutter Check)

  • Objetivo: Crear proyecto vacío, integrar esp32-camera, inicializar sensor y tomar un snapshot.
  • Resultado: Reporte en Serial Monitor de resolución, tamaño en bytes, formato y dirección de memoria del buffer.

– Práctica 2: “Visión Matricial” (ASCII Art)

  • Objetivo: Acceso a píxeles crudos (RAW). Conversión de RGB565 a Escala de Grises (Luminancia). Algoritmo de mapeo de intensidad a caracteres ASCII.
  • Resultado: Visualización de la imagen capturada renderizada como texto en la terminal serie en tiempo real.

– Práctica 3: “El Espejo Digital” (Integración LCD ST7789)

  • Objetivo: Pipeline de video completo: Cámara (DVP) -> PSRAM -> SPI -> LCD. Configuración de esp_lcd y manejo de buffers para evitar tearing.

Resultado: Un visor de cámara fluido en la pantalla de la tarjeta a 240×240 px.

Conectividad y Transmisión (IoT Video)

Enfoque: Sacar la imagen del dispositivo hacia el mundo exterior.

Teoría y Fundamentos:

  • Protocolos de Streaming: HTTP vs WebSocket vs RTSP.
  • Compresión: Concepto de MJPEG (Motion JPEG). Estructura de paquetes HTTP (Multipart responses).
  • Optimización Wi-Fi: Modos de alto rendimiento para transmisión de datos masiva.

Prácticas:

– Práctica 4: Transmisión de Video en Tiempo Real (Video Streaming)

  • Desarrollo: Crear un servidor HTTP ligero usando esp_http_server. Implementar el handler GET para servir el stream MJPEG.
  • Caso de Uso: Dashcam para Robótica. Montar el ESP32 en un chasis móvil, permitiendo navegación FPV (First Person View) a través de Wi-Fi.
Visión Artificial Algorítmica (Sin Redes Neuronales)

Enfoque: Procesamiento clásico de imágenes para tareas rápidas y deterministas.

Teoría y Fundamentos:

  • Procesamiento de Imagen: Binarización, Detección de Bordes, Umbralización.

  • Decodificación de Patrones: Estándares QR y Code128. Librerías ligeras (Quirc / ZBar portado).

  • Detección de Movimiento: Algoritmos de diferencia de fotogramas (Frame Differencing) y regiones de interés (ROI).

Prácticas Sugeridas:

– Práctica 5: Seguridad y Vigilancia Inteligente

  • Desarrollo: Implementar algoritmo de comparación de buffers (Frame actual vs Frame anterior). Si la diferencia de píxeles supera un umbral, disparar una alerta.
  • Caso de Uso: Cámara de Seguridad Wi-Fi de Bajo Consumo. El sistema permanece en espera y solo transmite/graba cuando detecta cambios en la escena.

– Práctica 6: Lector Industrial de Códigos

  • Desarrollo: Integrar librería de decodificación. Capturar frame, recortar ROI central, binarizar y pasar al decodificador.
  • Caso de Uso: Lector de Códigos QR y Barras. Escanear un código de producto y enviar el ID a un servidor MQTT simulando un control de inventario.
Deep Learning con ESP-WHO (Detección y Reconocimiento)

Enfoque: Uso de Redes Neuronales Convolucionales (CNN) optimizadas por Espressif.

Teoría y Fundamentos:

  • Redes Neuronales en el Borde: Qué es un Modelo (Pesos y Arquitectura). Cuantización (Float32 vs Int8) para microcontroladores.
  • ESP-DL y ESP-WHO: Estructura de la librería ESP-WHO. Modelos incluidos (MNNet para detección, MobileFaceNet para reconocimiento).
  • Pipeline de IA: Pre-procesamiento (Resize/Normalization) -> Inferencia -> Post-procesamiento (Non-max suppression).

Prácticas:

Práctica 7: Monitoreo de “Presencia Humana”

  • Desarrollo: Implementar el modelo de Detección de Personas (Human Face/Body Detection).
  • Caso de Uso: Ahorro Energético Inteligente. Si el modelo detecta una persona durante 10 segundos, activa un relé (LED); si no detecta a nadie por 1 minuto, apaga el sistema.

Práctica 8: Control de Acceso por Reconocimiento Facial

  • Desarrollo: Pipeline de dos etapas: Detección de Rostro -> Alineación -> Extracción de ID (Embedding). Uso de NVS (Flash) para guardar los vectores de características de usuarios “Autorizados”.
  • Caso de Uso: Cerradura Inteligente. Botón de “Enrolar” para guardar una cara nueva. Al detectar esa cara posteriormente, muestra “Acceso Concedido” en la LCD y mueve un servomotor.

Práctica 9: Interacción Humano-Máquina (HMI) sin contacto

  • Desarrollo: Utilizar modelos de detección de manos y clasificación de landmarks (puntos clave de la mano).
  • Caso de Uso: Detección de Gestos. Controlar el menú de la LCD (Arriba/Abajo/Seleccionar) simplemente moviendo la mano frente a la cámara (Palma abierta vs Puño cerrado).
TinyML y Modelos Personalizados

Enfoque: Salir de los modelos pre-fabricados de Espressif y crear soluciones propias.

Teoría y Fundamentos:

  • Ciclo de Vida TinyML: Recolección de Datos -> Entrenamiento -> Conversión (TFLite) -> Despliegue (C++ Header).
  • Plataformas: Introducción a Edge Impulse o TensorFlow Lite for Microcontrollers.
  • Clasificación de Imágenes (Transfer Learning): Reutilizar redes como MobileNetV2 cortadas para tareas específicas.

Prácticas Sugeridas:

Práctica 10: Clasificación de Objetos Industriales

  • Desarrollo: Recolectar dataset propio (ej. tuercas vs tornillos, o manzanas rojas vs verdes). Entrenar modelo en Edge Impulse. Exportar librería C++. Integrar en ESP-IDF.
  • Caso de Uso: Clasificación en Línea de Ensamblaje. El sistema identifica qué objeto pasa y lo cuenta en la pantalla LCD.

Práctica 11: Digitalización de lo Analógico (OCR / Regresión)

  • Desarrollo: Entrenar un modelo para reconocer la posición de una aguja o leer dígitos de 7 segmentos.
  • Caso de Uso: Lectura de Medidores Analógicos. Apuntar la cámara a un manómetro y enviar el valor numérico (PSI/Bar) vía Wi-Fi.
Audio e Interacción por Voz (ESP-Skainet)

Enfoque: Aprovechar el micrófono digital de la tarjeta ESP32-S3-EYE.

Teoría y Fundamentos:

  • Audio Digital: Protocolo I2S, PDM vs PCM. Frecuencia de muestreo.
  • Procesamiento de Voz: Algoritmos AEC (Acoustic Echo Cancellation), NS (Noise Suppression), VAD (Voice Activity Detection).
  • Modelos de Audio: Palabras clave (KWS – Keyword Spotting) y Redes Neuronales Recurrentes (RNN/LSTM) simplificadas.

Prácticas Sugeridas:

Práctica 12: Comandos de Voz Offline

  • Desarrollo: Implementar MultiNet (modelo de comandos de voz de Espressif). Definir comandos personalizados en español o inglés.
  • Caso de Uso: Asistente de Voz Local. Sistema que espera la palabra clave “Hi ESP” (Wake Word) y luego ejecuta comandos como “Encender Luz” (Switch inteligente).

Práctica 13: Seguridad Acústica

  • Desarrollo: Entrenamiento o uso de red pre-entrenada para clasificación de espectrogramas de audio.
  • Caso de Uso: Reconocimiento de Sonidos Anómalos. Monitor que ignora la voz humana pero dispara una alarma si detecta frecuencias de rotura de vidrio o alarmas de incendio.
Proyecto Integrador

Enfoque: Unir Visión, Audio, Conectividad y Gestión de Energía.

  1. Práctica Final: El “Ojo” Autónomo Industrial

    • Desafío: Integrar lo aprendido.

      • Modo Deep Sleep por defecto.

      • Despertar por Audio (Ruido fuerte) o Timer.

      • Al despertar, tomar foto y analizar Ocupación de Espacios (contar personas).

      • Si hay cambios, conectarse a Wi-Fi y enviar telemetría e imagen.

      • Volver a dormir.

    • Objetivo: Demostrar dominio completo del hardware y software SDK.

Qué incluye

40 horas de clases online

Sesiones online EN VIVO

Presentaciones en PDF

Códigos de las prácticas

Guías de instalación

Acceso a la plataforma de alumnos 24/7

Libros de consulta

Requerimientos

  • Programación en C/C++ (Nivel Intermedio).

  • Conceptos básicos de electrónica digital (GPIO, SPI, I2C).

  • Familiaridad básica con entornos de desarrollo (VS Code).

Acerca de la certificación

Al finalizar el curso y aprobar el examen de certificación, obtendrás 2 certificados que avalan los conocimientos adquiridos. El primer certificado podrás rastrearlo y validarlo en la plataforma Dignal Academy, el segundo certificado podrás rastrearlo y validarlo en la página oficial de Espressif Systems, así como también en la plataforma verificadora por blockchain.

Tarjeta de Desarrollo ESP32-S3 EYE

Basada en el ESP32-S3 con conjunto de instrucciones vectoriales

Tarjeta ESP32-S3-EYE

Basada en el SoC ESP32-S3 de Espressif. Cuenta con una cámara de 2 megapíxeles, una pantalla LCD y un micrófono, que se utilizan para el reconocimiento de imágenes y el procesamiento de audio. ESP32-S3-EYE ofrece un amplio almacenamiento, con 8 MB de PSRAM octal y 8 MB de memoria flash. También admite la transmisión de imágenes por Wi-Fi.

Envío a cualquier parte del mundo

Envíos a cualquier parte del mundo por DHL y FedEx.

  • ESP32-S3 Dual-Core con instrucciones vectoriales 100% 100%
  • Aceleración por hardware, inferencia en tiempo real 100% 100%
  • Cámara de 2 MP 100% 100%
  • Pantalla LCD 100% 100%
  • Acelerómetro 100% 100%
  • MicroSD card slot 100% 100%

Fecha

14,15,21,22 y 28 de febrero, 7,8,14,15, 21 y 22 de marzo.

Días de clase

Sábado y Domingo

I

Número de sesiones

12 sesiones

Horario

11 am a 2 pm

Horas por clase

3 horas

Horas de curso

40 horas (36 en vivo + 4 asíncronas)

¿No se te acomoda la fecha?

Si no puedes conectarte a las clases online en vivo por tema de fecha y horario, con nuestra aula virtual puedes hacer el curso de forma asíncrona a tu ritmo.

Aula Virtual

Adicional a las clases online EN VIVO, tu inscripción también incluye acceso aula virtual de alumnos en donde podrás visualizar todas las clases grabadas y descargar las presentaciones y prácticas.

El descuento finaliza en:

Day(s)

:

Hour(s)

:

Minute(s)

:

Second(s)

Elige el Paquete que más te Convenga!

En la caja de tu carrito de compras podrás elegir la forma de pago que prefieras.

Adquiérelo ahora!

Aceptamos pago por tarjeta de Crédito y Débito a través de PayPal y Stripe. Aceptamos 3 meses sin intereses a través de PayPal y Mercado Pago con tarjetas de crédito participantes. También aceptamos pagos directamente por Apple Pay/ Google Pay, Link de Stripe y depósito o transferencia bancaria y depósito en tiendas Oxxo.

Pagos fuera de México: Aceptamos pago por tarjeta de Crédito y Débito a través de PayPal, Stripe y DollarApp. Puedes pagar con tarjeta sin tener cuenta PayPal. También aceptamos pagos por depósito en efectivo por Western Union.

Precios en Pesos Mexicanos (MXN) y Dólares Americanos (USD)

¿Tienes dudas?

Contáctanos por WhatsApp, estaremos muy contentos de chatear contigo!

Únete a nuestro grupo de WhatsApp para recibir notificaciones de nuestros eventos gratuitos

Grupo WhatsApp

Acerca del Instructor

MTI. David Gutiérrez

Application Engineer

Desarrollador de múltiples herramientas de software para Microcontroladores y sistemas embebidos. Más de 12 años de experiencia en el área. Dentro de sus desarrollos se encuentran protocolos de comunicación IoT ultra ligeros para el sector privado, Tarjetas de Evaluación como Alteri, Xatellite, QuadX, así como sus respectivas UI. Software de monitoreo para aplicaciones TCP/IP y Bluetooth. Algoritmos para soluciones biomédicas y Machine Vision.

Empresas que han confiado en nosotros

Recibe en tu correo información de nuestros eventos

 

Recibe en tu correo electrónico información de nuestros cursos, eventos y nuevos lanzamientos. 

Únete a nuestro canal de Telegram en donde podrás enterarte de nuestros eventos, becas, webinars y más.

Canal Telegram

Otros cursos que te pueden interesar

dsPIC Dual-Core DSP

Programación dsPIC Dual-Core y Procesamiento Digital de Señales DSP

WIFI con PIC MQTT

Programación ARM SAMD21

Aprender a programar microcontroladores ARM SAMD21 en C

Pantallas HMI Nextion

Desarrollo con pantallas Touch HMI para aplicaciones electrónicas e industriales

tarjeta PIC18F4550 USB

ESP32 con Arduino

Aprende a programar ESP32 utilizando Arduino

¿El costo del curso incluye alguna tarjeta?

Si, el paquete premium incluye la tarjeta ESP32-S3-EYE. El paquete basic no incluye la tarjeta.

¿Cuál lenguaje de programación se utilizará en el curso?

Lenguaje C/C++ utilizando el SDK oficial de Espressif ESP-IDF.

¿Necesito conocimientos previos para tomar este curso?

Si, se recomiendan tener bases de programación en C y electrónica digital.

¿Cuál editor de texto se utilizará para realizar las prácticas?

Visual Studio Code.

¿Tiene algún costo adicional los programas a utilizar?

No, todos los programas que utilizaremos son sin costo.

¿Para quién está dirigido este curso?

Estudiantes, entusiastas, técnicos y profesionales de carreras a fines de tecnología.

¿En cuántas exhibiciones puedo pagar el curso?

Aceptamos 3  MESES SIN INTERESES a través de PayPal con tarjetas de crédito participantes. También puedes pagar directamente con nosotros (por depósito/transferencia bancaria y depósito en Oxxo) en 2 exhibiciones. Para más información mándanos un correo a cursos@dignal.com

Preguntas Frecuentes

Contáctanos si tienes más dudas

Contáctanos en cursos@dignal.com.
Estaremos felices de atenderte!

Curso Visión Artificial ESP32-S3

WhatsApp

Escríbenos o llámanos! será un placer atenderte.

(+52) 9931196566

Correo de contacto

cursos@dignal.com