Acedly AI en Zoom: Copilot de Entrevista en Tiempo Real (2026)
Cómo funciona Acedly AI en Zoom: invisible en compartir pantalla, latencia menor a 200 ms, basado en tu CV y descripción del puesto. Qué verificar antes de tu próxima entrevista.
Devon Park
Head of Research, Acedly

Qué es realmente un asistente de entrevista en Zoom
Un asistente de entrevista en Zoom es una aplicación de escritorio — casi nunca una pestaña del navegador — que se sienta junto a tu cliente de Zoom durante una entrevista en vivo. Hace tres cosas en orden: captura el audio del entrevistador fuera del bucle del sistema, transcribe y razona sobre la pregunta, y muestra una respuesta en una superficie que está excluida de la canalización de compartición de pantalla de Zoom. Todo el bucle tiene que caber dentro del silencio entre el final de una pregunta y el momento en que un candidato normalmente comenzaría a hablar — alrededor de 200 milisegundos.
La razón por la que esta categoría tiene la forma que tiene vuelve a Zoom en sí. Zoom es la plataforma de entrevista occidental dominante en 2026, y la forma en que se ejecutan las entrevistas en Zoom — compartición de pantalla por defecto para rondas técnicas, vista de galería para rondas de panel, salas de descanso para diseño de sistemas — establece las restricciones que todo asistente tiene que satisfacer. Una herramienta que funciona en una llamada web genérica pero se rompe en el momento en que un entrevistador de Zoom pregunta « ¿puedes compartir tu pantalla? » no es un asistente de entrevista en Zoom. Es una demostración.
El número definitorio para esta categoría es la latencia de extremo a extremo, y el objetivo correcto es menos de 200 ms — medido desde la última sílaba de la pregunta del entrevistador hasta el primer carácter de la respuesta que aparece en tu pantalla. La mediana de Acedly en hardware de consumidor es aproximadamente 98 ms. Cualquier cosa por encima de 250 ms y visiblemente perderás el ritmo de la llamada.
Por qué Zoom sigue siendo la plataforma de entrevista occidental dominante en 2026
La cuota de minutos de entrevista profesional de Zoom no ha cambiado mucho desde el pico de 2022. Los invites del calendario de los reclutadores siguen siendo por defecto en Zoom para la primera ronda, la ronda técnica, y frecuentemente el resumen final del proceso. Microsoft Teams posee el bucle empresarial en finanzas y consultoría; Google Meet posee startups y organizaciones de producto; pero para la cola larga de contratación de mercado medio — la empresa SaaS, la Serie B, el reclutador transfronterizo que recluta candidatos de tres continentes — Zoom sigue siendo el camino de menor resistencia.
Algunos patrones son lo suficientemente específicos de Zoom como para dar forma a lo que un asistente tiene que manejar:
- Compartir pantalla es la opción predeterminada para rondas técnicas. Los reclutadores esperan que los candidatos compartan una pestaña de sandbox de codificación o, cada vez más, todo el escritorio. Este último es el caso más arriesgado para cualquier asistente de entrevista — una herramienta que oculta una ventana pero se revela cuando se selecciona « Pantalla completa » está a medio hacer.
- Vista de galería frente a vista de orador cambia con qué frecuencia la cámara web del candidato se centra. En una ronda de panel en vista de galería, el reclutador a menudo mira la dirección de la vista del candidato. Un asistente que vive en la misma pantalla que la cámara web te empuja la mirada fuera de cámara; un asistente en un segundo monitor te mantiene mirando hacia adelante.
- Las salas de descanso se utilizan para rondas de diseño de sistemas. Un ingeniero senior salta a una sala de descanso con el candidato para usar el pizarrón. El enrutamiento de audio a través de salas de descanso es idéntico a la sala principal desde la perspectiva del sistema operativo, pero algunas herramientas de pestaña de navegador fallan porque tratan las salas de descanso como nuevas sesiones.
- Existen versiones de Zoom para Gobierno y Zoom para Educación. Tienen ciclos de actualización ligeramente diferentes e interfaces de compartición de pantalla ocasionalmente diferentes. Un asistente que solo se verifica en la versión de Zoom de consumidor eventualmente te sorprenderá en una entrevista de contratista federal.
La conclusión: Específico de Zoom no significa « funciona en Zoom ». Significa « verificado contra las superficies reales de Zoom con las que se encuentra un candidato ».
Cómo funciona un asistente de entrevistas con IA en Zoom específicamente
La tubería de extremo a extremo de un copiloto en tiempo real es la misma en todas las plataformas de reuniones — capturar audio, transcribir, anclar, inferir, renderizar — pero cada eslabón se adapta a la plataforma subyacente. En Zoom, tres componentes son específicos de la plataforma: la ruta de audio, la exclusión de renderizado e integración con las propias funciones de IA de Zoom.
Captura de audio: macOS vs. Windows
En macOS, el asistente utiliza la interfaz de loopback de Core Audio o, en macOS 14+, las APIs de audio de ScreenCaptureKit para suscribirse a la salida de audio del sistema. Esto significa que escucha todo lo que Zoom está reproduciendo en tus altavoces — la voz del entrevistador — sin necesidad de extensiones del núcleo o dispositivos de audio virtuales. La aplicación de escritorio de Zoom enruta el audio del entrevistador a través de la ruta de audio estándar de Apple, por lo que un asistente correctamente construido lo captura de la misma manera que las propias herramientas de grabación de pantalla de Apple.
En Windows, el equivalente es el modo loopback de WASAPI. El asistente abre un IMMDevice en modo render-loopback y lee el mismo búfer en el que Zoom está escribiendo en tus altavoces. El cliente de Zoom para Windows coopera con esto; no aísla su audio del loopback del sistema como lo hacen algunas aplicaciones protegidas por DRM.
La implicación práctica: un asistente de escritorio nativo captura el audio de Zoom de manera limpia. Una herramienta de pestaña del navegador no puede, porque los navegadores no tienen acceso al loopback del sistema sin permiso explícito del usuario para «compartir una pestaña con audio» — y no puedes pedirle al reclutador que habilite eso. Esta es la razón más importante por la que las herramientas de entrevistas en pestaña del navegador son un callejón sin salida en Zoom.
Por qué una herramienta de pestaña del navegador falla en Zoom
Las pestañas del navegador ven el audio de su propia página, no del sistema. Una herramienta de entrevista de pestaña del navegador tiene que pedirte que ejecutes Zoom dentro del navegador (lo que pierde funciones como la vista de galería y las reacciones), o tiene que confiar en que tu micrófono capte al entrevistador a través de los altavoces — lo que es ruidoso, lento y se rompe si usas auriculares. Las herramientas de escritorio nativas evitan ambos problemas. La razón completa por la que un asistente debe ser una aplicación nativa es que esta ruta de audio es el piso, no el techo.
Renderizado: cómo se mantiene fuera de la tubería de pantalla compartida de Zoom
El sistema de pantalla compartida de Zoom, en ambas plataformas de escritorio, se construye sobre las APIs de captura de ventana del sistema operativo. En macOS eso significa CGWindowList y ScreenCaptureKit; en Windows significa Desktop Duplication API y Graphics Capture API. El asistente se retira de estos configurando NSWindowSharingNone (macOS) y SetWindowDisplayAffinity(WDA_EXCLUDEFROMCAPTURE) (Windows). Cuando Zoom le pide al sistema operativo una lista de ventanas, el asistente no aparece en ella. Cuando Zoom captura todo el escritorio, el sistema operativo omite la ventana excluida en el búfer de captura.
Este es el mismo mecanismo que oculta video DRM de capturas de pantalla. Es una garantía a nivel del sistema operativo, no un truco a nivel de aplicación. Un asistente correctamente construido no puede aparecer accidentalmente en un compartir de Zoom — pero una herramienta que no usa estas banderas nunca puede estar oculta, sin importar lo que digan los reclamos de marketing.
Integración con Zoom AI Companion
Zoom AI Companion (anteriormente Zoom IQ) es la función de auto-resumen propia de Zoom. Transcribe el audio de la reunión y produce un resumen que el anfitrión puede revisar posteriormente. Lo que debes entender es qué puede y qué no puede ver AI Companion. Transcribe el audio de la reunión — el mismo audio que Zoom ya está enrutando — lo que significa que ve lo que dijo el entrevistador y lo que tú dijiste en tu micrófono. No ve tu interfaz local. No ve tu segundo monitor. No ve Acedly. AI Companion es un servicio de transcripción, no un monitor de escritorio.
Lista de verificación de sigilo específica de Zoom
El sigilo en Zoom es binario, no un espectro. El entrevistador ve al asistente o no lo ve, y hay seis superficies específicas de Zoom donde se realiza la prueba. Un asistente de entrevista por Zoom serio pasa los seis en la compilación de Zoom que tu entrevistador está usando realmente.
-
Excluido del selector "Share Screen → Window" de Zoom. Cuando el candidato hace clic en "Share Screen", Zoom muestra una cuadrícula de ventanas de aplicación disponibles. El asistente no debe aparecer en esa cuadrícula. Este es el modo de fallo más común para herramientas mal construidas: se ocultan durante el compartir pero aparecen en el selector, lo que le da al candidato dos segundos para ver la fila incorrecta antes de darse cuenta del error.
-
Oculto cuando se comparte el escritorio completo. El compartir "Entire Screen" en Zoom captura todo lo que el SO muestra en ese monitor. El asistente debe excluirse a nivel de captura del SO para que incluso un compartir de pantalla completa no lo revele. Aquí es donde
NSWindowSharingNoneyWDA_EXCLUDEFROMCAPTURErealmente valen la pena. -
No aparece en la lista "App Window" de Zoom. Distinto del selector: esta es la barra de herramientas dentro del compartir que permite al candidato cambiar qué ventana se está compartiendo durante la entrevista. Un asistente que se oculta en el compartir inicial pero reaparece en el selector está a un clic de ser visto.
-
No aparece en las grabaciones de Zoom. Las grabaciones locales de Zoom y las grabaciones en la nube se extraen del mismo búfer de captura que la vista del anfitrión. Las ventanas excluidas de captura no aparecen en ninguna. La implicación para el candidato es que una repetición de entrevista (incluyendo una que AI Companion genera automáticamente) nunca muestra el asistente.
-
Oculto en las reacciones en la reunión de Zoom y los resaltados del cursor. Algunas características de Zoom (el cursor resaltado, la superposición de anotaciones "dibujar en la pantalla compartida") se renderizan encima de la región compartida. Un asistente correctamente oculto está debajo de todo eso: se excluye en la fuente, no solo se coloca visualmente en capas.
-
Compatible con compilaciones Zoom for Government / Zoom for Education. Estas compilaciones tienen rutas de código separadas compatibles con FedRAMP o FERPA. Las API de captura de ventana que utilizan son las mismas, por lo que un asistente construido correctamente funciona allí también, pero la verificación debe ocurrir en las compilaciones reales, no solo en Zoom para consumidores.
La forma correcta de verificar cualquiera de esto es no leer la página de marketing. Es iniciar una llamada de Zoom con un amigo, compartir tu pantalla de las tres formas (una ventana de aplicación, el escritorio, el monitor secundario), y hacer que te digan qué pueden ver. Cualquier cosa visible para el amigo es visible para el reclutador.
Comparación: cómo las herramientas de entrevista por Zoom realmente difieren
La mayoría de los productos que aparecen bajo los resultados de búsqueda "Zoom AI" son una de cuatro cosas, y solo una de ellas es un asistente de entrevista por Zoom real. Aquí está la comparación que usamos internamente.
| Feature | Acedly | IA de pestaña del navegador | Asistentes de grabación de pantalla | Chat de IA genérico |
|---|---|---|---|---|
| Latencia de extremo a extremo mediana en Zoom | ~98 ms | ~600–900 ms | Solo después de la llamada | ~2–4 segundos |
| Sigilo en el compartir pantalla de Zoom | Excluido a nivel de captura del SO | Solo pestaña del navegador (falla en pantalla completa) | Visible en la reproducción de la grabación | No (solo otra ventana) |
| Lee sandbox de codificación en pantalla | Coderpad, HackerRank, LeetCode, etc. | Limitado al mismo navegador | Sí, pero después de la llamada | Solo pegado manual |
| Fundamentado en tu currículum y descripción del trabajo | Sí, por defecto | A veces | N/A (después de la llamada) | Solo si pegas |
| Funciona en salas de grupo de Zoom | Sí (la ruta de audio es idéntica) | A menudo reinicia la sesión | Sí (graba la sala) | N/A |
| Visible para Zoom AI Companion | No (solo IU local) | No | No | No |
La lectura honesta de esta tabla es que las herramientas de pestaña del navegador y el chat de IA genérico no están en la misma categoría que un asistente de entrevista por Zoom real. Comparten palabras clave pero no capacidades. Los asistentes de grabación de pantalla son útiles para autorrevisión después, no en tiempo real. La categoría de Acedly es la estrecha donde las cuatro columnas — latencia, sigilo, fundamentación y lectura de pantalla — tienen que resolverse simultáneamente.
Qué hacer en los 10 minutos antes de tu entrevista por Zoom
Bien configurarse en cinco minutos es mejor que tener un excelente copiloto en una llamada incómoda. Los candidatos que sacan el máximo provecho de cualquier asistente de entrevista por Zoom son los que tratan el lanzamiento como una lista de verificación, no como algo que descubrir bajo presión.
- Prueba el uso compartido de pantalla con un amigo en la compilación de Zoom que usarás. Veinte minutos antes de la llamada, abre una reunión de prueba de Zoom, comparte tu pantalla de tres formas (One Window, Entire Screen, Second Monitor), y confirma que el amigo no ve nada que no debería. Este es el paso más importante que puedes realizar.
- Practica tu atajo de teclado dos veces en silencio. El fallo más común durante la llamada es equivocarse con el atajo de teclado porque nunca lo has usado bajo presión. Dos repeticiones limpias desarrollarán la memoria muscular.
- Verifica tu nivel de entrada del micrófono. El control automático de ganancia de Zoom a veces amplifica un golpe en el escritorio al volumen de habla. Abre la configuración de audio de Zoom, pronuncia una frase y comprueba que el medidor de entrada esté en la banda verde.
- Elige Gallery view si es una ronda de panel, Speaker view si es una entrevista individual. Gallery view es la opción predeterminada para paneles porque el reclutador espera ver a todos los entrevistadores. Speaker view mantiene al que pregunta centrado — mejor para rondas técnicas donde observas la cara del entrevistador.
- Mueve Acedly a tu segundo monitor. Este es el movimiento más importante para controlar lo que revelas. Si Acedly está en el mismo monitor que la ventana de Zoom, tu línea de visión se desviará. En un segundo monitor, tu mirada permanece en la cámara y el asistente permanece periférico.
- Cierra cualquier cosa que no quieras compartir accidentalmente. Aunque Acedly está excluido del uso compartido de pantalla, tu ventana de Slack y tu correo electrónico borrador no lo están. Práctica estándar.
- Ten tu currículum abierto en texto plano. No para el asistente — Acedly ya lo tiene. Para ti, en caso de que el reclutador te pregunte algo específico sobre el currículum y quieras echar un vistazo.
Privacidad: lo que la grabación de Zoom ve vs. lo que ve tu entrevistador
Los dos niveles de «lo que se ve» en Zoom son fáciles de confundir y la diferencia importa para cualquier evaluación honesta de un asistente de entrevista.
La capa de uso compartido de pantalla en vivo es lo que el entrevistador ve en tiempo real. Todo en este artículo — las seis superficies de sigilo, el selector de compartición, la compartición de pantalla completa — trata de esta capa. Un asistente correctamente construido es invisible aquí en el nivel de captura del SO. El entrevistador no puede ver Acedly durante la llamada.
La capa de grabación es lo que se guarda si el anfitrión tiene habilitada la grabación en la nube o local. Las grabaciones de Zoom — incluido el resumen de AI Companion generado automáticamente — se producen a partir del mismo búfer de captura que ve el anfitrión. Las ventanas excluidas de captura tampoco aparecen en la grabación, porque el SO nunca las puso en el búfer en primer lugar.
Es importante ser claro sobre Zoom AI Companion, porque los candidatos a menudo se preocupan. AI Companion transcribe el audio de la reunión (micrófono del entrevistador + candidato) y produce un resumen. No tiene acceso a la pantalla local del candidato, al segundo monitor del candidato, o a ningún proceso que se ejecute en la máquina del candidato. Es un servicio de transcripción. La propiedad relevante de Acedly es que todo lo que genera vive en la interfaz de usuario local del candidato y nunca entra en el audio de la reunión — Acedly no habla en tu micrófono.
El enfoque honesto: un reclutador que revisa una grabación de Zoom después ve exactamente lo que vio en vivo. No obtiene una segunda visualización privilegiada que revele el asistente. La exclusión de captura es el mismo mecanismo en ambos casos.