Acedly AI 在 Zoom 上:Zoom 实时面试 Copilot (2026)
Acedly AI 在 Zoom 上的工作原理——隐藏于屏幕共享、端到端延迟低于 200 毫秒、基于你的简历和职位描述。跨 Zoom 共享模式的隐蔽性验证,以及下次 Zoom 面试前的测试清单。
Devon Park
Head of Research, Acedly

Zoom 面试助手实际上是什么
Zoom 面试助手是一个桌面应用程序 — 几乎永远不是浏览器标签页 — 在现场面试期间坐在你的 Zoom 客户端旁边。它按顺序做三件事:从系统回路中捕获面试官的音频,转录并推理问题,并在 Zoom 屏幕共享管道之外的界面上呈现答案。整个循环必须在问题结束和候选人通常开始说话的时刻之间的沉默中完成 — 大约 200 毫秒。
这个类别的形成方式归根结底源于 Zoom 本身。Zoom 是 2026 年西方占主导地位的面试平台,Zoom 面试的运行方式 — 技术轮共享屏幕作为默认行为、小组轮库视图、系统设计分组讨论室 — 设定了每个助手必须满足的约束条件。一个在通用网络通话上能用但在 Zoom 面试官问「你能共享屏幕吗?」时就崩溃的工具,根本不是 Zoom 面试助手。它只是一个演示。
这个类别的决定性指标是端到端延迟,正确的目标是 200 毫秒以下 — 从面试官问题的最后一个音节到你屏幕上出现答案的第一个字符的时间。Acedly 在消费级硬件上的中位数大约是 98 毫秒。任何超过 250 毫秒的延迟都会导致你在通话节奏中明显掉队。
为什么 Zoom 仍然是 2026 年西方占主导地位的面试平台
自 2022 年峰值以来,Zoom 在专业面试分钟数中的份额变化不大。招聘人员的日历邀请在第一轮、技术轮以及常常在综合评估中仍然默认使用 Zoom。Microsoft Teams 占据了金融和咨询的企业循环;Google Meet 占据了初创公司和产品团队;但对于中端市场招聘的长尾部分 — SaaS 公司、B 轮融资、跨越三个大陆吸引候选人的全球招聘人员 — Zoom 仍然是阻力最小的选择。
有些模式特定于 Zoom,足以塑造助手必须处理的内容:
- 共享屏幕是技术轮的默认行为。 招聘人员期望候选人共享编码沙盒标签页或越来越多地整个桌面。后者对任何面试助手来说风险更大 — 隐藏一个窗口但在选择「整个屏幕」时显示的工具是半成品。
- 库视图与演讲者视图改变了候选人摄像头被聚焦的频率。 在库视图的小组轮中,招聘人员常常会看你的眼神。一个与摄像头在同一屏幕上的助手会把你的视线推离镜头;一个在第二显示器上的助手让你保持朝前看。
- 分组讨论室用于系统设计轮。 一名资深工程师进入分组讨论室与候选人一起进行白板讨论。分组讨论室的音频路由从操作系统的角度与主房间相同,但一些浏览器标签页工具会失败,因为它们将分组讨论室视为新会话。
- Zoom for Government 和 Zoom for Education 版本存在。 它们的更新节奏略有不同,有时屏幕共享 UI 也不同。一个仅在消费者 Zoom 版本上验证的助手最终会在联邦承包商面试中给你带来意外。
结论:Zoom 特定不等于「在 Zoom 上工作」。它意味着「在候选人实际遇到的 Zoom 界面上验证」。
AI 面试助手在 Zoom 上的工作原理
实时 copilot 的端到端管道在每个会议平台上都是相同的 — 捕捉音频、转录、定位、推理、渲染 — 但每个环节都会根据底层平台而调整。在 Zoom 上,有三个部分是平台特定的:音频路径、渲染排除和与 Zoom 自有 AI 功能的集成。
音频捕捉:macOS vs. Windows
在 macOS 上,助手使用 Core Audio 的环回接口,或在 macOS 14+ 上,使用 ScreenCaptureKit 音频 API 来订阅系统音频输出。这意味着它能听到 Zoom 正在播放到你扬声器中的任何内容 — 面试官的声音 — 无需内核扩展或虚拟音频设备。Zoom 桌面应用通过标准 Apple 音频路径路由面试官音频,所以正确构建的助手以与 Apple 自己的屏幕录制工具相同的方式捕捉它。
在 Windows 上,等效的是 WASAPI 的环回模式。助手以渲染环回模式打开 IMMDevice,并读取 Zoom 写入到你扬声器的同一缓冲区。Zoom Windows 客户端与此配合;它不会像某些受 DRM 保护的应用程序那样隔离系统环回的音频。
实际上的含义:本机桌面助手能干净地捕捉 Zoom 音频。浏览器标签页工具做不到,因为浏览器在没有明确用户权限"共享带有音频的标签页"的情况下无法访问系统环回 — 而你不能要求招聘人员启用这个功能。这是浏览器标签页面试工具在 Zoom 上是死路一条的最大原因。
为什么浏览器标签页工具在 Zoom 上失败
浏览器标签页只能听到自己页面的音频,而不是系统音频。浏览器标签页面试工具要么必须要求你在浏览器中运行 Zoom(这会丧失网格视图和反应等功能),要么必须依赖你的麦克风通过扬声器拾取面试官的声音 — 这很吵、很慢,而且如果你使用耳机就会中断。本机桌面工具绕过了这两个问题。助手应该是本机应用的整个原因是这个音频路径是底线,而不是天花板。
渲染:它如何保持在 Zoom 屏幕共享管道之外
Zoom 的屏幕共享系统在两个桌面平台上都是基于操作系统的窗口捕捉 API 构建的。在 macOS 上,这意味着 CGWindowList 和 ScreenCaptureKit;在 Windows 上,这意味着 Desktop Duplication API 和 Graphics Capture API。助手通过设置 NSWindowSharingNone(macOS)和 SetWindowDisplayAffinity(WDA_EXCLUDEFROMCAPTURE)(Windows)来选择退出。当 Zoom 向操作系统请求窗口列表时,助手不会出现在其中。当 Zoom 捕捉整个桌面时,操作系统会在捕捉缓冲区中跳过排除的窗口。
这与隐藏 DRM 视频不被截屏的机制相同。这是一个操作系统级别的保证,而不是应用程序级别的技巧。正确构建的助手不可能意外出现在 Zoom 共享中 — 但不使用这些标志的工具永远无法被隐藏,无论营销宣传如何。
与 Zoom AI Companion 的集成
Zoom AI Companion(前身为 Zoom IQ)是 Zoom 自有的自动摘要功能。它转录会议音频并生成主持人事后可以审查的摘要。需要理解的是 AI Companion 能看到什么和看不到什么。它转录会议音频 — Zoom 已经路由的相同音频 — 这意味着它会看到面试官说了什么以及你对着麦克风说了什么。它看不到你的本地用户界面。它看不到你的第二台显示器。它看不到 Acedly。AI Companion 是一个转录服务,而不是桌面监视器。
Zoom 特定的隐蔽性检查清单
Zoom 上的隐蔽性是二元的,而不是频谱。面试官要么能看到助手,要么看不到,在 Zoom 的六个特定界面上需要通过测试。一个真正的 Zoom 面试助手需要在您的面试官实际使用的 Zoom 版本上通过所有六项。
-
从 Zoom 的"屏幕共享 → 窗口"选择器中排除。 当候选人点击"屏幕共享"时,Zoom 会显示可用应用程序窗口的网格。助手不能出现在该网格中。这是半成品工具最常见的失败模式——它们在共享期间隐藏,但在选择器中出现,这给候选人两秒钟时间看到错误的选项,然后才会意识到出错了。
-
在共享整个桌面时隐藏。 Zoom 上的"整个屏幕"共享会捕获该显示器上操作系统显示的所有内容。助手必须在操作系统捕获级别被排除,这样即使是整个屏幕共享也不会暴露它。这就是
NSWindowSharingNone和WDA_EXCLUDEFROMCAPTURE真正发挥作用的地方。 -
不会出现在 Zoom 的"应用窗口"共享列表中。 这与选择器不同——这是屏幕共享中的工具栏,让候选人在面试中间切换正在共享的窗口。在初始共享时隐藏但在切换器中重新出现的助手,只需一次点击就会被看到。
-
不会出现在 Zoom 录制中。 本地 Zoom 录制和云录制都来自主机视图看到的同一个捕获缓冲区。被排除捕获的窗口不会出现在这两种录制中。这对候选人意味着,面试回放——包括 AI Companion 自动生成的——永远不会显示助手。
-
在 Zoom 的会议反应和光标强调中隐藏。 一些 Zoom 功能(聚光灯光标、"在共享屏幕上绘制"注释叠加层)在共享区域的顶部呈现。正确隐藏的助手在所有这些之下——它在源头被排除,而不是仅通过视觉分层隐藏。
-
与 Zoom for Government / Zoom for Education 版本兼容。 这些版本具有单独的符合 FedRAMP 或 FERPA 的代码路径。它们使用的窗口捕获 API 是相同的,因此正确构建的助手也能在那里工作——但验证必须在实际版本上进行,而不仅仅是在消费者 Zoom 上。
验证这些内容的正确方法不是阅读营销页面。而是与朋友开始 Zoom 通话,以三种方式中的每一种共享您的屏幕(一个应用窗口、桌面、副显示器),并让他们告诉您他们能看到什么。朋友能看到的任何东西,招聘人员也能看到。
比较:Zoom 面试工具实际上如何不同
在"Zoom AI"搜索结果中出现的大多数产品是四种事物之一,其中只有一个是真正的 Zoom 面试助手。以下是我们在内部使用的比较。
| Feature | Acedly | Browser-tab AI | Screen-recorder copilots | Generic AI chat |
|---|---|---|---|---|
| Median end-to-end latency on Zoom | ~98 ms | ~600–900 ms | Post-call only | ~2–4 seconds |
| Stealth on Zoom screen share | Excluded at OS capture level | Browser tab only (fails on Entire Screen) | Visible in recording playback | No (just another window) |
| Reads coding sandbox on screen | Coderpad, HackerRank, LeetCode, etc. | Limited to same browser | Yes, but post-call | Manual paste only |
| Grounded in your résumé and JD | Yes, by default | Sometimes | N/A (post-call) | Only if you paste |
| Works in Zoom breakout rooms | Yes (audio path is identical) | Often resets session | Yes (records the room) | N/A |
| Visible to Zoom AI Companion | No (local UI only) | No | No | No |
坦诚地说,根据这个表格,浏览器标签工具和通用 AI 聊天与真正的 Zoom 面试助手不在同一类别中。它们共享关键词,但功能各异。屏幕录制 copilot 对事后审查很有用,但不适合实时使用。Acedly 的类别很狭窄,因为需要同时解决延迟、隐蔽性、背景信息和屏幕阅读这四个方面。
Zoom 面试前 10 分钟该做什么
五分钟的准备工作胜过在尴尬通话中拥有出色的 copilot。从任何 Zoom 面试助手中获得最大收益的候选人是那些将启动视为检查清单而不是在压力下临时应对的人。
- 在你将使用的实际 Zoom 版本上与朋友测试屏幕共享。 在通话前二十分钟,打开 Zoom 测试会议,以三种方式共享你的屏幕(一个窗口、整个屏幕、第二个显示器),并确认朋友看不到任何不应该看到的内容。这是你能做的最有价值的事情。
- 在安静的环境中练习你的热键两次。 通话中最常见的失败是因为你从未在压力下使用过热键而手忙脚乱。两次干净的重复能建立肌肉记忆。
- 验证你的麦克风输入电平。 Zoom 的自动增益控制有时会将桌面敲击放大到"语音"音量。打开 Zoom 音频设置,说一句话,检查输入电平是否在绿色范围内。
- 如果是小组面试,选择库视图;如果是一对一,选择演讲者视图。 库视图是小组面试的默认设置,因为招聘人员希望看到所有面试官。演讲者视图将提问者保持在中心——更适合技术轮面试,在这种情况下你观察面试官的表情。
- 将 Acedly 移到你的第二个显示器。 这是最关键的一步。如果 Acedly 与 Zoom 窗口在同一显示器上,你的眼睛会不经意地往那边看。在第二个显示器上,你的目光保持在摄像头上,助手保持在视线边缘。
- 关闭任何你不想意外共享的内容。 即使 Acedly 被排除在屏幕共享之外,你的 Slack 窗口和草稿邮件也不会。这是基本操作。
- 用纯文本打开你的简历。 不是为了助手——Acedly 已经有了。是为了你,以防招聘人员提问一些与简历相关的具体细节,你可以快速查看。
隐私:Zoom 录制能看到什么 vs. 你的面试官能看到什么
Zoom 上"能看到什么"的两个层次很容易混淆,而这种区别对任何真实评估面试助手都至关重要。
实时屏幕共享层是面试官实时看到的内容。本文中的所有内容——六个隐形表面、共享选择器、整个桌面共享——都涉及这一层。一个设计得当的助手在操作系统捕获级别是不可见的。面试官在通话中看不到 Acedly。
录制层是当主持人启用云存储或本地录制时保存的内容。Zoom 录制——包括自动生成的 AI Companion 摘要——从主持人看到的相同捕获缓冲区生成。被排除的窗口也不会出现在录制中,因为操作系统从未将其放入缓冲区。
Zoom AI Companion 值得明确说明,因为候选人经常担心。AI Companion 转录会议音频(面试官 + 候选人麦克风)并生成摘要。它无法访问候选人的本地屏幕、候选人的第二显示器或在候选人机器上运行的任何进程。它是一项转录服务。Acedly 的相关属性是它生成的所有内容都存在于候选人的本地用户界面中,永远不会进入会议音频——Acedly 不会对你的麦克风说话。
坦白地说:招聘人员在后续审查 Zoom 录制时看到的内容与他们实时看到的完全相同。他们无法通过录制发现助手的存在。捕获排除在两种情况下都采用相同的机制。