audio.{speaker}.webm
Eine Opus-Spur pro Teilnehmer. WebRTC-SSRC-keyed, namensgetaggt vom Meeting-Roster. Keine Mischung.
01 · meeting bot api
heute verfügbarPauschal $0,30/Std. Audio pro Sprecher, Captions, Chat — in Ihren Bucket. POST eine Google-Meet-, Microsoft-Teams- oder Zoom-URL; bekommen Sie saubere Aufnahmen über signierten Webhook zurück.
übersicht
Das ist, was wir heute ausliefern. Ein einzelner REST-Endpoint, der eine Meeting-URL nimmt und eine Job-ID zurückgibt. Dahinter: ein Bun + Drizzle-Orchestrator dispatcht einen Puppeteer-getriebenen Chrome-Bot in einem Docker-Container, der Bot tritt dem Meeting als regulärer Gast-Tile bei, fängt Audio pro Sprecher über das WebRTC-SSRC-Mapping ab, scrapt Captions (oder liest den Meet-Datakanal, wo er existiert) und lädt alles in den S3-kompatiblen Bucket hoch, den Sie beim Anlegen Ihres Kontos nominiert haben.
Wenn der Host geht, der Bot rausgeworfen wird oder das Meeting endet, bekommen Sie einen einzelnen signierten Webhook mit dem Manifest-Pfad. Kein proprietäres Container-Format. Kein «Loggen Sie sich in unser Portal ein, um herunterzuladen». Dateien leben in Ihrem Bucket, unter Ihrer Retention-Policy, unter Ihren KMS-Schlüsseln. Wir berechnen pro Meeting-Minute, nicht pro Meeting — ein 17-Minuten-Anruf sind 8,5 Cent.
Anti-Bot ist das, worüber niemand sonst spricht. Wir betreiben einen rotierenden Pool von Workspace-Bot-Konten, um Googles April-2026-Dual-Queue-Admit-Screen zu klären. Jeder Retry verwendet einen unauffälligeren Chrome-Fingerprint via Tier-Eskalation in der Trigger.dev-Task-Konfiguration — keine custom Retry-Loops, keine wackeligen for-Loops um fetch. Die Bot-Container sind Single-Purpose und ephemer.
was ihr zurückbekommt
Eine Opus-Spur pro Teilnehmer. WebRTC-SSRC-keyed, namensgetaggt vom Meeting-Roster. Keine Mischung.
VP9-Tab-Aufnahme via x11grab. Was ein Zuschauer sehen würde, inklusive geteilter Bildschirme. Bitrate konfigurierbar.
Newline-delimited JSON, eine Zeile pro finalisiertem Utterance mit speakerId + Start/End ms.
Eingehende Meeting-Chat-Nachrichten, sender-attributed und timestamped. Gleiche Form über Meet/Teams/Zoom.
Index jeder Datei plus Teilnehmer-Roster, Meeting-Metadaten, Sub-Code beim Exit und ein Content-Hash pro Artefakt.
Signierter Webhook (HMAC-SHA256 über den Body), wenn das Manifest hochgeladen ist. Wir wiederholen bei Nicht-2xx mit exponentiellem Backoff via Queue.