English · Español
00 — El Panorama de Entrevistas en Laboratorios de IA en 2026¶
Mapa del loop de entrevistas en laboratorios de IA (AI) en 2026: pantalla telefónica, ML-systems, coding, lectura de paper, design, behavioral. Cada lab del
lynx-cortexmapea a uno o más tipos de ronda.
El loop estándar (Anthropic / OpenAI / DeepMind / Google Brain / xAI / Cohere / Mistral)¶
Un loop de AI-engineer / research-engineer en 2026 dura 5 a 7 horas, típicamente repartido en dos días:
| Ronda | Duración | Qué se puntúa |
|---|---|---|
| 0. Recruiter screen | 30 min | Señal del CV, encaje de rol/equipo, expectativas de compensación |
| 1. Phone / video screen | 60 min | Una pregunta de concepto ML + una pregunta de coding (LeetCode-medium o implementa-una-primitiva) |
| 2. ML systems | 60 min | Abierta: "diseña un chatbot para 10M DAU", matemáticas de capacidad, modos de fallo |
| 3. Coding (implementación) | 60 min | Implementa attention / BPE / LoRA / DPO loss en NumPy o PyTorch desde cero |
| 4. Paper / depth | 45-60 min | Lee un paper reciente (a veces pre-compartido, a veces en frío), discute fortalezas/debilidades |
| 5. Behavioral / values | 45 min | Anécdotas formato STAR; para Anthropic, espera "cuál es tu visión sobre la seguridad de IA" |
| 6. Hiring manager / bar raiser | 30-45 min | Calibración, te vende el equipo, saca preocupaciones |
Para puestos de research scientist, cambia la ronda 3 por un deep dive de proyecto de investigación (45 minutos presentando tu trabajo previo, 45 minutos de ellos sondeándolo).
Qué filtra realmente cada ronda¶
Phone screen — competencia baseline¶
- No es un filtro duro de astucia; filtra a candidatos que no saben qué es attention.
- La parte de coding es "¿puedes escribir código que compile?" no "¿puedes hacer golf de esto en 5 líneas?".
- Modo de fallo: gastar 45 minutos en la mitad de coding y 5 en el concepto. Son de peso igual.
ML systems — ¿puedes razonar bajo información parcial?¶
- No te darán los requisitos completos. Debes provocarlos.
- La habilidad puntuada: matemáticas de capacidad (ley de Little, tokens/s, presupuesto de memoria GPU), enumeración de modos de fallo (OOM, NCCL hang, throttling térmico), disciplina de coste (CpQU — coste por unidad de calidad).
- Ver
theory/02-systems-design-for-llms.mdpara los 5 prompts canónicos.
Coding — músculo de implementación¶
- El "filtro de profundidad". Muchos candidatos conocen attention conceptualmente pero no pueden escribir
softmax(Q @ K.T / sqrt(d_k)) @ Vdesde un archivo en blanco en 20 minutos. - Si te dejan usar PyTorch varía. Los phone screens de Anthropic suelen exigir NumPy; los on-sites permiten PyTorch.
- Ver
theory/04-coding-drills.mdpara los 12 drills básicos.
Paper read — ¿puedes leer como investigador?¶
- La habilidad puntuada: en 20 minutos, identificar (a) la claim, (b) el método, © lo que no está testado.
- Quieren escuchar "la ablation en §5.2 no controla por diferencias de tokenizer", no "el paper es impresionante".
- Ver
theory/03-paper-read-drill.mdpara el protocolo de 20 minutos en 4 papers canónicos.
Behavioral — gusto, juicio y ownership¶
- En Anthropic específicamente: espera "cuéntame de una vez que un modelo se comportó mal e investigaste".
- STAR es el formato, pero la sustancia es qué tradeoffs hiciste. "Envié X" es media respuesta; "envié X en vez de Y porque Z" es la respuesta completa.
- Ver
theory/05-behavioral-and-storytelling.mdpara 10 anécdotas pre-escritas desde el viaje de lynx-cortex.
Cómo los labs de lynx-cortex mapean a rondas de entrevista¶
| Artefacto Lab / Fase | Ronda de entrevista que prepara |
|---|---|
| Fase 04 — Calculus & Optimization | Phone screen (preguntas de gradiente); ronda de paper (derivación DPO) |
| Fase 07 — Scalar autograd | Ronda de coding (implementa backward) |
| Fase 08 — Tensor autograd | Ronda de coding (broadcasting, bugs de shape) |
| Fase 11 — Tokenization BPE | Ronda de coding (drill 02) |
| Fase 15 — Attention | Ronda de coding (drill 01), ML-systems (matemáticas de coste de attention) |
| Fase 16 — Positional encodings | Ronda de coding (drill 10 RoPE) |
| Fase 17 — Mini-GPT | Ronda de paper (Vaswani 2017) |
| Fase 19 — Training dynamics | Behavioral ("debug duro") |
| Fase 20 — Evaluation harness | ML-systems (eval offline vs online) |
| Fase 21 — Inference / sampling | Ronda de coding (drill 07 top-p) |
| Fase 22 — KV cache | Ronda de coding (drill 04), ML-systems (presupuesto de memoria) |
| Fase 26 — Quantization | ML-systems (coste por token) |
| Fase 27 — Modern attention | Ronda de coding (FlashAttention conceptual) |
| Fase 28 — LoRA / QLoRA | Ronda de coding (drill 05) |
| Fase 29 — RAG | ML-systems prompt 3 |
| Fase 32 — Agents | ML-systems prompt 2 |
| Fase 33 — Inference serving | ML-systems prompt 1, coding drill 12 (continuous batcher) |
| Fase 34 — Observability & cost | ML-systems (CpQU) |
| Fase 35 — Distributed | ML-systems (NCCL deadlock) |
| Fase 37 — Security & safety | Ronda behavioral de Anthropic |
| Fase 38 — MLOps | ML-systems (multi-tenant fine-tuning) |
| X3 — RLHF / DPO | Coding drill 06 (DPO loss), ronda de paper (Rafailov 2023) |
Lo que este módulo no cubre¶
- Grindeo de LeetCode. Usa NeetCode 150 por separado si tu rol exige DSA.
- Negociación de compensación. Usa
levels.fyiy un recruiter amigo. - Visado / inmigración. Fuera de alcance.
Archivo siguiente¶
→ 01-whiteboard-ml-questions.md: 25 preguntas, respuestas de 3 párrafos, árboles de follow-up de 3 niveles.