English · Español
Fase 34 — Cuestionarios¶
🇪🇸 Espejo legible del banco de preguntas; la fuente canónica es
data/quizzes/phase-34-observability-cost.yaml.
q-34-01 — ¿Por qué request_id es crítico (load-bearing)?¶
Respuesta libre. Las respuestas aceptables contienen correlate.
Sin request_id no puedes reconstruir la secuencia end-to-end de una petición — las líneas de log de peticiones concurrentes se entrelazan de forma indistinguible.
q-34-02 — A escala del tutor de gramática §A13, ¿qué domina el coste auto-alojado?¶
- Cargos de API por token
- Electricidad para mover la CPU durante el forward pass ← correcto
- Tarifas de alquiler de GPU
- Almacenamiento S3 para los ficheros de log
Por qué: El auto-alojamiento no tiene cargo por token; el coste marginal son los pocos vatio-segundo de tiempo de CPU.
q-34-03 — ¿Qué métricas se necesitan para el dashboard de coste por petición?¶
- tutor_requests_total (counter) ← correcto
- tutor_compute_seconds_total (counter) ← correcto
- tutor_concurrent_inflight (gauge) ← correcto
- cpu_thermal_throttle_events_total (counter)
q-34-04 — RPS estable del tutor en el portal §A14?¶
- ~0.001 RPS
- ~0.3 - 1 RPS ← correcto
- ~100 RPS
- ~10000 RPS
Ver theory/04-dollar-per-token-and-rps-budget.md para la derivación.