English · Español

Fase 34 — Cuestionarios¶

🇪🇸 Espejo legible del banco de preguntas; la fuente canónica es data/quizzes/phase-34-observability-cost.yaml.

q-34-01 — ¿Por qué request_id es crítico (load-bearing)?¶

Respuesta libre. Las respuestas aceptables contienen correlate.

Sin request_id no puedes reconstruir la secuencia end-to-end de una petición — las líneas de log de peticiones concurrentes se entrelazan de forma indistinguible.

q-34-02 — A escala del tutor de gramática §A13, ¿qué domina el coste auto-alojado?¶

Cargos de API por token
Electricidad para mover la CPU durante el forward pass ← correcto
Tarifas de alquiler de GPU
Almacenamiento S3 para los ficheros de log

Por qué: El auto-alojamiento no tiene cargo por token; el coste marginal son los pocos vatio-segundo de tiempo de CPU.

q-34-03 — ¿Qué métricas se necesitan para el dashboard de coste por petición?¶

tutor_requests_total (counter) ← correcto
tutor_compute_seconds_total (counter) ← correcto
tutor_concurrent_inflight (gauge) ← correcto
cpu_thermal_throttle_events_total (counter)

q-34-04 — RPS estable del tutor en el portal §A14?¶

~0.001 RPS
~0.3 - 1 RPS ← correcto
~100 RPS
~10000 RPS

Ver theory/04-dollar-per-token-and-rps-budget.md para la derivación.