Skip to content

English · Español

Fase 34 — Cuestionarios

🇪🇸 Espejo legible del banco de preguntas; la fuente canónica es data/quizzes/phase-34-observability-cost.yaml.

q-34-01 — ¿Por qué request_id es crítico (load-bearing)?

Respuesta libre. Las respuestas aceptables contienen correlate.

Sin request_id no puedes reconstruir la secuencia end-to-end de una petición — las líneas de log de peticiones concurrentes se entrelazan de forma indistinguible.

q-34-02 — A escala del tutor de gramática §A13, ¿qué domina el coste auto-alojado?

  • Cargos de API por token
  • Electricidad para mover la CPU durante el forward pass ← correcto
  • Tarifas de alquiler de GPU
  • Almacenamiento S3 para los ficheros de log

Por qué: El auto-alojamiento no tiene cargo por token; el coste marginal son los pocos vatio-segundo de tiempo de CPU.

q-34-03 — ¿Qué métricas se necesitan para el dashboard de coste por petición?

  • tutor_requests_total (counter) ← correcto
  • tutor_compute_seconds_total (counter) ← correcto
  • tutor_concurrent_inflight (gauge) ← correcto
  • cpu_thermal_throttle_events_total (counter)

q-34-04 — RPS estable del tutor en el portal §A14?

  • ~0.001 RPS
  • ~0.3 - 1 RPS ← correcto
  • ~100 RPS
  • ~10000 RPS

Ver theory/04-dollar-per-token-and-rps-budget.md para la derivación.