Skip to content

English · Español

Fase 12 — Quiz (espejo legible por humanos)

🇪🇸 Espejo legible del canónico data/quizzes/phase-12-corpus-design.yaml.

Fuente: data/quizzes/phase-12-corpus-design.yaml.


q-12-01 — ¿Por qué enumerado, no scrapeado? (single)

  • Los corpus más pequeños siempre generalizan mejor
  • La enumeración garantiza cobertura, balance y cero ruido de etiquetas — a esta escala los tres importan más que el tamaño
  • Los corpus scrapeados son ilegales de usar
  • El texto web contiene demasiados emojis

La tarea §A13 necesita memorizar ~700 bits de hechos y generalizar una regla. Un corpus enumerado da cobertura completa y cero ruido; los corpus scrapeados los cambian por tamaño.


q-12-02 — ¿Qué garantiza un split estratificado? (multi)

  • Cada tiempo aparece en ambos conjuntos train y val
  • Cada persona aparece en ambos conjuntos train y val
  • Ningún verbo aparece en ambos train y val (prevención de leakage)
  • El conjunto val contiene exactamente los mismos ejemplos que el conjunto train

La estratificación asegura cobertura balanceada de tiempo/persona y verbos disjuntos entre splits.


q-12-03 — Encuentra el bug: la pérdida de train y val divergen (free)

Una ejecución muestra la pérdida en train cayendo a 0.05 y la pérdida en val atascada en exactamente log(5) ≈ 1.61. ¿La causa única más probable?

Se espera que contenga: label.

La asíntota en val de log(K) es la entropía de la clasificación uniforme de K vías (el baseline aleatorio). Train memoriza, val se queda en aleatorio — las etiquetas no portan señal para val. Lo más frecuente: etiquetas barajadas.


q-12-04 — Régimen memorización vs generalización (single)

¿A qué ayuda más añadir más verbos regulares distintos?

  • Memorización de irregulares
  • Generalización de la regla regular
  • A ambos por igual
  • A ninguno — el tamaño del corpus no importa a esta escala

Más regulares distintos le enseñan al modelo que -ed es una regla, no un hecho sobre walk.


q-12-05 — Calidad vs cantidad a pequeña escala (free)

Se espera que contenga: quality.

A escala microscópica, el ruido de etiquetas domina. 100 ejemplos perfectamente etiquetados superan a 10,000 ruidosos para aprender la regla. La cobertura y el balance también favorecen al conjunto curado.