English · Español
Fase 12 — Quiz (espejo legible por humanos)¶
🇪🇸 Espejo legible del canónico
data/quizzes/phase-12-corpus-design.yaml.
Fuente: data/quizzes/phase-12-corpus-design.yaml.
q-12-01 — ¿Por qué enumerado, no scrapeado? (single)¶
- Los corpus más pequeños siempre generalizan mejor
- La enumeración garantiza cobertura, balance y cero ruido de etiquetas — a esta escala los tres importan más que el tamaño ✓
- Los corpus scrapeados son ilegales de usar
- El texto web contiene demasiados emojis
La tarea §A13 necesita memorizar ~700 bits de hechos y generalizar una regla. Un corpus enumerado da cobertura completa y cero ruido; los corpus scrapeados los cambian por tamaño.
q-12-02 — ¿Qué garantiza un split estratificado? (multi)¶
- Cada tiempo aparece en ambos conjuntos train y val ✓
- Cada persona aparece en ambos conjuntos train y val ✓
- Ningún verbo aparece en ambos train y val (prevención de leakage) ✓
- El conjunto val contiene exactamente los mismos ejemplos que el conjunto train
La estratificación asegura cobertura balanceada de tiempo/persona y verbos disjuntos entre splits.
q-12-03 — Encuentra el bug: la pérdida de train y val divergen (free)¶
Una ejecución muestra la pérdida en train cayendo a 0.05 y la pérdida en val atascada en exactamente log(5) ≈ 1.61. ¿La causa única más probable?
Se espera que contenga: label.
La asíntota en val de
log(K)es la entropía de la clasificación uniforme de K vías (el baseline aleatorio). Train memoriza, val se queda en aleatorio — las etiquetas no portan señal para val. Lo más frecuente: etiquetas barajadas.
q-12-04 — Régimen memorización vs generalización (single)¶
¿A qué ayuda más añadir más verbos regulares distintos?
- Memorización de irregulares
- Generalización de la regla regular ✓
- A ambos por igual
- A ninguno — el tamaño del corpus no importa a esta escala
Más regulares distintos le enseñan al modelo que
-edes una regla, no un hecho sobrewalk.
q-12-05 — Calidad vs cantidad a pequeña escala (free)¶
Se espera que contenga: quality.
A escala microscópica, el ruido de etiquetas domina. 100 ejemplos perfectamente etiquetados superan a 10,000 ruidosos para aprender la regla. La cobertura y el balance también favorecen al conjunto curado.