English · Español

Fase 12 — Quiz (espejo legible por humanos)¶

🇪🇸 Espejo legible del canónico data/quizzes/phase-12-corpus-design.yaml.

Fuente: data/quizzes/phase-12-corpus-design.yaml.

q-12-01 — ¿Por qué enumerado, no scrapeado? (single)¶

Los corpus más pequeños siempre generalizan mejor
La enumeración garantiza cobertura, balance y cero ruido de etiquetas — a esta escala los tres importan más que el tamaño ✓
Los corpus scrapeados son ilegales de usar
El texto web contiene demasiados emojis

La tarea §A13 necesita memorizar ~700 bits de hechos y generalizar una regla. Un corpus enumerado da cobertura completa y cero ruido; los corpus scrapeados los cambian por tamaño.

q-12-02 — ¿Qué garantiza un split estratificado? (multi)¶

Cada tiempo aparece en ambos conjuntos train y val ✓
Cada persona aparece en ambos conjuntos train y val ✓
Ningún verbo aparece en ambos train y val (prevención de leakage) ✓
El conjunto val contiene exactamente los mismos ejemplos que el conjunto train

La estratificación asegura cobertura balanceada de tiempo/persona y verbos disjuntos entre splits.

q-12-03 — Encuentra el bug: la pérdida de train y val divergen (free)¶

Una ejecución muestra la pérdida en train cayendo a 0.05 y la pérdida en val atascada en exactamente log(5) ≈ 1.61. ¿La causa única más probable?

Se espera que contenga: label.

La asíntota en val de log(K) es la entropía de la clasificación uniforme de K vías (el baseline aleatorio). Train memoriza, val se queda en aleatorio — las etiquetas no portan señal para val. Lo más frecuente: etiquetas barajadas.

q-12-04 — Régimen memorización vs generalización (single)¶

¿A qué ayuda más añadir más verbos regulares distintos?

Memorización de irregulares
Generalización de la regla regular ✓
A ambos por igual
A ninguno — el tamaño del corpus no importa a esta escala

Más regulares distintos le enseñan al modelo que -ed es una regla, no un hecho sobre walk.

q-12-05 — Calidad vs cantidad a pequeña escala (free)¶

Se espera que contenga: quality.

A escala microscópica, el ruido de etiquetas domina. 100 ejemplos perfectamente etiquetados superan a 10,000 ruidosos para aprender la regla. La cobertura y el balance también favorecen al conjunto curado.