English · Español
Fase 02 — Representación numérica¶
Requiere: 01 — Hardware y sustrato de cómputo Enseña:
ieee-754·floating-point·softmax-stability·log-sum-exp·precision·denormalsSalta a cualquier capítulo desde el índice de referencia de fases.
Mapa del capítulo¶
Pre-escrito según A12; re-anclado a A13 (gramática de verbos en inglés). La teoría y los enunciados de los laboratorios son borradores estables; las soluciones aterrizan justo a tiempo al abrir la fase.
🇪🇸 La aritmética de coma flotante es un sistema de aproximación con reglas raras. Fase 2 te enseña esas reglas hasta que predices, sin ejecutar código, dónde habrá pérdida de precisión, overflow o NaN. Los ejemplos viven en el universo del modelo: conjugaciones verbales inglesas (§A13).
Objetivo¶
Interiorizar IEEE-754 con la profundidad suficiente para que Borja pueda:
- Decodificar a mano un patrón de bits de un float de 32 bits en signo, exponente, mantisa y valor — incluidas probabilidades pequeñas como
1/600(la distribución uniforme sobre el vocabulario de formas verbales de §A13). - Predecir, sin ejecutar código, qué expresiones desbordan (overflow), pierden por defecto (underflow), pierden precisión o producen NaN.
- Re-derivar el truco
-maxdel softmax y la suma de Kahan desde cero — ilustrado sobre un vector de logits de longitud 5 que clasifica un token como uno de los cinco tiempos verbales ingleses (infinitive / present / past / past-participle / future). - Cuantificar el error de redondeo de los ciclos fp32-a-int8, anticipando la inmersión profunda en cuantización de la Fase 26.
Esta es la base para la Fase 7 (autograd escalar), la Fase 18 (bucle de entrenamiento) y la Fase 26 (cuantización). Sáltatela y cada fase posterior arrastrará una fuga.
Orden de lectura¶
theory/00-motivation.md— por qué una fase de precisión antes de cualquier álgebra lineal.theory/01-ieee754-anatomy.md— disposición de bits de fp64/fp32/fp16/bf16, denormales, valores especiales, redondeo.theory/02-softmax-stability.md— el truco-max, log-sum-exp, cross-entropy estable. La página de teoría más importante de esta fase.theory/03-summation-and-cancellation.md— cancelación catastrófica, suma de Kahan y Neumaier, cotas de error.theory/04-precision-zoo.md— BF16, TF32, FP8 E4M3/E5M2, INT8/INT4. Disposiciones de bits y compromisos. Anticipa la Fase 26.lab/00-bit-anatomy.md— decodificar floats a mano y por código, incluyendo el patrón de bits de1/600.lab/01-softmax-stability.md— romper el softmax ingenuo sobre logits de tiempos verbales, y luego arreglarlo.lab/02-summation-experiments.md— medir Kahan vs ingenuo al sumarN = 10⁶probabilidades por forma.lab/03-quantization-preview.md— redondear fp32 ↔ int8 sobre un array de logits y cuantificar la pérdida.
solutions/ está vacío durante la pre-escritura — se rellena al abrir la fase, después de que las decisiones de API de la fase anterior de Borja sean visibles.
Definición de hecho (DoD)¶
Ver PHASE_02_PLAN.md §6. En breve:
- Cuatro directorios de experimentos con manifiestos + artefactos de salida commiteados.
- Borja puede derivar a mano el truco
-maxy explicar por qué el softmax ingenuo desborda cuando un logit es≳ 89. - Borja puede identificar, sin ejecutar código, qué expresiones aritméticas sobre la distribución del vocabulario verbal perderán precisión o darán NaN.
Lo que esta fase intencionadamente NO cubre¶
- Gradientes a través de estas operaciones. Eso es la Fase 4 (cálculo) y la Fase 7 (autograd).
- Un módulo
src/minigrad/. La Fase 2 se queda enexperiments/; las primitivas estables se andamian en la Fase 7, cuando unValuede autograd las consume por primera vez. - Cuantización real (calibración, redondeo con cota de error, escalas por canal). Anticipada en
lab/03, pero la inmersión profunda es la Fase 26. - Coma flotante en GPU (tensor cores, operaciones nativas FP8). Fase 23+.
- Aritmética de intervalos, números posit, unum, formatos DSP de coma fija. Fuera del alcance del currículo por completo.
- Bibliotecas de multi-precisión (
mpmath,gmpy2). Las usamos como oráculos fp64 solo para tests.
El alcance de la Fase 2 es entender el sustrato de coma flotante lo bastante bien como para predecir modos de fallo numérico. Nada más.
Lecturas recomendadas¶
Opcional — enriquece pero no es necesario para aprobar la fase.
- 📄 What Every Computer Scientist Should Know About Floating-Point Arithmetic — Goldberg · 1991. la biblia del coma flotante tras la estabilidad de softmax.