English · Español
Lab 02 — Cura la lista de lectura "Qué sigue"¶
🇪🇸 Veinte recursos seleccionados con cuidado. Cada uno con un "por qué está en la lista" y un "qué hacer con él". Una lista de 200 bookmarks no es una lista; una de 20 curada es una hoja de ruta.
Objetivo¶
Producir docs/phase-40-hardening-postmortem/READING_LIST.md: 20-40 entradas, organizadas en categorías, cada una anotada. Más una sección final "Off-ramps" que enlaza con las amenazas aplazadas del lab 00.
Preparación¶
- Las entradas off-ramp del lab 00 (ya añadidas a
READING_LIST.md). - Un archivo Markdown limpio con cabeceras de sección.
- Tu historial de bookmarks, las entradas del journal, los archivos de reporte — cualquier cosa que apunte a "cosas que quería leer pero no llegué a leer".
Tareas¶
-
Define las categorías. Ocho es un número razonable. Sugeridas:
-
Fundamentos y matemáticas (repasar o cubrir lagunas).
- Arquitecturas más allá de Mini-GPT (mixture-of-experts, state-space, multi-modal).
- Entrenamiento a escala (distribuido, precisión mixta, paralelismo).
- Inferencia a escala (PagedAttention, especulativo, frameworks de serving).
- Post-entrenamiento (RLHF, DPO, constitutional, evals).
- Producción / MLOps (deployment, observabilidad, registries).
- Seguridad y alineación (jailbreaks, prompt injection, alineación de modelos).
-
Off-ramps (conectados específicamente con amenazas aplazadas y proyectos "qué sigue").
-
Cada entrada tiene la misma forma:
### [Title](url)
- **Type:** paper / blog / book / video / repo / course
- **Why on this list:** one sentence about the gap it fills.
- **What to do with it:** one sentence about how to engage — read end-to-end, skim §2, implement, watch first 30 min, etc.
- **Estimated time:** 30 minutes / 2 hours / a weekend / multi-week.
- **Prerequisites:** if any.
-
Apunta a 20-40 entradas. Calidad sobre cantidad. Cada entrada debe pasar el test: "si Borja solo tuviera 10 cosas para leer tras el proyecto, ¿estaría esta en la lista?" Si no, córtala.
-
Distribuye entre categorías. Aproximadamente equilibrado. No pongas 15 en una categoría y 1 en otra. Si una categoría está dispersa, o encuentra más entradas o elimina la categoría.
-
Conecta off-ramps con amenazas. La sección "Off-ramps" debe:
- Listar cada amenaza aplazada del lab 00 como un off-ramp.
- Añadir 2-3 off-ramps adicionales no atados a amenazas (p. ej., "escalar a un modelo de 1B parámetros").
-
Cada off-ramp lista ≥ 1 recurso recomendado del resto de la lista de lectura.
-
Añade un preámbulo al inicio del archivo: 50-100 palabras. Qué es esta lista (un conjunto de recomendaciones personales), qué no es (una lista exhaustiva de lectura sobre IA (AI)), cómo usarla (escoge una por mes, no todas a la vez).
-
Comprueba las URL. Cada enlace funciona en la fecha de escritura. Añade una línea "Last verified: YYYY-MM-DD" al pie.
Ejemplos de buenas entradas¶
### [The Annotated Transformer](https://nlp.seas.harvard.edu/2018/04/03/attention.html)
- **Type:** blog (with code).
- **Why on this list:** Most accessible line-by-line walkthrough of the original transformer paper. Useful even after building one from scratch — different perspective.
- **What to do with it:** Read end-to-end, but skim the parts you already implemented (Phase 17).
- **Estimated time:** 2-3 hours.
- **Prerequisites:** Phase 17 done.
### [vLLM: Easy, Fast, and Cheap LLM Serving with PagedAttention](https://blog.vllm.ai/2023/06/20/vllm.html)
- **Type:** blog (+ associated paper).
- **Why on this list:** Reference architecture for the inference serving you scratched at in Phase 33. PagedAttention is the engineering trick that makes 100s of concurrent requests feasible.
- **What to do with it:** Read the blog, skim the paper §1-3. Then `pip install vllm` and serve a small HF model.
- **Estimated time:** 4 hours (read) + a weekend (try it).
- **Prerequisites:** Phase 27 (modern attention), Phase 33 (serving).
Ejemplos de malas entradas (a evitar)¶
### [Attention Is All You Need](https://arxiv.org/abs/1706.03762)
- One of the most influential papers in deep learning.
Por qué es malo: no hay "por qué en la lista", ni "qué hacer", ni tiempo estimado. Se lee como un stub de Wikipedia.
Por qué es malo: sin título, sin tipo, sin señal sobre qué contiene.
Entregable¶
docs/phase-40-hardening-postmortem/READING_LIST.md:
# What's next — reading list
(50-100 word preamble.)
## Foundations & math
(2-5 entries)
## Architectures beyond Mini-GPT
(2-5 entries)
...
## Off-ramps
(3-5 entries, each connecting to a punted threat or to a next-project direction)
---
Last verified: 2026-05-23
Aceptación¶
- ≥ 20 entradas, ≤ 40.
- Cada entrada tiene los 5 campos (Type, Why, What to do, Time, Prerequisites).
- Categorías presentes y aproximadamente equilibradas.
- Cada URL funciona (fecha de last verified < 2 semanas).
- La sección off-ramp referencia al menos 3 amenazas aplazadas del lab 00.
Trampas¶
- Incluir todo lo que has marcado. Esta es una lista de recomendaciones, no un vertedero de bookmarks. La mayoría de tus bookmarks deberían recortarse.
- Escoger solo recursos "famosos". Los vídeos de Karpathy, el cookbook de OpenAI, el Annotated Transformer — sí, inclúyelos. Pero incluye también los menos famosos que genuinamente te ayudaron. Suelen ser de mayor señal porque menos gente ya los ha leído.
- Recursos que requieren suscripción de pago. Indica cuándo una entrada está tras paywall. Prefiere alternativas abiertas donde existan.
- Mezclar "off-ramps" con "cosas para leer". La sección off-ramps es para proyectos/direcciones, no para artículos. Los artículos en apoyo de un off-ramp pertenecen a su sección temática, referenciados desde el off-ramp.
- Dejar que la lista se quede obsoleta. Añade un pie "Last verified". Planea reverificar en el kickoff del próximo proyecto.
Extensión¶
- Añade una sección "salta estos". Recursos populares que específicamente NO te resultaron útiles, con un "por qué no" de una frase. Igual de valioso.
- Añade un subconjunto explícito "si solo tienes 10 horas". Cinco entradas de la lista que sean innegociables.
Siguiente: 03-knowledge-graph.md