English · Español
Estudiar cualquier capítulo¶
El camino ideal es secuencial — la cadena de dependencias de LYNX_CORTEX.md §6 existe por una razón. Pero el currículo también funciona como obra de referencia: cada fila enlaza al capítulo, lista sus prerrequisitos conceptuales directos (informativos, nunca bloqueantes), qué fases desbloquea y qué conceptos enseña. Usa la búsqueda del sitio o esta tabla para saltar al tema que necesites.
Grafo de dependencias¶
graph LR
P00["00 Fundamentos del proyecto y metodología de aprendizaje"]
P01["01 Hardware y sustrato de cómputo"]
P02["02 Representación numérica"]
P03["03 Álgebra lineal desde los primeros principios"]
P04["04 Cálculo y optimización para IA"]
P05["05 Probabilidad y teoría de la información"]
P06["06 Python para ingeniería de IA"]
P07["07 Autograd escalar desde cero"]
P08["08 Autograd tensorial desde cero"]
P09["09 MLP diminuto y abstracción de módulos"]
P10["10 Inicialización, normalización, residuales"]
P11["11 Teoría de tokenización + implementación de BPE"]
P12["12 El corpus"]
P13["13 Embeddings y espacios de representación"]
P14["14 Modelos de secuencia pre-transformer"]
P15["15 Attention desde cero"]
P16["16 Codificaciones posicionales"]
P17["17 Bloque transformer diminuto y mini-GPT"]
P18["18 Bucle de entrenamiento, anticipo de mixed precision, checkpointing"]
P19["19 Dinámica de entrenamiento y debugging"]
P20["20 Harness de evaluación"]
P21["21 Internals de inferencia y sampling"]
P22["22 KV cache"]
P23["23 Fundamentos de arquitectura GPU"]
P24["24 CUDA y Triton hands-on"]
P25["25 Internals de PyTorch"]
P26["26 Cuantización en profundidad"]
P27["27 Optimizaciones modernas de attention"]
P28["28 Fine-tuning, LoRA, QLoRA"]
P29["29 Retrieval-Augmented Generation"]
P30["30 Generación estructurada y decodificación restringida"]
P31["31 Uso de tools y el Model Context Protocol"]
P32["32 Agentes"]
P33["33 Serving de inferencia"]
P34["34 Observabilidad, coste y capacidad"]
P35["35 Entrenamiento e inferencia distribuidos"]
P36["36 Arquitecturas de frontera"]
P37["37 Seguridad y safety de sistemas de IA"]
P38["38 Coste, capacidad, operaciones, MLOps"]
P39["39 Capstone"]
P40["40 Hardening, postmortem, 'qué sigue'"]
P41["41 Portal del aprendiz"]
PX1["X1 Pretraining a escala"]
PX2["X2 Modelos multimodales"]
PX3["X3 RLHF / DPO / RLAIF"]
PX4["X4 Hardware en profundidad"]
PX5["X5 Preparación de entrevistas"]
P00 --> P01
P01 --> P02
P02 --> P03
P03 --> P04
P04 --> P05
P05 --> P06
P04 --> P07
P06 --> P07
P07 --> P08
P08 --> P09
P09 --> P10
P10 --> P11
P11 --> P12
P11 --> P13
P12 --> P13
P13 --> P14
P13 --> P15
P14 --> P15
P15 --> P16
P10 --> P17
P15 --> P17
P16 --> P17
P12 --> P18
P17 --> P18
P18 --> P19
P19 --> P20
P20 --> P21
P15 --> P22
P21 --> P22
P01 --> P23
P22 --> P23
P23 --> P24
P08 --> P25
P24 --> P25
P02 --> P26
P25 --> P26
P15 --> P27
P22 --> P27
P26 --> P27
P26 --> P28
P27 --> P28
P13 --> P29
P28 --> P29
P21 --> P30
P29 --> P30
P30 --> P31
P29 --> P32
P31 --> P32
P22 --> P33
P32 --> P33
P33 --> P34
P18 --> P35
P34 --> P35
P35 --> P36
P29 --> P37
P31 --> P37
P36 --> P37
P37 --> P38
P38 --> P39
P39 --> P40
P40 --> P41
P35 --> PX1
P15 --> PX2
P17 --> PX2
P28 --> PX2
P05 --> PX3
P19 --> PX3
P28 --> PX3
P23 --> PX4
P35 --> PX4
P40 --> PX5
Índice de fases¶
| Fase | Capítulo | Requiere | Desbloquea | Enseña |
|---|---|---|---|---|
| 00 | Fundamentos del proyecto y metodología de aprendizaje | — | 01 | reproducibility seeding lockfile pre-commit ci mypy |
| 01 | Hardware y sustrato de cómputo | 00 | 02 23 | memory-hierarchy roofline arithmetic-intensity cache latency bandwidth |
| 02 | Representación numérica | 01 | 03 26 | ieee-754 floating-point softmax-stability log-sum-exp precision denormals |
| 03 | Álgebra lineal desde los primeros principios | 02 | 04 | tensors matmul einsum svd rank norms |
| 04 | Cálculo y optimización para IA | 03 | 05 07 | gradients chain-rule backprop sgd momentum adam |
| 05 | Probabilidad y teoría de la información | 04 | 06 X3 | probability entropy kl-divergence cross-entropy mle perplexity |
| 06 | Python para ingeniería de IA | 05 | 07 | numpy strides broadcasting views vectorization profiling |
| 07 | Autograd escalar desde cero (minigrad) |
04 06 | 08 | autograd computation-graph reverse-mode topological-sort dag |
| 08 | Autograd tensorial desde cero | 07 | 09 25 | tensor-autograd broadcasting-backward gradcheck matmul-grad softmax-grad |
| 09 | MLP diminuto y abstracción de módulos (minitorch) |
08 | 10 | module-abstraction parameter-registration linear sequential optimizers |
| 10 | Inicialización, normalización, residuales | 09 | 11 17 | initialization xavier kaiming layer-norm rms-norm residuals pre-ln |
| 11 | Teoría de tokenización + implementación de BPE | 10 | 12 13 | tokenization bpe byte-level subwords vocabulary zipf |
| 12 | El corpus: diseñando el dataset microscópico | 11 | 13 18 | corpus-design enumeration stratified-split data-manifest reproducibility |
| 13 | Embeddings y espacios de representación | 11 12 | 14 15 29 | embeddings cbow cosine-similarity dimensionality representation-geometry |
| 14 | Modelos de secuencia pre-transformer | 13 | 15 | n-gram rnn lstm vanishing-gradient perplexity-baselines |
| 15 | Attention desde cero | 13 14 | 16 17 22 27 X2 | attention scaled-dot-product multi-head causal-mask query-key-value |
| 16 | Codificaciones posicionales | 15 | 17 | positional-encoding rope sinusoidal extrapolation |
| 17 | Bloque transformer diminuto y mini-GPT | 10 15 16 | 18 X2 | transformer-block pre-ln ffn gelu tied-embeddings lm-head |
| 18 | Bucle de entrenamiento, anticipo de mixed precision, checkpointing | 12 17 | 19 35 | training-loop batching adamw warmup cosine-decay checkpointing |
| 19 | Dinámica de entrenamiento y debugging | 18 | 20 X3 | instrumentation hooks gradient-norms loss-curves debugging |
| 20 | Harness de evaluación | 19 | 21 | evaluation accuracy-probes calibration adversarial-eval bootstrap-ci |
| 21 | Internals de inferencia y sampling | 20 | 22 30 | sampling temperature top-k top-p decode-cost |
| 22 | KV cache: de las matemáticas a la memoria | 15 21 | 23 27 33 | kv-cache prefill decode memory-bound arithmetic-intensity |
| 23 | Fundamentos de arquitectura GPU | 01 22 | 24 X4 | gpu-architecture sm warps occupancy hbm coalescing |
| 24 | CUDA y Triton hands-on | 23 | 25 | cuda triton kernels shared-memory tiling |
| 25 | Internals de PyTorch | 08 24 | 26 | dispatcher autograd-graph torch-compile custom-ops |
| 26 | Cuantización en profundidad | 02 25 | 27 28 | quantization int8 nf4 gptq gguf calibration |
| 27 | Optimizaciones modernas de attention | 15 22 26 | 28 | flash-attention online-softmax paged-attention gqa mqa |
| 28 | Fine-tuning, LoRA, QLoRA | 26 27 | 29 X2 X3 | fine-tuning sft lora qlora catastrophic-forgetting |
| 29 | Retrieval-Augmented Generation (RAG) | 13 28 | 30 32 37 | rag chunking bm25 hnsw hybrid-search reranking |
| 30 | Generación estructurada y decodificación restringida | 21 29 | 31 | structured-generation json-mode logit-masking grammar-constrained-decoding |
| 31 | Uso de tools y el Model Context Protocol (MCP) | 30 | 32 37 | tool-use function-calling mcp json-schema json-rpc |
| 32 | Agentes: planificación, memoria, sandboxing (tutor de gramática) | 29 31 | 33 | agents react-loop planning agent-memory sandboxing |
| 33 | Serving de inferencia: de FastAPI a continuous batching | 22 32 | 34 | serving continuous-batching scheduling littles-law load-testing |
| 34 | Observabilidad, coste y capacidad | 33 | 35 | observability red-metrics opentelemetry prometheus grafana cost-accounting |
| 35 | Entrenamiento e inferencia distribuidos | 18 34 | 36 X1 X4 | distributed-training ddp fsdp tensor-parallel allreduce nccl |
| 36 | Arquitecturas de frontera | 35 | 37 | mixture-of-experts mamba state-space-models speculative-decoding |
| 37 | Seguridad y safety de sistemas de IA | 29 31 36 | 38 | prompt-injection jailbreaks threat-modeling supply-chain-security red-teaming |
| 38 | Coste, capacidad, operaciones, MLOps | 37 | 39 | mlops model-registry ab-testing canary-deploys drift-detection |
| 39 | Capstone: el sistema de producción en miniatura | 38 | 40 | integration end-to-end-demo architecture-diagrams cost-reporting |
| 40 | Hardening, postmortem, "qué sigue" | 39 | 41 X5 | postmortem hardening performance-audit synthesis |
| 41 | Portal del aprendiz: entregando el currículo | 40 | — | web-portal argon2id csrf spaced-repetition multi-tenancy |
| X1 | Pretraining a escala | 35 | — | scaling-laws chinchilla mfu pretraining cluster-economics |
| X2 | Modelos multimodales | 15 17 28 | — | vit clip whisper contrastive-learning multimodal-fusion |
| X3 | RLHF / DPO / RLAIF | 05 19 28 | — | rlhf reward-modeling ppo dpo constitutional-ai |
| X4 | Hardware en profundidad | 23 35 | — | h100 nvlink allreduce interconnects datacenter-economics |
| X5 | Preparación de entrevistas | 40 | — | whiteboarding systems-design paper-reading storytelling |