▲ AGENTES_IA.MD
00 · INTRO
60:00 01 / 64
Sessió pràctica · ~1 hora

El xat ha mort.
Visca l'agent.

Una guia completa per passar de "uso Claude Code per a coses concretes" a operar un sistema d'agents que treballa per tu, recorda què va fer i es desperta sol.

AudiènciaDevs · power users NivellUsuari → Operator FormatConceptes · demos · exercicis
Abans de començar · expectatives honestes

Com aprofitar
aquesta sessió.

REGLA 1

Si alguna cosa no s'entén → ChatGPT

Tiraré molts termes. No pararé per explicar-los tots. Quan alguna cosa et soni a xinès, copia-enganxa la slide o el terme a ChatGPT/Claude i demana-li que t'ho expliqui. És literalment per al que existeix. No tinguis vergonya, fes-ho en directe si vols.

REGLA 2

Això no és un curs tècnic

No entraré en detall en cada eina — per això hi ha docs i YouTube. El que comparteixo és la meva experiència personal i professional després de moltes hores d'ús real, el que a mi em funciona al dia a dia.

REGLA 3

D'on surt tot això

El meu setup es basa en el que segueixo a Twitter / X: developers d'Anthropic, OpenAI, gent que construeix sobre els models, founders de tooling. Aprenc en real-time de qui està empenyent els límits. No m'ho invento — ho destil·lo.

REGLA 4

Això no s'aprèn escoltant-me

Espero que aquesta presentació t'ajudi — però cal treballar-s'ho. Cada cosa que vegis avui: investiga-la, prova-la tu mateix, trenca-la, torna-la a muntar. L'única manera d'aprendre agents és fent-los servir.

Millor input que em pots donar al final: "provaré X aquesta setmana". Si t'emportes una cosa concreta per provar, això ha valgut la pena. Millor 1 cosa feta que 50 apuntades.
Índex de la sessió · ~1 hora · Clic per saltar

Per on passarem.

PARTE 1 · CONCEPTOS

Què és un agent

Anatomia, nivells d'agència, zoo de CLIs, routing.

PARTE 2 · HARNESS

Components i patrons

CLAUDE.md/AGENTS.md, slash commands, hooks, skills, sub-agents, MCPs, memòria, /goal, loops.

PARTE 3 · DEMOS

Tres demos en directe

/morning, /loop, multi-agent paral·lel.

PARTE 4 · AVANZADO opt

Agents persistents + local AI

Hermes vs Claude Code, models open-source.

PARTE 5 · CONTEXTO

Knowledge bases per a LLMs

Vault com a memòria, KB + RAG + MCP.

PARTE 6 · GITHUB

Agents al teu pipeline

PR review, fix-it agents, workflows.

PARTE 7 · CIBERSEGURIDAD

Defensiva + ofensiva

Hardening (10 regles), prompt injection, supply chain.

PARTE 8 · CARRERA

Panorama del sector

Backend vs frontend, stack, llenguatges, consells.

PARTE 9 · ACCIÓN

Pla + exercicis

Què fer dilluns. Exercicis de 30 min a 1 cap de setmana.

Glossari 1/2 Glossari 2/2 Hook Tancament Menú complet (tecla I)
Glossari · 1 de 2 · Conceptes base

Vocabulari.

Termes que apareixen a tota la presentació. Si ja et sonen, salta-ho.

Agent

LLM amb tools, memòria i un objectiu. No és un xat — és un treballador amb mans.

Ej: Claude Code, Codex CLI, Cursor agent, Hermes, Devin.

Harness

Tot el sistema que envolta el model: prompts, hooks, tools, memòria, fluxos. El 70% del valor.

Ej: CLAUDE.md + skills + hooks + slash commands + MCPs configurats junts.

Tool

Capacitat que l'agent pot invocar. Cada tool és un "verb".

Ej: Read, Write, Bash, Grep, WebFetch, query_bigquery, send_slack.

MCP

Model Context Protocol. Estàndard obert per connectar agents amb sistemes externs. "USB per a LLMs".

Ej: dbt MCP, BigQuery MCP, Snowflake MCP, Atlassian, Slack, Postgres MCP.

RAG

Retrieval-Augmented Generation. Buscar docs primer, contestar després amb ells com a context.

Ej: chatbot que llegeix el teu Confluence. ChatGPT amb "search". Cursor llegint el teu repo.

Embeddings

Convertir text a vectors numèrics per a cerca semàntica (no per paraula exacta).

Ej: OpenAI text-embedding-3, Voyage AI, BGE, emmagatzemats a Qdrant / pgvector.

Context window

Quantitat màxima de tokens que el model processa d'un cop.

Ej: Sonnet 200K, Opus 200K, Gemini 2.5 Pro 1M+, Kimi K2 128K-2M.

Token

Tros de text (~4 caràcters). El que pagues. El que consumeix el model.

Ej: "data engineer" ≈ 3 tokens. PDF de 10 pàg ≈ 5K. Sessió llarga: 100K+.

Glossari · 2 de 2 · Components del harness

Vocabulari · cont.

Aquests els veurem cadascun amb la seva slide a part. Aquí només la xuleta.

Hook

Script que es dispara automàticament en esdeveniments de l'agent. El teu CI/CD personal.

Ej: SessionStart mostra #blocker. PostToolUse corre pytest després d'editar un .py.

Slash command

Prompt guardat en un .md, invocable amb /nom. Per a tasques recurrents.

Ej: /morning, /eod, /cost-review, /security-review, /new-component.

Skill

Comportament reutilitzable que l'agent invoca només quan aplica al context.

Ej: tdd, brainstorming, verification-before-completion, debugging.

Sub-agent

Una altra instància del model, amb el seu propi context, llançada per l'agent principal.

Ej: Explore, Planner, Critic, Tester, Document-specialist.

Worktree

Còpia del repo en una altra carpeta i un altre branch. Permet N agents en paral·lel sense trepitjar-se.

Ej: git worktree add ../repo-feature-x feature/x.

DoD

Definition of Done. Checklist objectiu perquè l'agent sàpiga quan parar d'iterar.

Ej: tests passen + lint clean + coverage >80% + commit convencional.

Quantization

Comprimir un model perquè ocupi menys memòria. Perds una mica de qualitat però corre local.

Ej: Qwen 14B Q4_K_M (4-bit), Llama 70B GPTQ, Gemma 4 + TurboQuant.

Eval

Test sistemàtic de qualitat de l'output del model. L'oposat a "vibes".

Ej: 20 casos reals amb output esperat. RAGAS, Promptfoo, LangSmith.

00 · Hook · 2 min

Això està corrent
mentre parlem.

01 · CRON

Sistema autònom

Sincronització de vault, snapshots setmanals de memòria de l'agent, briefing matinal a les 10:00. Sense tocar res.

02 · KNOWLEDGE

Vault multi-empresa

4 sub-bases (feina actual, parent company, ex-feina, personal) cross-linkades, cadascuna amb el seu CLAUDE.md.

03 · 24/7 AGENT

Agent viu a casa

Un agent persistent corre al homelab, té memòria versionada en git i t'escriu ell quan cal.

No és un equip. Sóc jo sol. El que veuràs ho pots copiar tu aquesta setmana.
Com és un dia amb agents

Del llit al EOD.

10:00

/morning · briefing automàtic

Compara costos AWS vs ahir, llegeix el meu work-log d'ahir, escaneja Slack overnight, revisa #blocker al vault, proposa focus del dia.

10:30

4 finestres del terminal

Un alias obre 4 tabs simultanis: vault de notes, repo principal, repo de finops, repo del client. Cadascuna amb el seu context carregat.

11:00

Deep work amb agents en paral·lel

Tasca gran → es divideix. Codex executa tests. Claude Sonnet planifica. Sub-agent Explore rastreja codi mentre tu escrius.

14:00

/cost-review · en una passada

Encadena: snapshot diari → comparar amb últims 7 dies → flag anomalies → buscar context al vault → resum executiu. El que abans eren 90 min, són 5.

18:00

/eod · auto-detect commits

Itera tots els repos, detecta commits del dia, actualitza work-log amb el fet, deixa "context for tomorrow", fa commit al vault.

23:30 · Diumenge

L'agent persistent fa les seves tasques

Snapshot setmanal de memòria, summary de les sessions de la setmana, push automàtic al repo. Tu no hi ets davant.

Exemples de la feina real

Què li demano a l'agent.

FINOPS

Anàlisi de costos AWS

"Compara cost d'un servei últims 30 dies vs Q anterior, atribueix per sub-servei, dóna'm 3 hipòtesis de l'augment del 18%". L'agent fa servir l'MCP de Cost Explorer, llegeix el snapshot del vault i correla amb mètriques.

PROYECTOS

Tracking cross-vault

"Dels projectes oberts a les 2 empreses, quins tenen blocker fa >2 setmanes i a qui cal punxar". Llegeix STATUS.md, contacts.md, last-modified de cadascun.

CODE

MCP server des de zero

"Dóna'm un MCP en Python que exposi 4 tools sobre Cost Explorer". Pla + scaffold + tests + README, en un goal de 30 min sense interacció.

DOCS

Resums executius

"Converteix aquestes notes de 3 meetings en un report d'1 pàgina per a finance". Output amb frontmatter, links a fonts, xifres citades.

RESEARCH

Migracions · avaluacions

"DD vs Grafana vs Datadog per al nostre cas, costos a 12 mesos, riscos per servei crític". Treu info del vault, completa amb web fetch.

OPS

Diagnòstic homelab

"Immich no arrenca, què va passar". Llegeix el runbook, fa SSH al server, mira logs, proposa fix. Com un SRE de butxaca.

El meu setup, simplificat

El que orquestra tot això.

┌─ Mac (laptop) │ ├─ Claude Code (default coding) │ ├─ Codex CLI (full-auto execution) │ ├─ Gemini CLI (long context) │ ├─ ~/dotfiles ─── todo en git, ~130 brews, 50 casks │ ├─ ~/Obsidian ─── 4 vaults cross-linkeados │ └─ launchd: daily.sh @10am, sync vault, etc. ├─ Homelab (LAN) │ ├─ Server casero (16c/32t · 64GB RAM) │ ├─ Agent persistent con identidad propia │ ├─ Crons del agente: snapshots, summaries │ └─ MCPs locales · ollama (futuro) └─ Cloud ├─ Anthropic / OpenAI / Google APIs ├─ GitHub (vault + dotfiles + tools) └─ Cloudflare tunnel para acceso remoto

La peça no òbvia: tot es reprodueix amb un script. Si em roben el Mac, en 1h en tinc un altre d'idèntic. L'agent hereta això com a "memòria operativa".

01 · Què és un agent · 4 min

El salt mental.

Abans (xat)Ara (agent)
Pregunta → respostaObjectiu → bucle fins complir-lo
Text plaTools, file system, MCPs, shell
Tu fas la feina d'enganxarLlegeix/escriu fitxers, corre tests, obre PRs
Sense memòriaMEMORY.md, hooks, RAG persistent
Un modelRouting: Haiku executa, Opus raona
Tu obres la sessióViu sol i t'escriu ell
LinealSub-agents en paral·lel, worktrees
Cec al mónSap qui ets, quins projectes portes, què vas decidir ahir
01 · Anatomia d'un agent

El que passa per sota.

[ Modelo ] ← cervell · Opus 4.7, Sonnet, Codex, Qwen local… ↑↓ [ Harness ] ← regles, hooks, system prompt, skills, memòria ↑↓ [ Tools ] ← Bash, Read/Write, Web, MCP servers, sub-agents ↑↓ [ World ] ← el teu repo, vault, NAS, AWS, Slack, Jira…
Missatge clau: el model és el 30%. L'altre 70% és el harness. Qui només fa prompt-engineering s'ha quedat a 2024. L'important avui és el sistema que envolta el model.

Per què importa la distinció

  • El model canvia cada 6 mesos. El harness es queda. Si construeixes pensant "això val per Sonnet 4.6", ho tiraràs. Construeix pensant en interfícies.
  • El coll d'ampolla no és la intel·ligència, és el context. Un Haiku amb bon harness guanya un Opus amb prompt dolent.
  • El harness és el teu avantatge competitiu. El que tu saps fer millor que d'altres és decidir quin context, quines tools, quins guardrails. Això no ho copia un model nou.
01 · Quatre nivells d'agència

Saps quin fas servir?

Nivell 1

Assistent amb tools

Xat amb capacitat de llegir i escriure arxius. Tu dirigeixes pas a pas. És on està el 90% de la gent que "fa servir Claude Code".

Nivell 2

Loop dirigit

Li dones un objectiu + criteri d'èxit ("tests passen") i es fica en bucle. /loop (Claude Code natiu), /goal (oh-my-claudecode), /autopilot (oh-my-claudecode). Tu només revises el resultat.

Nivell 3

Multi-agent paral·lel

N agentes, N worktrees, N tareas. Tú orquestas. Patrón típico: 1 humano + 4 agentes en tmux (terminal con varios paneles simultáneos en una pantalla). Productividad multiplicativa, no aditiva.

Nivell 4

Agent persistent

Viu 24/7. Té cron, memòria, identitat i proactivitat. T'escriu ell: "AWS billing +12% avui, investigo?". El nivell on l'agent deixa de ser eina i passa a ser company.

Salto Nivell 1 → 2 = aprender 1 comando. Salto Nivell 2 → 3 = aprender git worktrees. Salto Nivell 3 → 4 = montar infraestructura. Cada salto cuesta menos de lo que parece.

02 · El zoo de CLIs · 5 min

Més enllà de Claude Code.

CLIModeloFuerte enDébil en
Claude CodeSonnet 4.6 · Opus 4.7 · HaikuRazonar, refactor grande, planningCaro en sesiones largas
Codex CLIgpt-5.5-codexVelocidad, full-auto, "ejecuta ya"Razonar arquitectura compleja
Gemini CLIGemini 2.5 ProContext window 1M+, multimodal, tier gratisTools menos pulidos
Kimi CLIKimi K2 · MoonshotBarato, contexto largo, fallbackCalidad inferior en código complejo
Aider · Cline · Cursor agentcualquieraDiff-based, dentro del IDEMenos hands-off
En la práctica: Codex es brutal para "ejecuta ya" (refactors, SQL, scripts, boilerplate). Gemini, para leer codebases enormes (cientos de archivos) sin trocear. Claude Code para diseño y revisión profunda. Tener los 3 instalados multiplica tu rate limit y la calidad media.

El secreto no es elegir el mejor — es tener instalados los 3-4 y que cada uno haga lo suyo.

02 · El truc

Routing intel·ligent.

Cada CLI tiene su pool de créditos. Combinándolos, multiplicas tu rate limit y bajas coste medio significativamente.

Cómo lo uso yo · combo Codex + Claude

Codex (gpt-5.5-codex)

Es lo que mejor programa hoy. Más rápido, más fiable en ejecución de tareas concretas (refactors, tests, full-auto). Mi default para "implementa esto".

Claude (Sonnet 4.6 / Opus 4.7)

Mejor en frontend (sentido del diseño, accesibilidad, copy) y en code review (encuentra bugs sutiles, explica trade-offs). Default para "razona esto" o "revisa esto".

Lanzo Codex para implementar, Claude para revisar el diff y para todo lo de UI. Las dos suscripciones se amortizan solas.

Modelos chinos · más baratos · cada vez mejores

ModeloQuién lo hacePara qué
Kimi K2Moonshot AIContexto largo, fallback, ~5x más barato que Sonnet
Qwen 3.6 / CoderAlibabaCoding fuerte, open-weights → corre local con Ollama
MiniMax M2 / ababMiniMaxRazonamiento fuerte, agentes, precio bajísimo
DeepSeek V3 / R1DeepSeekRazonamiento + coding, super-barato, open-weights
GLM-5ZhipuOpen-source, supera a Opus 4.6 en algunos benchmarks
Per què importan: el coste por token cae 10x cada año. Las tareas de "alto volumen, baja criticidad" (clasificar, resumir, extraer) puedes correrlas con un Kimi o un Qwen y pagar céntimos. Reservas Claude/Codex para lo que requiere razonamiento bueno.

La meva regla: tarea importante de coding → Codex o Claude. Tarea importante de UI / review → Claude. Tarea de bulk / batch / extracción → modelo chino vía API barata. Tarea con datos sensibles → Qwen local.

Cuando se te acaben los créditos · alternativas gratis o baratas

OpenRouter

Hub que enchufa a cualquier modelo (open y propietario). Tiene tier gratis con Llama, Qwen, DeepSeek, Mixtral. Una sola API key para probarlos todos.

opencode

CLI open-source tipo Claude Code/Codex. Tiene modelos gratis ocasionalmente (rotando promociones de proveedores). Buen plan B cuando los demás te dan rate limit.

Cursor (free tier)

IDE con agente. A veces tiene modelos gratis (Claude Sonnet, Gemini Flash, GPT-4o-mini limitados). Útil para sesiones rápidas sin gastar de tu suscripción principal.

Groq · Cerebras · NVIDIA NIM · Together

Inferencia gratuita de modelos open-source (Llama 3, Qwen, Gemma). Velocidades brutales. Perfecto para experimentar y para tu agente persistente sin coste.

03 · Harness engineering · 5 min

L'escala de palanca.

Nivell 1
Mejor prompt
+10%
Nivell 2
Buen contexto · RAG
+50%
Nivell 3
Skills · sub-agents
+200%
Nivell 4
Loops · verificación · hooks
+500%
Nivell 5
Agents persistentes · cron

El 95% de la gente se queda en nivel 1. La diferencia con nivel 4 no se mide en %, se mide en órdenes de magnitud. Una semana de tu trabajo = una mañana del de ellos.

Cada nivel se construye encima del anterior. No te saltes ninguno. El prompt sigue importando aunque tengas hooks.

Componente 01/07
FILE-BASED · POR PROYECTO

CLAUDE.md ·
el manual del repo.

Un fichero markdown en la raíz que el agente lee siempre al empezar. Es el "qué somos, cómo trabajamos, qué no tocar".

Nombres por agente: Claude Code lee CLAUDE.md. Codex y Cursor leen AGENTS.md. Otros como Cline, Continue o Aider tienen sus propios nombres. Truco: escribe AGENTS.md y haz un CLAUDE.md que sea un symlink o que diga "see AGENTS.md" — así sirves a todos.

Què posar

  • Stack: lenguaje, runtime, framework
  • Convenciones: naming, estructura de carpetas
  • Comandos clave: cómo se corren tests, lint, build
  • Lo que NO hay que tocar (legacy, generados)
  • Mapa del repo: dónde vive cada cosa
  • Quién es el dueño de qué módulo

Ejemplo real (data eng)

# Pipeline ABC

## Stack
- dbt 1.8 (BigQuery)
- Airflow 2.10
- Python 3.12, uv

## Convenciones
- staging: stg_*, mart: fct_/dim_*
- snake_case, sin acentos
- tests: not_null + unique en PK

## Comandos
- dbt run: dbt build --select +tag:daily
- tests: pytest tests/ -x
- lint: sqlfluff lint models/

## NO TOCAR
- models/legacy/* (deprecated 2025)
- archived/* (audit only)
ROI inmediato: Claude para de hacer preguntas obvias y para de cometer errores típicos de "primer día en el repo".
Componente 02/07
SCRIPTABLE · ENCADENABLES

Slash commands ·
tus rutinas.

Un slash command es un prompt guardado que ejecuta una secuencia. En vez de teclear 500 palabras, tecleas /cost-review.

Per a què serveixen

  • Estandarizar tareas recurrentes (briefing diario)
  • Encadenar N pasos en uno (snapshot → comparar → reportar)
  • Compartir workflows con tu equipo (commitea el .md)
  • Forzar disciplina: el comando incluye verificación

Mi colección actual

/morning /eod /cost-review /predict-cost /project-status /update-vault

Anatomía de uno

# ~/.claude/commands/morning.md

You are running my morning routine.

### Step 1: Cost Snapshot
- Run compare-costs.py --text
- Summarize in 3 lines

### Step 2: Work Log
- Read most recent file in
  ~/notes/work-log/
- Extract "context for tomorrow"

### Step 3: Slack Check
- DMs + mentions overnight
- relevant channels' headlines

### Step 4: Present Briefing
Format: cost · ayer · projects ·
slack · suggested focus.

Es un .md normal. Lo metes en ~/.claude/commands/, lo invocas con /morning. Eso es todo.

Componente 03/07
EVENT-DRIVEN · INVISIBLES

Hooks ·
tu CI/CD personal.

Scripts que se disparan automáticamente en eventos del agente. Funcionan como middlewares o git hooks.

Eventos típicos

  • SessionStart: al abrir Claude Code
  • PreToolUse: antes de cada tool call
  • PostToolUse: después de cada tool call
  • UserPromptSubmit: antes de procesar tu mensaje
  • Stop: al terminar la sesión

Casos reales

  • SessionStart muestra #blocker tags pendientes
  • PreToolUse fuerza paralelismo en lecturas
  • PostToolUse corre tests si tocaste un .py
  • Stop comitea si hay cambios sin commit

Output real de mi SessionStart

📂 vault 🌿 Branch: main ⚡ Commands: /morning, /eod, /cost-review 🚧 5 file(s) with #blocker tags 💰 Latest cost data: hoy
El sistema te entrena a ti. Cada vez que abro Claude veo lo que está bloqueado. Imposible que se me olvide.

Cómo se configuran

Un JSON en ~/.claude/settings.json mapea evento → comando shell. El comando puede ser cualquier cosa: bash, python, node. Output va al contexto del agente.

Componente 04/07
REUTILIZABLES · COMPORTAMIENTO

Skills ·
librerías de hábitos.

Un skill es un conjunto de instrucciones + checklists empaquetado. El agente lo invoca cuando aplica al contexto.

Diferencia con un slash command

  • Slash command: tú lo invocas explícitamente
  • Skill: el agente decide invocarlo solo si aplica
  • Un skill puede ejecutar otros skills
  • Un skill es declarativo: "haz esto antes de cada X"

Skills útiles que existen

brainstorming tdd verification-before-completion debugging code-review writing-plans

Ejemplo: verification-before-completion

Use when about to claim work is
complete or passing, before
committing or creating PRs.

Required:
- Run verification commands
- Confirm output before any
  success claims
- Evidence before assertions

Checklist:
[ ] Tests passed (paste output)
[ ] Lint clean
[ ] Build succeeds
[ ] Manual UI check (if frontend)
Per què importa: los modelos tienden a decir "listo" sin verificar. Un skill bien diseñado fuerza el rigor que tú no tienes ganas de pedir cada vez.
Componente 04b · skills y configs que ya hizo otra gente

No reinventes la rueda.

Hay repos enteros de skills + slash commands + hooks + agents listos para instalar — para Claude Code, para Codex, o agnósticos. Plug-and-play.

CLAUDE CODE

oh-my-claudecode · superpowers · awesome-claude-code

Skills, comandos y agentes empaquetados (/autopilot, /team, /trace…), TDD-style "superpowers" curados por Anthropic, y listas curadas de la comunidad. Sólo si usas Claude Code.

CODEX

codex-prompts · awesome-codex · openai-cookbook

Repos con system prompts pulidos, recetas de full-auto bien configuradas, ejemplos de scripting con codex exec, y workflows reutilizables. Comunidad creciendo rápido.

AGNÓSTICO

awesome-mcp-servers · modelcontextprotocol/servers

MCPs funcionan en Claude, Codex, Cursor, Cline y otros. Lista oficial + curated. El más universal — empieza por aquí.

DESIGN · FRONTEND

v0 templates · shadcn/ui · stitch design system

Componentes y design systems listos. Funcionan con cualquier agente que sepa generar JSX. Para que tu UI no parezca de 2018.

Workflow recomanat: mira primero los repos de la herramienta que ya usas. Cuando empieces a echar de menos algo concreto, escribe el tuyo. No hace falta arrancar de cero, ni tampoco instalar todo.
Componente 05/07
DELEGACIÓN · PARALELISMO

Sub-agents ·
delegar sin contaminar.

Un sub-agente es otra instancia del modelo, con su propio contexto, que tu agente principal lanza para una tarea concreta.

Por qué existen

  • Aislar contexto: que el agente principal no se ahogue leyendo 200 ficheros
  • Especializar: Explore (búsqueda), Plan (arquitectura), Critic (review)
  • Paralelizar: 4 sub-agentes en paralelo = 4x throughput
  • Reset: el sub-agente "olvida" al terminar; el principal queda limpio

Tipos típicos

  • Explore · busca código en repos grandes
  • Planner · diseña antes de tocar código
  • Critic / Reviewer · second opinion del diff
  • Tester · genera y ejecuta tests
  • Document-specialist · busca docs externos

Cuándo lanzar uno

"Búscame X en este monorepo"

→ Explore agent. Tú no quieres ese contexto.

"Antes de tocar nada, dame un plan"

→ Plan agent. Output: pasos numerados.

"Es seguro mergear?"

→ Critic agent. Independiente, sin sesgo.

"Llegeix 30 PDFs y dame stats"

→ Sub-agente con su propio contexto largo.

El truc mental: tratar al agente principal como un lead, no como un operario. Su trabajo es decidir y delegar, no leer.

Componente 06/07
PROTOCOL · TOOLS EXTERNAS

MCP servers ·
USB para LLMs.

Model Context Protocol: estándar abierto que conecta agentes con sistemas externos (DBs, APIs, ficheros) de forma uniforme.

El antes y el después

  • Antes: cada CLI inventaba sus tools. No portables.
  • Ahora: escribes un MCP server una vez, lo enchufa cualquier cliente compatible (Claude Code, Cursor, Cline…)

Casos reales (mis MCPs)

  • aws-cost-explorer-mcp: tools sobre Cost Explorer + Datadog
  • finops-automation: análisis con GPT-4o + n8n
  • Atlassian MCP: Jira + Confluence read/write
  • Slack MCP: leer canales, mandar mensajes

MCPs típicos · cualquier perfil

AWS

Cost Explorer, S3, Lambda, EC2, CloudWatch.

GitHub

PRs, issues, actions, releases, search.

Vercel

Deploys, projects, env vars, logs.

Supabase / Postgres

Query, schema, RLS policies.

Atlassian (Jira · Confluence)

Issues, comments, search, pages.

Slack

Mensajes, canales, búsqueda, DMs.

BigQuery / Snowflake

Query, schema, costs (data).

Datadog · Sentry

Métricas, errores, anomalías.

Insight clau: en cuanto enchufas un MCP, dejas de copiar-pegar al agente. El agente tiene el sistema. Cambia toda la conversación. Empieza con uno (GitHub o AWS) y verás.
Componente 07/07 · El más infravalorado
PERSISTENTE · ENTRE SESIONES

Memoria ·
lo que separa
asistente de colega.

Sense memòria, el agente es un becario nuevo cada lunes. Con memoria, es un colega que te conoce.

4 tipos de memoria

  • User: quién eres, tu rol, cómo trabajas
  • Feedback: correcciones que ya te di una vez ("no uses mocks aquí, nos quemamos")
  • Project: estado actual de proyectos, deadlines, stakeholders
  • Reference: dónde buscar información externa (Slack, Linear, dashboards)

Cómo se almacena

Markdown plano. Cada memoria un fichero. Un MEMORY.md índex que se carga al inicio de cada sesión. Versionado en git → auditable, restaurable.

Ejemplo: una entrada de feedback

---
name: integration-tests-no-mocks
description: tests integración deben
  usar BD real, no mocks
type: feedback
---

Integration tests must hit a real
database, not mocks.

Why: incidente Q4 2025 — los mocks
pasaron, la migración a prod falló.

How to apply: cuando veas tests en
tests/integration/, asume BD real.
Para unit tests sí mocks.
El agente lee esto al empezar. No vuelves a discutir el tema. Esto es lo que hace que la productividad sea compuesta: cada sesión añade conocimiento permanente.
El cierre del nivel 4

Loops · verificación · DoD.

Lo que convierte un agente en un trabajador: iterar hasta cumplir un criterio objetivo.

Patrón: Definition of Done

# Tarea
Add edge case test for X.

# Definition of Done
[ ] Test exists in tests/X/
[ ] Test fails on current main
[ ] Implementation makes it pass
[ ] All other tests still pass
[ ] Lint clean
[ ] Coverage >80%
[ ] Conventional commit message

El bucle automático

  1. Llegeix la DoD
  2. Ejecuta lo que falta
  3. Corre verificaciones
  4. Si fallan → vuelve a 2 con el error
  5. Si pasan → marca check, sigue al siguiente
  6. Cuando 100% checks ✓ → commit + para
Magia real: cuando el agente sabe cuándo parar, dejas de microgestionarlo. Ahí empiezas a recuperar tiempo.

Herramientas que implementan esto

/loop · Claude Code nativo /goal (oh-my-claudecode) autopilot ultrawork subagent-driven-development
El comando que cambió mi semana imprescindible

/goal · el "objetivo
de fondo".

No es un slash command cualquiera. Es la pieza que convierte una sesión en una misión.

Qué hace

  • Le dices al agente "el objetivo final es X, no me lo pierdas de vista"
  • Cada acción se filtra: "¿esto avanza X?" Si no, no lo hace.
  • Si tú divagas, el agente te recuerda el objetivo.
  • Cuando termina algo, comprueba si X está completo. Si no, sigue.

Per què importa

Sin /goal, las sesiones largas se desvían. Empiezas pidiendo "arregla el bug" y acabas refactorizando 3 módulos sin razón. El goal es ancla.

Ejemplo real

$ /goal Migrar el endpoint /users
de la versión v1 a v2 sin breaking
changes. DoD: tests v1 + v2 pasan,
docs actualizadas, deprecation header
en v1 con sunset 2026-12.

[goal saved]

$ ahora arregla este typo
en el README

⚠ Desviación detectada.
El typo no avanza el objetivo de
migración. ¿Procedo igual o lo
dejo en el TODO post-migration?

El agente te corrige a ti. Es lo más cerca de "tener un PM detrás" sin contratar uno.

Patró recomanat: empieza cada sesión larga con /goal. Termínala con verificación contra ese goal. Cero scope creep.
03 · Lo que NO hacer · errores básicos

Trampas que se cargan tu día.

No leer lo que ha hecho

El error #1. El agente termina y tú confías. Pregúntale siempre: "qué has hecho exactamente, qué archivos has tocado, por qué". Mira el diff. Si no entiendes algo, pregunta.

Confiar en "está hecho"

El modelo tiende a decir "listo" sin haber comprobado. Siempre exige evidencia: output de tests, screenshot, comando con su salida. "Demuéstramelo, no me lo digas".

Loops sin techo

Un /loop o /goal sin límite puede gastarte 5-50€ sin verlo. Siempre dale max steps o un budget. Y revisa la factura semanal de la API.

No tener contexto

Le pides cosas sin decir en qué proyecto, qué stack, qué has probado ya. La calidad de la respuesta sale de ahí. Si no tienes CLAUDE.md, escríbelo antes de pedirle nada serio.

No iterar

Si algo sale mal a la primera, no lo abandones — corrígelo. "No, eso no es lo que quería, vuelve a hacerlo así". La IA aprende dentro de la sesión. Trátala como un junior nuevo.

No aprender lo que escribe

Si el agente usa una librería o pattern que no conoces, pregúntale o búscalo. Si dejas que el agente sepa más que tú de tu propio código, se acabó tu carrera.

La meva regla: después de cada bloque grande de trabajo del agente, le pregunto "hazme un resumen de qué cambiaste, por qué, y qué decisiones tomaste por mí". Esto te mantiene como capitán del barco, no como pasajero.
04 · Demos en directe · 5 min

L'"ajà" d'avui.

Tres demos cortas. Si una sola se entiende, el resto del lunes lo dedicas a copiar el patrón.

DEMO A · 1.5 min

/morning

Agent como rutina diaria. Quita 20 min al café.

DEMO B · 2 min

/loop

Agent como bucle TDD. Lo que explota cabezas.

DEMO C · 1.5 min

Multi-agente

Agent como equipo paralelo. Productividad multiplicativa.

DEMO A

/morning — sustituye 20 min de tu día

1.5 min
$ /morning ▸ Comparando costes AWS vs ayer… +0.3% normal ▸ Leyendo work-log de ayer… 3 pendientes ▸ Resumen Slack overnight… 7 mensajes, 1 urgente ▸ Buscando #blocker en vault… 5 tags ▸ Plan para hoy: 1. Resolver blocker en pipeline-X (anomalía pendiente) 2. Review PR #142 (compañero pidió antes de las 14:00) 3. Continuar report de governance

Lo hace mientras hago café. Sin tocar Slack, sin abrir AWS, sin leer notas.

Pasos por debajo

  1. Ejecuta script Python que pre-digiere los JSONs de Cost Explorer (trends, anomalías, 4-week averages)
  2. Llegeix el último work-log/YYYY-MM-DD.md y extrae la sección "context for tomorrow"
  3. Llama a la Slack MCP para DMs/menciones overnight
  4. Hace grep #blocker en el vault entero
  5. Sintetiza con el modelo y propone foco — no orden
DEMO B

/loop — el bucle que explota cabezas

2 min
$ /loop "add edge case test for X in module Y" [1] Reading codebase… [2] Creating plan: identify edge case → test → impl → verify [3] Writing test… done [4] Running tests… ✗ test_x_edge_case (assertion mismatch) [5] Iterating: re-read impl, fix logic… [6] Running tests… ✓ test_x_edge_case PASS [7] Linting · typecheck · build… all green [8] git commit -m "test: edge case X in module Y" Done. PR ready.
Las grandes empresas ya están aquí: objetivos públicos de 100% adopción IA en eng team, con un 20% sin escribir código a mano para finales de 2026. Quien llega tarde, no llega.

Per què funciona

  • El agente tiene el output del test fail. Lo lee como compilador.
  • Cada iteración es un round-trip a la realidad, no a su imaginación.
  • Sabe cuándo parar: la DoD le da el criterio.
DEMO C

Multi-agente — un humano + 4 agentes

1.5 min
tmux session: AGENTS ┌─────────────────────────┬─────────────────────────┐ Agent A · feature/x Agent B · feature/y Codex full-auto Claude Sonnet writing tests… refactoring auth… ├─────────────────────────┼─────────────────────────┤ Agent C · review Tú (humano) Critic agent on diffs reviewing · merging └─────────────────────────┴─────────────────────────┘

Las dos piezas

  • git worktrees: tener N copias del repo en N branches, en N carpetas diferentes. Cada agente trabaja en su sandbox.
  • tmux: terminal multiplexor — divide tu ventana de terminal en varios paneles que ves a la vez (como un Excel con celdas, pero cada celda es un terminal). Te permite tener 4 agentes corriendo en la misma pantalla.
Un humano + 4 agentes = startup de 5 personas a coste de 1.
05 · Agents persistents · 4 min avanzado opcional

Quan l'agent viu a casa teva.

El concepto

Un agente que no muere al cerrar el terminal. Vive en un servidor, tiene memoria propia, tareas programadas y proactividad para escribirte.

Diferencia clave

  • Claude Code = sesión efímera, la abres
  • el agente persistente = vive solo, él te escribe
  • Recuerda meses atrás, no horas
  • Puede actuar sin tu permiso (con guardrails)
  • Puede despertarte: "AWS billing +12% hoy"

Capacidades reales

  • Memoria persistente versionada en git
  • Crons autónomos (snapshots, summaries semanales)
  • Acceso SSH a la LAN, control de Home Assistant
  • Bridges: WhatsApp, Telegram (te escribe ahí)
  • Routing entre Codex / Claude / Kimi por rate limits
  • Identidad propia (le puse nombre, vibe, emoji)

Cuánto cuesta

  • Hardware: cualquier server desde 200€ (Pi 5, mini-PC)
  • Software: open-source todo
  • API: lo que ya pagues a Anthropic/OpenAI
  • Mantenimiento: 1h/mes una vez en marcha
Patrón robado: de cuentas como @shannholmberg en X. Una carpeta vps-agents/ accesible desde cualquier sitio, con runbooks. "Algo se rompió — ¿qué hago?" respondido en menos de 30s.
Comparativa · cuándo usar cada uno avanzado

Hermes vs Claude Code.

No compiten — se complementan. Y de hecho, Hermes puede invocar a Claude Code (o a Codex) por dentro.

Claude CodeHermes (agente persistente)
VidaSesión efímera, abres tú24/7, vive en un servidor
MemoriaMEMORY.md por proyectoMemoria global versionada en git, evoluciona
Quién iniciaTú siempreCron, webhooks, o tú
ComunicaciónTerminalWhatsApp, Telegram, Slack, email…
Mejor paraCoding hands-on, refactors, planningVigilancia, rutinas, recordatorios, proactividad
CosteTu suscripciónHardware + tu suscripción
Setup1 minuto1 cap de setmana

El truc: Hermes invoca a Claude Code o Codex

Tú (WhatsApp): "Hermes, mira si el deploy de hoy va bien"Hermes decide: necesito leer logs y abrir un PR si hay bugHermes spawnea → claude -p "lee logs en s3://..., busca anomalías"Hermes spawnea → codex exec --full-auto "fix el bug X en repo Y"Hermes (WhatsApp): "PR abierto: github.com/.../142. Ya pasó CI."
Patró clau: Hermes es el orquestador. Claude Code y Codex son ejecutores. Tú das una intención de alto nivel desde el móvil, Hermes la traduce en N llamadas a CLIs especializadas y te devuelve el resultado.

La meva recomanació: domina Claude Code primero (3-6 meses). Cuando ya estés cómodo con slash commands, hooks y skills, monta tu Hermes. Sin lo primero, lo segundo es ruido.

05 · Models locals

El catàleg open-source.

ModeloPara qué sirve hoyHardware mínimo
Qwen 3.6 + vLLM + TurboQuantReemplazo decente de Sonnet localGPU 24GB
Qwen3.5-27B Opus-DistilledTerraform · infra · ya en producción realGPU 24-48GB
Gemma 4 + TurboQuant~20 t/s en Mac Mini, código simpleApple Silicon 16GB+
GLM-5Open-source > Opus 4.6 en benchCluster (VRAM bestial)
Kimi K2Bate Opus 4.6 · > 1TB VRAMCluster (Exo Labs)
Llama 3.3 / 3.5Meta · ecosistema enorme · fine-tunesGPU 16-48GB

Cuándo merece la pena local

Datos sensibles · PII · finanzas Volumen alto repetitivo Latencia · sin round-trip USA Privacidad de prompts Caso data eng: docs dbt en bulk · clasificación de schemas · PII detection
05 · Stack mínim

El que necessites per començar local.

01 · SERVIDOR

Ollama

Más fácil. ollama run qwen2.5:7b y listo.

01 · ALT

vLLM

Más rápido, batch, production-grade. Requiere GPU buena.

02 · MODELO

Qwen 7B/14B

Empieza por 7B. Si va bien, sube.

03 · PROXY

litellm

Conecta Claude Code → endpoint local con la misma API.

~$800Mac Mini M4 que corre Qwen 7B aceptable
~$1.5kMini-PC + GPU 24GB para 14B-27B
~2 mesamortización si reemplaza tokens API
0$tokens recurrentes una vez en marcha
Empieza con tareas seguras: resumir, extraer JSON, clasificar. No razonamiento duro al principio. Cuando veas que va, mueves más carga.
06 · Knowledge bases · 3 min · la pieza que cambia tu carrera

El teu vault =
el cervell del sistema.

Si me quitas todo y me dejas una sola cosa, dejadme el vault. Es el activo que más uso al día y lo que hace que mis agentes parezcan magia.

~/Obsidian/ (symlinkado a Google Drive — sync cross-device gratis) CLAUDE.md ← root, mapa de las 4 sub-bases Empresa-1/ ← empleo actual + CLAUDE.md propio + contactos + projects/ Empresa-2/ ← cliente / parent + CLAUDE.md propio Ex-empleo/ ← histórico, sigue siendo referencia útil Personal/ ← side projects, finanzas, learning, agente, work-log/

Qué tengo automatizado

  • auto-sync diario: cron que hace git pull && commit && push 2 veces/día. Si añado nota, está versionada en horas.
  • session summary: cada sesión de Claude Code se resume y se commitea a Personal/sessions/ con tags y decisiones tomadas.
  • weekly memory snapshot: domingo 23:00, snapshot de la memoria del agente persistente a git. Puedo ver cómo evoluciona su entendimiento de mí.
  • work-log autogenerado: /eod detecta commits de todos mis repos del día, escribe work-log/YYYY-MM-DD.md, deja "context for tomorrow".
  • cost snapshots: scripts que tiran de Cost Explorer y archivan JSON diario en el vault. compare-costs.py compara contra los últimos 7-30 días.
  • secret-scan pre-commit: regex para AWS keys, bearer tokens, etc. Si detecta algo, no deja committear.
Resultat: cuando un agente nuevo arranca, en 30 segundos sabe quién soy, qué proyectos llevo, qué decidí ayer, qué está bloqueado, qué cuesta cada cliente, con quién tengo meeting hoy. Es como darle a un nuevo empleado 5 años de onboarding en un comando.
Cosas reales que hago con mi vault diariamente

Por qué te cambia la vida.

EJEMPLO 1

"¿Qué hablamos con X la última vez?"

Antes: rebuscar en Slack, en mails, en notas sueltas. Ahora: agente lee contacts.md, busca el nombre, encuentra meeting-notes, decisiones, action items pendientes. 5 segundos.

EJEMPLO 2

Cliente X cuesta más este mes

Agent compara snapshots de cost diarios, identifica el servicio que sube, busca en projects/ si hay un proyecto reciente que lo justifica, lee contacts.md para saber a quién pingar. Output: un Slack listo para enviar.

EJEMPLO 3

"¿Por qué decidimos hacerlo así?"

Cada decisión grande la dejo en decisions/YYYY-MM-DD-titulo.md con contexto, alternativas y por qué. 6 meses después el agente lo recupera en una pregunta. Antimemoria del equipo nueva → vault.

EJEMPLO 4

Onboarding de mi yo del lunes

Lunes, abro /morning. El agente lee work-log/viernes.md, me dice qué dejé, qué prometí entregar, qué reuniones tengo. 0 fricción de "¿en qué estaba?".

EJEMPLO 5

Predicción de coste para nuevo cliente

/predict-cost lee perfiles de clientes existentes (projects/client-X/usage.md), calcula promedio por feature, aplica al nuevo cliente. Antes era una tarde de Excel, ahora 3 minutos.

EJEMPLO 6

Cross-empresa

Cuando algo de mi empresa actual se relaciona con mi ex-empleo (patrones de Terraform, lecciones aprendidas), el vault tiene los dos. El agente une los puntos automáticamente con cross-links.

El insight: el valor del vault crece de forma compuesta. Cada nota nueva incrementa lo que las anteriores valen. Es la única "inversión" tech con interés compuesto real.
Plan concreto · empieza este fin de semana

Construye tu vault en 5 pasos.

Día 1
30 min

Crea el repo

mkdir ~/notes && cd ~/notes && git init. Crea CLAUDE.md raíz con 5 líneas: quién eres, en qué trabajas, qué proyectos llevas, qué NO tocar, dónde vive cada cosa.

Día 1
30 min

Instal·la Obsidian (opcional)

Ojo: el vault no necesita Obsidian. Es markdown plano. Pero Obsidian te da grafo, búsqueda, links automáticos. No uses Notion para esto — el agente no lo lee bien.

Día 2-3
2 horas

Carga el "frente de batalla"

Una carpeta por contexto principal: work/, personal/, learning/. En cada una un CLAUDE.md. Mete tus 5-10 proyectos activos, cada uno con un STATUS.md.

Semana 2

Conecta el agente

Symlink desde tu home: ln -s ~/notes ~/.claude/notes. En tu CLAUDE.md global del agente, mete instrucciones para leer ese vault al arrancar.

Semana 3+

Automatiza

Cron simple: cd ~/notes && git add . && git commit -m "auto" && git push 2 veces al día. Slash command /save-session que resume y guarda. Crece desde aquí.

Mi vault tiene 3 años. Empezó con un README.md. Hoy son 800+ archivos, 4 sub-vaults, y es lo más valioso que tengo del sector. El truc no es empezar perfecto — es no parar.
06 · El triángulo

KB + RAG + MCP.

Markdown vault (Obsidian) ← human-readable, versionableIndexer (embeddings) ← Qdrant · pgvector · code-wikiMCP server ← expone search_kb, read_doc como toolsAgent

Patrón "enterprise"

Indexar Java/C++ con call graphs en graph DB tipo Kuzu. 500 tokens por query vs 200K+ para que un agente "explore" a mano. Cuando el código es millones de líneas, esto importa.

Patrón "personal" (más portable)

Markdown plano + CLAUDE.md por carpeta. El agente lee con Read · Grep. No hace falta vector DB para empezar — un buen grep cubre el 80%. Sólo añade embeddings cuando duela.

Cuándo subir a embeddings

  • Más de 500-1000 docs y empieza a ser lento grepear
  • Búsquedas semánticas: "muéstrame todo lo relacionado con cohort analysis", no "grep cohort"
  • El vault crece más rápido de lo que el agente puede leer
07 · Agents al teu pipeline de GitHub · 3 min

El agente como reviewer.

El cuello de botella en cualquier equipo no es escribir código — es revisarlo. Aquí los agentes son brutales.

FLUJO 1

Auto-review en cada PR

GitHub Action que dispara un agente al abrir/actualizar PR. Comenta inline: bugs, edge cases, código muerto, malas prácticas. Antes de que lo vea un humano.

FLUJO 2

Tagging automático

El agente lee el diff y aplica labels: area/data, breaking-change, needs-migration, security-review. Routing automático al reviewer adecuado.

FLUJO 3

PR description + changelog

Auto-genera descripción del PR a partir del diff: qué cambia, por qué, cómo testear, breaking changes. Mantiene CHANGELOG.md sin esfuerzo.

FLUJO 4

Test gap detection

Mira qué líneas nuevas no tienen cobertura, propone tests. En algunos repos directamente los escribe y los empuja al PR.

FLUJO 5

Triage de issues

Issue nuevo → agente lo lee, busca duplicados, asigna prioridad, sugiere owner basado en git blame del área tocada.

FLUJO 6

Fix-it agents (@claude)

Mencionas @claude en un comment del PR con la indicación. El agente abre commits en la branch del PR. Lo que antes era ping-pong, ahora es delegar.

Com es munta · setup mínimo

Anatomía de un PR review automático.

Las piezas

  • Workflow .yml en .github/workflows/ que escucha pull_request
  • API key del modelo guardada como secret de repo
  • Reviewer prompt versionado en .github/agents/review.md — convenciones, criterios, qué priorizar
  • Allowlist de qué puede hacer: comentar sí, push no (al principio)
  • CODEOWNERS que hace al agente co-reviewer en áreas concretas

Productos listos para usar

Claude Code GitHub App CodeRabbit Codium PR-Agent Sourcery Greptile

No necesitas reinventarlo — los productos ya existen. Sólo aprende qué hace cada uno y elige.

Workflow YAML mínimo

# .github/workflows/pr-review.yml
name: AI Review
on:
  pull_request:
    types: [opened, synchronize]

jobs:
  review:
    runs-on: ubuntu-latest
    permissions:
      pull-requests: write
      contents: read
    steps:
      - uses: actions/checkout@v4
      - uses: anthropics/claude-code-action@v1
        with:
          api_key: ${{ secrets.ANTHROPIC_API_KEY }}
          mode: review
          prompt: .github/agents/review.md
El cambio mental: el código no se "termina" cuando pasa CI. Se termina cuando pasa CI y el agente reviewer no encuentra nada. Eleva la barra sin pedirle más a tu equipo.
08 · Ciberseguridad · 3 min

Los agentes ven cosas
que tú no.

Y al revés: si los configuras mal, son una superficie de ataque enorme. Las dos caras importan.

Para qué los usas (defensiva)

  • Secret scanning: revisar diffs antes del push, detectar API keys, tokens, .env filtrados
  • Dependency review: agente lee package.json / pyproject.toml y reporta CVEs nuevas
  • SAST asistido: análisis estático con razonamiento, no sólo regex (SQL injection, XSS, deserialization)
  • IaC scanning: Terraform / CloudFormation, detecta buckets públicos, IAM policies laxas, security groups abiertos
  • Threat modeling: dado un PRD, el agente mapea STRIDE, propone controles
  • Incident response: lee logs, correla eventos, propone línea de tiempo

De qué te tienes que cuidar (ofensiva contra ti)

  • Prompt injection: web pages, PRs, comments con instrucciones ocultas
  • "Lethal trifecta": contexto privado + tools peligrosas + datos no confiables
  • Supply chain: MCP / plugins / paquetes con código malicioso
  • Credential exfiltration: agente con acceso a env vars + capacidad de hacer requests salientes = mal combo
  • Token leaks: pegar logs sin redactar, sesiones que enseñan secrets a la API del modelo
  • Tool overreach: dar permisos amplios "yolo" desde el día 1
Cómo no romperte tú solo

Hardening · 10 reglas.

01 · ALLOWLIST

Permisos mínimos

Empieza con allowlist explícita de comandos. Bash sólo lo que necesitas. Sube permisos a medida que confíes.

02 · SANDBOX

Aísla cuando sea destructivo

Operaciones que tocan prod o filesystem global → contenedor / VM / sandbox. Nunca ejecuciones libres con tu cuenta de AWS.

03 · SECRETS

Nunca en el contexto

Usa managers (Bitwarden, 1Password, Vault). El agente recibe referencias, no valores. Hooks que detectan y bloquean.

04 · MCP REVIEW

Audita cada MCP nuevo

Pin a versión exacta. Llegeix el código antes. Si es de un autor random sin reputación → no lo enchufes a un agente con tools potentes.

05 · OUTPUT BOUNDARY

Confirma antes de actuar

Mandar Slack, abrir PRs, transferir dinero, modificar prod → el agente propone, tú confirmas. Sin excepciones al principio.

06 · INJECTION

Asume contenido externo hostil

Webs, PRs de fuera, emails: pueden contener "ignore previous instructions". Sanitiza antes de pasar al modelo.

07 · LOGS

Auditoría de tool calls

Logs estructurados de qué tool se llamó, con qué args, qué output. Sin esto no puedes investigar un incidente.

08 · DATA

Cuidado con qué le mandas

PII / financiero / cliente → cifrado o local. Las TOS de los proveedores cambian. Llegeix qué se entrena con tu data.

09 · NETWORK

Egress filtering

Si el agente puede hacer requests salientes, allowlist de dominios. Bloqueo por defecto.

10 · KILL SWITCH

Cómo paro esto rápido

Documenta en el runbook: cómo revocas la API key, cómo paras el cron, cómo cierras el agente persistente. Antes de necesitarlo.

Lo que un agente bien usado puede encontrarte

Casos reales de seguridad ofensiva.

Bug bounty · scope review

"Llegeix este endpoint Y la doc API, dime los 5 vectores más probables y cómo probarlos sin romper nada". El agente razona sobre auth flows, IDOR, rate limits.

Code review de autenticación

"Revisa cómo se firman los JWTs en este servicio y si hay flujos donde el secret se puede filtrar". Encuentra cosas que un humano cansado no ve.

IaC pre-merge

Cualquier PR a Terraform → agente comenta sobre security groups, IAM, S3 bucket policies, KMS, encryption at rest.

Phishing detection

Agent lee email reportado, clasifica: phishing, spam, legítimo. Adjunta evidencia (URL reputation, header analysis, similitud con dominios reales).

Log analysis post-incidente

"Aquí 50K líneas de log. Algo raro pasó entre las 14:00 y las 14:30. Construye la línea de tiempo y dame las hipótesis ranked".

Compliance review

"Llegeix este código y dime qué controles GDPR / SOC2 / PCI no se están cumpliendo, con citas a líneas concretas".

Important: usar siempre con autorización (CTF, bug bounty in-scope, pentesting contratado, tu propio código). Todos los modelos serios refusan ayuda para ataques no autorizados.
09 · El panorama del sector · 5 min

La industria
está cambiando ahora.

Esto no es hype de Twitter. Es presión estructural y top-down en todas las empresas grandes.

100%adopción IA en eng targets típicos · Q3 2026
20%eng team sin escribir código a mano · Oct 2026
30%del código de Google ya lo escribe IA · público
~50%menos contrataciones junior en big-tech · 2025-26
Traducción para ti: los CTOs ya no se preguntan "¿usamos IA?". Se preguntan "¿quién no la está usando y por qué sigue aquí?". Y miden adopción semanalmente.
El mandato corporativo · qué está pasando

El "todos con IA · ya".

CASO REAL

Mi empresa · Jun 2026

Mandate público: 100% del eng team usando IA semanalmente. 20% sin escribir código a mano para octubre. Auditado.

MICROSOFT

Copilot obligatorio

"AI usage" forma parte de las performance reviews desde 2025. Quien no lo usa, justifica.

META · GOOGLE · AMAZON

Targets de producto

30%+ del código nuevo asistido por IA. Métricas internas de aceptación de sugerencias.

Por qué sucede ahora

Los inversores lo exigen

Cualquier reunión con board en 2026 incluye "AI productivity uplift". Es una métrica como churn o ARR.

Se ha demostrado el ROI

Estudios internos muestran 30-50% más velocidad en tareas concretas (refactors, tests, docs). Imposible ignorarlo.

Competencia salarial

Si un eng con IA hace el trabajo de 2, ahí va el headcount. Quien adopta tarde paga más por menos output.

Cultura "AI-native"

Las top hires de 2026 ya entran asumiendo que la IA es parte del flujo. Si tu compañero junior va más rápido que tú, te toca aprender.

Si estás empezando hoy · consejo principal

Backend > Frontend.
(con matices)

Frontend · qué pasó

  • v0, Lovable, Bolt, Replit Agent hacen UIs decentes en minutos
  • Tailwind + componentes generados son commodity
  • El JS framework de moda cambia cada 18 meses → se devalúa
  • Sigue habiendo trabajo, pero el listón sube: design systems, accesibilidad, performance, animaciones, micro-interacciones

El frontend "de meter componentes" se acabó. Sólo el frontend especializado paga bien.

Backend · por qué dura un poco más

  • Data modeling en sistemas reales — la IA falla sin contexto profundo del negocio
  • Distributed systems — concurrencia, idempotencia, race conditions, eventual consistency
  • Performance — saber que tu query nueva tira el cluster antes de mergearla
  • Integraciones — APIs externas con bugs, rate limits, edge cases no documentados
  • Coste & ops — cada decisión de arquitectura tiene factura mensual

El "razonamiento sobre el sistema" sigue siendo más humano que la generación de código — pero la IA mejora rápido aquí también. La ventana para entrar todavía está abierta, no para siempre. Aprovéchala ahora.

Veredicte: empieza por backend si estás cero. Pero aprende lo suficiente de frontend para no quedar ciego cuando hables con designers o veas tu producto. Full-stack consciente > especialista de un solo lado.
El stack que te va a contratar · prioridad de arriba a abajo

El ciclo completo.

┌─ Capa 7 · ARQUITECTURA & SYSTEM DESIGN ← entrevistas senior │ patterns, trade-offs, capacity planning, DDIA ├─ Capa 6 · IA & AGENTES ← lo que da el job │ prompting, harness, MCPs, agentes, evals ├─ Capa 5 · CIBERSEGURIDAD ← te diferencia │ OWASP, auth, secrets, threat modeling ├─ Capa 4 · INFRA & IaC ← multiplicador │ AWS → Terraform → Docker → K8s ├─ Capa 3 · CI/CD ← higiene básica │ GitHub Actions, branches, PRs, releases ├─ Capa 2 · DATOS ← donde se gana o pierde │ SQL bien, NoSQL cuándo, caching, queues └─ Capa 1 · FUNDAMENTOS ← no negociables Linux · git · networking · 1-2 lenguajes
Recomendación: sube de abajo a arriba. No intentes saltar a la capa 6/7 sin tener 1-3 sólidas. La IA amplifica lo que sabes — si la base es flaca, amplifica los errores.
Capas 3-4 al detalle · más demandadas en ofertas

El orden de cloud + IaC.

Paso 1

AWS · core 5 servicios

EC2, S3, IAM, VPC, RDS. Aprèn a montar una webapp simple a mano. Después automatízalo. La cert SAA-C03 (Solutions Architect Associate) cubre lo justo y es la más respetada para empezar.

Paso 2

Lambda + DynamoDB + API Gateway

Serverless básico. La mayoría de side-projects modernos viven aquí. Súper barato, escala solo, perfecto para la primera SaaS.

Paso 3

GitHub Actions · CI/CD

Pipeline mínimo: lint + test + build + deploy a tu cuenta AWS. Aprèn secrets, environments, OIDC con AWS (sin keys hardcoded). Esto sale en TODA entrevista.

Paso 4

Terraform

Reescribe tu infra clickeada en código. Aprèn módulos, estado, workspaces. Después terragrunt si trabajas con varias cuentas. Casi ninguna empresa seria opera ya sin IaC.

Paso 5

Docker → Kubernetes (sólo si hace falta)

Docker sí, siempre. K8s sólo si vas a empresas que lo usan en serio. Para 90% de side-projects, ECS Fargate es más sencillo y suficiente.

Después

Otra cloud (Azure o GCP)

Cuando AWS te suene fluido. No aprendas las 3 a la vez. Profundidad > amplitud. Conceptos se transfieren bien.

Capa 7 · lo que decide entrevistas senior

System design ·
el filtro silencioso.

A partir de mid/senior, el technical interview no es algoritmos — es diseñar un sistema. Si no lo entrenas, no pasas.

Conceptos a dominar

  • Trade-offs CAP, ACID vs BASE, consistencia eventual
  • Caching: cache aside, write-through, TTLs, invalidation
  • Queues: SQS, Kafka, RabbitMQ — cuándo cada uno
  • Idempotencia: qué pasa si la request se repite 5 veces
  • Rate limiting: token bucket, leaky bucket
  • Sharding: cómo partir datos cuando una sola DB no aguanta
  • API design: REST vs GraphQL vs gRPC
  • Event-driven: cuándo mejor que request/response

Recursos imprescindibles

  • DDIA · Designing Data-Intensive Applications · Kleppmann · la biblia
  • System Design Interview · Alex Xu · vol I y II
  • Building Microservices · Sam Newman
  • The Pragmatic Programmer · clásico
  • HighScalability.com · case studies de Netflix, Uber, Discord
  • YouTube: Hussein Nasser, Arpit Bhayani, ByteByteGo
  • Práctica: system-design-primer en GitHub, casos en Pramp / Hello Interview
Hack: usa la IA como entrevistador. "Hazme una entrevista de system design para un Twitter clone, y critícame al final". Hazlo 20 veces.
Qué lenguaje · opinión clara

Tier list 2026.

S-TIER · APRENDE 2 DE 2

Python · TypeScript

Python para data, AI, scripting, backend rápido. TypeScript para todo lo web (front + back). Con estos 2 cubres el 80% de las ofertas y el 100% de side-projects.

A-TIER · ELIGE 1 PARA PROFUNDIZAR

Go · Rust · Java/Kotlin

Go: K8s ecosystem, microservicios sencillos, compañías cloud-native. Rust: systems, performance crítica, sale-tier. Java/Kotlin: enterprise, fintech, Android.

B-TIER · ÚTIL EN CONTEXTO

SQL · Bash · YAML

SQL en serio — joins, ventanas, EXPLAIN. Bash para automatizar tu vida. YAML porque vas a vivir en él (CI, K8s, Terraform Cloud, dbt).

EVITAR COMO PRIMER LENGUAJE

C · C++ · PHP · Ruby

No están muertos pero el mercado es estrecho. Aprèn uno cuando un trabajo lo pida, no antes. Ruby on Rails si te toca alguna scaleup concreta.

El meu consell: Python + TypeScript primero (6 meses cada uno). Después Go o Rust según donde quieras estar. No brincar de lenguaje cada 3 meses. Profundidad da seniority, salto da junior eterno.
Si ya estás dentro · cómo amplificarte

De ingeniero
a operador de equipo.

Si llevas >3 años de experiencia, la IA bien usada te convierte en alguien que hace el trabajo de 3-5 personas. Esto cambia tu carrera.

CAMBIO MENTAL

Tu valor ya no es el código

Tu valor es decidir: arquitectura, qué construir, cuándo confiar en el agente, cuándo vetar. Tratar al agente como un ingeniero junior infinito y barato.

LEVERAGE

Construye herramientas para el equipo

Slash commands compartidos, MCPs internos, hooks de seguridad, workflows de PR review. Multiplica el throughput de tus compañeros, no sólo el tuyo.

PROYECTOS QUE NO HARÍAS

Toma deudas técnicas grandes

Refactors que daban pereza, migraciones, audits. La IA reduce el coste 10x. Lo que antes era "sprint épico" ahora es "tarde de viernes".

VISIBILIDAD

Predica, no impongas

Presentaciones internas, demos, PRs ejemplares. Los managers buscan "AI champion" que pueda guiar a otros — no quien lo use a escondidas. Tu próximo ascenso depende de esto.

MIDE OUTPUT

Productividad no es horas

PRs/semana, bugs cerrados, features shipped, dollar saved. Compáralo con tu yo de hace 6 meses. Si no estás 2x, algo va mal.

CUIDADO

El gimnasio mental sigue contando

Si la IA hace todo, te atrofias. Mantén un ratio: 80% delegado · 20% a mano (algoritmos, debugging duro, lectura de papers). El día que el modelo se cae no puedes paralizarte.

Capa 5 · transversal a todo

Seguridad · de día 1.

No es un módulo aparte. Cada capa que aprendes tiene su componente de seguridad. Integrarlo desde el principio te diferencia del 80% de devs.

Si aprendes web

→ OWASP Top 10. SQL injection, XSS, CSRF, SSRF. Auth flows (OAuth2, OIDC). Mira Web Security Academy de PortSwigger (gratis).

Si aprendes cloud

→ IAM de verdad: least privilege, role chaining. Bucket policies, KMS, security groups, VPC endpoints. Llegeix flaws.cloud (CTF gratis sobre AWS).

Si aprendes IaC

→ Pre-commit hooks con tfsec, checkov, terrascan. Detección de drift. Secrets en SSM/Secrets Manager, nunca en code.

Si aprendes CI/CD

→ OIDC con cloud (sin long-lived keys). Pinned actions con SHA. Dependabot. Branch protection. Signed commits.

Si aprendes IA

→ Prompt injection, output validation, allowlist de tools, sandbox para agentes destructivos. Sección 08 de esta presentación.

Si haces side-projects

→ NUNCA .env en git. Bitwarden / 1Password CLI. Rotación de keys. Backups cifrados. Tu primer leak es cuestión de tiempo.

Recursos: Hack The Box (gratis tier), TryHackMe (módulos guiados), flaws.cloud, OWASP WebGoat, libro The Web Application Hacker's Handbook.
Recomendación · si tuvieras que repartir 100 horas

Cómo repartir tu aprendizaje.

25 h
Backend + un lenguaje a fondo (Python o TS)
25%
20 h
Cloud (AWS) + IaC (Terraform)
20%
15 h
IA · agentes · automatización (esta clase × 6)
15%
15 h
System design + arquitectura (DDIA, casos)
15%
10 h
Datos: SQL bien · NoSQL · queues · caching
10%
10 h
Ciberseguridad básica (OWASP, IAM, secrets)
10%
5 h
Soft skills: inglés técnico, escribir docs, comunicar trade-offs
5%

El truc no es dedicar 100h a una cosa — es tener señal en todas. Con 25h en cada bloque ya sabes la lengua. Después escoges 2-3 donde profundizas según trabajo.

Consejos de carrera · sin pelos en la lengua

10 cosas que ojalá
me hubieran dicho.

01 · Side-projects siempre

Tu CV son tus proyectos, no las empresas en las que estuviste. 1 side-project terminado pesa más que 5 a medias. Termínalos · enséñalos · sigue.

02 · CV con IA + aplica a todo

No pierdas tardes maquetando. Pide a Claude/ChatGPT un CV en HTML, exporta a PDF. Aplica en masa: incluso jobs "que no son para ti" — la conversación misma te enseña dónde estás.

03 · Sé buena pregunta

Saber preguntar bien (a humanos y a IA) es la skill más infravalorada. Pregunta con contexto, hipótesis y qué has probado.

04 · Habla con humanos

Meetups, conferencias, ex-compañeros. El 80% de los trabajos buenos vienen por contacto, no por aplicar a ofertas.

05 · Mide tu propia productividad

Lleva un work-log (al final lo hace tu agente por ti). Tu yo de hace 6 meses te sorprenderá. Mejora lo que mides.

06 · Mantente al día con IA · CADA SEMANA

La IA cambia cada mes. Lo que aprendiste hace 6 meses está medio obsoleto. Sigue X (Twitter) y reserva 2-3h/semana para ver qué hay nuevo. Cuentas obligatorias: @simonw, @swyx, @AnthropicAI, @OpenAIDevs, @karpathy, @hwchase17, @sama, @amasad. Llegeix newsletters: Latent Space, Import AI, Simon Willison's Weblog. Sin esto te sale del tren — con esto vas siempre 3 meses por delante.

Bonus · proyecto guiado de 1 semana · une todo

Build it all.
Con un agente al lado.

El proyecto que cubre frontend + backend + DB + cloud + CI/CD + IA + cybersec en una semana. Lo terminas, lo enseñas, te contratan.

Qué es la idea

Un URL shortener tipo bit.ly: pegas una URL larga, la app te da una URL corta del estilo tu-dominio.com/abc123. Cuando alguien la abre, redirige a la original y registras el click. Dashboard de analytics: clicks por día, país, dispositivo, navegador, top URLs, links activos. Es simple en concepto, pero toca cada pieza del stack — por eso es perfecto para aprender.

Stack mínim Frontend Next.js + shadcn/ui (Vercel) Backend AWS Lambda + API Gateway (TS) DB DynamoDB (PK = short_id) Auth Cognito o Clerk (free tier) IaC Terraform — todo · NADA clickeado CI/CD GitHub Actions + OIDC a AWS Monitor CloudWatch + alarma simple IA Claude/Codex como pair-programmer Demuestra al final · Repo con README claro y diagrama · Demo desplegada en URL real · CI verde · todos los push pasan · 1 PR donde el agente comenta · 1 incidente simulado + postmortem.md

Servicios AWS que vas a tocar

  • Lambda — funciones serverless para crear short links y para el redirect
  • API Gateway — el HTTP frontend de tus lambdas
  • DynamoDB — almacena links y clicks. PK short_id, GSI por user
  • S3 + CloudFront — host del frontend si no usas Vercel
  • Route 53 — tu dominio custom x.tu-dominio.com
  • SQS / EventBridge — encolar clicks para procesar async
  • Kinesis Firehose → S3 — log de clicks para analytics históricos
  • Athena + QuickSight — queries SQL sobre los logs en S3, dashboard
  • WAF — protección contra abuse y bots
  • Secrets Manager — API keys, JWT secret

Dónde meter IA · ideas extra

  • Generador de short codes "humanos": en lugar de abc123, llamas a un LLM (vía OpenRouter — tiene tier gratis con Llama, Qwen, Mixtral) para sugerir un slug con sentido (/mi-cv, /oferta-q4)
  • Detección de URLs peligrosas: antes de acortar, agente clasifica si parece phishing/malware
  • Categorización automática: el agente etiqueta cada link (tech, news, video, ecommerce) y lo enseñas en el dashboard
  • Resumen de destino: agente lee la página destino y muestra preview text en el dashboard
  • Anomaly detection: agente detecta patrones raros (1000 clicks de una IP) y manda alerta
  • Chat con tus links: "¿qué link tuvo más clicks de Japón el mes pasado?" → MCP sobre tu DynamoDB
Por qué este proyecto: entra en cualquier entrevista. Toca todas las capas (datos, backend, frontend, IaC, CI/CD, seguridad, monitoring, IA). Y demuestra que sabes orquestar al agente — no sólo "vibe code".
Cómo repartir esos 7 días · con agente al lado

El reparto.

Día 1

Setup + IaC vacío

Cuenta AWS, Terraform inicial, S3 backend para state, OIDC con GitHub. Output: terraform apply crea VPC + IAM. Pídele al agente que te genere los módulos base.

Día 2

Backend Lambda + DynamoDB

API REST con 3 endpoints: POST /links, GET /:id, GET /links/:id/stats. Tests unitarios y de integración. Agent escribe + tú revisas.

Día 3

CI/CD

GitHub Actions: lint + test + plan + apply (manual approval). OIDC para que no haya keys. Branch protection. Pídele al agente que te haga el workflow desde cero.

Día 4

Frontend

Next.js + shadcn. Página landing, dashboard auth con Clerk, formulario que llama a la API. Despliegue en Vercel. Aquí el agente brilla — déjale hacer.

Día 5

Auth real + monitoring

Protege endpoints. CloudWatch alarms. Logs estructurados. Una métrica custom (clicks/s). Alerta a tu email si sube.

Día 6

Cyber pass

Pídele al agente que audite: IAM, secrets, CORS, rate limiting, headers. Implementa lo crítico. Documenta lo conocido pendiente.

Día 7

README + demo + post

README con arquitectura. Loom de 3 min. Post en LinkedIn / X / blog. Repo público con etiquetas. Sin esto el proyecto vale 0.

7 días serios > 7 meses tibios. La gente contrata a quien envía cosas, no a quien aprende eternamente.

La regla que aplica a TODO lo de esta presentación

Todo en git.
Todo en el vault.

Si vas a sacar UNA conclusión hoy, que sea esta: cada configuración, cada script, cada prompt, cada slash command que escribas, va a un repo de git que es tuyo.

Qué versionar SIEMPRE

  • Tu vault de notas (Obsidian, Foam, lo que sea)
  • Configs de Claude Code: ~/.claude/CLAUDE.md, commands/, skills/, settings.json, hooks/
  • Tus dotfiles: shell, git, ssh config, aliases, scripts
  • MCPs custom que escribas, aunque sean 50 líneas
  • Tus prompts "magic" que funcionan bien
  • Tu Brewfile / requirements / package.json globales
  • Workflows de GitHub Actions que te gusten — copia/pega entre repos
  • Templates: estructura de proyecto base, README, CLAUDE.md modelo

Por qué esto es no-negociable

  • Pierdes el portátil mañana → 1 hora hasta volver a operar. Bootstrap script + git clone. Yo lo tengo medido: 73 minutos.
  • Cambias de empresa → te lo llevas todo. Slash commands, agentes, knowledge personal. Tu productividad no resetea.
  • Un compañero te pregunta "¿cómo lo haces?" → le mandas el repo. Multiplicas conocimiento sin repetirte.
  • Un agente puede leerlo → meta: el agente sabe cómo está configurado y se mejora a sí mismo.
  • Diff e historial → cuando algo deja de funcionar, sabes cuándo empezó.

Mi setup · 3 repos públicos / privados

github.com/<tú>/dotfiles ← shell, git, ssh, aliases, scripts, brew github.com/<tú>/notes (privado) ← vault entero, work-log, decisiones, contactos github.com/<tú>/claude-config ← slash commands, skills, hooks, MCPs custom
Comença AVUI: cd ~/.claude && git init && git add . && git commit -m "init" && gh repo create --private --push. 30 segundos. Tu yo de dentro de 6 meses te lo agradecerá.
10 · Qué hago el lunes · 2 min

Tres passos. Per effort/impact.

Aquesta setmana
1 hora

AGENTS.md + CLAUDE.md en tu repo principal

Mismo contenido en ambos archivos (o un symlink). 5 cosas: stack, convenciones, comandos clave (test/lint/build), dónde viven las cosas, qué NO tocar. Resultat: tanto Claude Code como Codex/Cursor paran de hacerte preguntas obvias y dejan de cometer errores típicos del primer día.

Aquest mes
1 tarda

Combo Claude + Codex + 1 slash command custom

Si solo tienes uno, instala el otro. Crea un slash command tuyo que automatice algo recurrente de tu día (generar boilerplate de un módulo, abrir un PR con template, escribir tests para un archivo). Prueba /loop en un test que sabes que falla → ver al agente iterar hasta que pase.

Aquest Q
1 cap de setmana

El teu primer agent persistent

Opción barata: en tu propio Mac/PC con un cron. Opción gratis: usa APIs gratuitas de Groq, NVIDIA NIM, Cerebras u OpenRouter. Opción privada: Ollama + Qwen 7B local. Tarea inicial: resumir cada PR de tu repo y mandarlo a Slack/Telegram. Cuando funcione → memoria persistente versionada + cron.

Ejercicios para probar · de menos a más

Si haces 3 de estos,
cambias de nivel.

10 ejercicios concretos. Cada uno te lleva 30 min - 4 horas. Empieza por el 1, sáltate los que ya hagas.

Easy · 30min

Ejercicios 1, 2, 3

Medium · 1-2h

Ejercicios 4, 5, 6, 7

Hard · 1 tarda

Ejercicios 8, 9

Boss · 1 cap de setmana

Ejercicio 10

Ejercicios 1-5 · easy → medium

Empieza aquí.

01 · 30 MIN

Tu primer CLAUDE.md

Ve al repo que más uses. Crea un CLAUDE.md con: stack, 3 convenciones, comandos test/lint/build, "no tocar". Compáralo con Claude antes y después.

02 · 30 MIN

El test que falla

Coge un test que falla en tu repo. Pide a Claude Code que lo arregle. Sin tocar nada tú. Observa cuántas iteraciones hace y dónde se atasca.

03 · 45 MIN

Tu primer slash command

Crea ~/.claude/commands/dbt-doc.md: "lee este modelo dbt y genera la sección description + columns en YAML". Pruébalo en 3 modelos.

04 · 1H

Routing manual

Instal·la Codex CLI. La misma tarea (refactor pequeño) hazla con Claude y con Codex. Compara: tiempo, calidad, qué cambió. Decide cuándo usar cada uno.

05 · 1H

Sub-agente Explore

Lánzalo con "busca todos los modelos que usan la tabla X y dime si hay duplicación". Que no leas los archivos. Confirma que la respuesta es correcta.

Ejercicios 6-10 · medium → boss

Sigue subiendo.

06 · 2H

Conecta un MCP a algo que uses

Elige uno: AWS MCP (Cost Explorer, S3, Lambda), Vercel MCP (deploys, projects, logs), GitHub MCP (PRs, issues, actions), Supabase / Postgres MCP, BigQuery MCP. Pídele cosas tipo "dime los 3 últimos deploys que han fallado y por qué" o "qué Lambda gasta más este mes". Sin abrir UIs.

07 · 2H

Hook de SessionStart

Configura un hook que al abrir Claude Code muestre: branch actual, último commit, tests rotos en CI, tareas con due-date hoy. Que el sistema te entrene a ti.

08 · 1 TARDE

Multi-agente con worktrees

Crea 2 worktrees (copias del repo en otro branch) del repo. Lanza 2 Claudes en paralelo con tmux (terminal de 2 paneles), cada uno con una tarea independiente. Tú haces de "lead": revisas y mergeas.

09 · 1 TARDE

Mini-vault propio

Carpeta ~/notes/ con tu propio CLAUDE.md, contactos, proyectos, decisiones. Conecta Claude Code a esa carpeta. Pídele cosas que requieran cross-reference.

10 · 1 FIN DE SEMANA · BOSS

El teu primer agent persistent · barato

Opción A · cero coste: instálalo en tu propio ordenador (el Mac/PC que ya tienes). Un cron en macOS launchd o en Windows Task Scheduler dispara el agente a las horas que quieras. Opción B · API gratis: usa modelos públicos de Groq, NVIDIA NIM, Cerebras, Together AI o OpenRouter — tienen tier gratuito con Llama 3, Qwen, Mixtral. Opción C · privado: Ollama + Qwen 7B local. La tarea inicial: cada noche resume tus PRs y mándalos a Slack/Telegram. Próximo paso: memoria persistente versionada en git.

Ejercicios 11-15 · proyectos serios de IA aplicada

Si te quieres flipar.

Estos son los que te llevan al siguiente nivel. Cada uno es un proyecto de portfolio.

11 · 1 FIN DE SEMANA

Tu propio MCP server custom

Coge una API que uses (Notion, Trello, Strava, lo que sea) y exponla como MCP. Tutorial oficial Anthropic + 200 líneas de Python. Resultat: Claude Code puede leer tu Notion personal o trackear tus carreras.

12 · 1 FIN DE SEMANA

RAG sobre tu PDF library

Coge 50 PDFs (libros, papers, notes). Embeddings con text-embedding-3, almacenas en pgvector o Chroma local. Slash command /biblio "qué dice X sobre Y". Tu segundo cerebro literal.

13 · 1 FIN DE SEMANA

Eval pipeline para un prompt

Coge un prompt que uses mucho. Crea 30 casos test (input + output esperado). Mete Promptfoo o RAGAS. Compara 3 modelos (Sonnet vs Haiku vs Qwen). Dashboard con métricas. Cambia cómo eliges modelo para siempre.

14 · 1 SEMANA

Mini-Devin: agente que abre PRs solo

Bot que escucha issues con tag good-first-bug, los lee, intenta resolver, abre PR. Webhook + Claude Code SDK. Empieza en tu repo. Bonus: añade verificación con tests antes de pushear.

15 · 2 SEMANAS · MEGA-BOSS

Tu propio agente persistente full-stack

Une todo: agente persistente en tu Mac/PC → memoria git versionada → routing entre 3 modelos → MCP custom → bridges (WhatsApp/Telegram/Slack) → cron + webhooks → guardrails de seguridad → dashboard simple para verlo trabajar. Output: un compañero digital que te escribe él por la mañana, te recuerda meetings, hace deploys cuando le pides desde el bus, y aprende de tus correcciones cada semana. Esto en CV vale más que cualquier curso.

Para seguir cuando me hayas dejado de oír

Recursos.

Cursos

  • Anthropic Skilljar (oficial)
  • Claude Code cheat sheet (storyfox)
  • DeepLearning.AI cursos cortos sobre agents
  • Spec-driven development guide (augmentcode)

Frameworks

  • oh-my-claudecode (OMC)
  • Aider · Cline · Continue
  • n8n para workflows visuales
  • litellm como proxy multimodelo

Comptes a seguir

  • @simonw · Simon Willison, todo lo de LLM
  • @swyx · AI engineering daily
  • @AnthropicAI · oficial
  • @shannholmberg · vps-agents pattern
  • @karpathy · fundamentos
  • @hwchase17 · LangChain

Newsletters

  • Latent Space (swyx)
  • Simon Willison's Weblog
  • Import AI (Jack Clark)

MCPs por perfil

  • Backend / cloud: AWS, GitHub, Vercel, Datadog, Sentry
  • Frontend: Vercel, Figma, Storybook
  • Data: BigQuery, Snowflake, dbt, Airflow, Dagster
  • Productividad: Atlassian (Jira+Confluence), Slack, Notion, Linear
  • Universal: awesome-mcp-servers

Repos para inspirarte

  • anthropic-cookbook
  • awesome-mcp-servers
  • oh-my-claudecode
  • continue.dev recipes
Tancament
"Fa anys que tractem l'LLM com un cercador amb frases. És un company de feina barat, persistent i paral·lel.

La diferència entre qui el fa servir com a xat i qui el fa servir com a agent és la diferència entre Excel i Excel amb macros — el segon escala, el primer no.

Ja tens Claude Code. L'únic que et falta és donar-li mans, memòria i un objectiu."
anthropic.skilljar.com cc.storyfox.cz @simonw @swyx augmentcode.com/guides/vibe-coding-vs-spec-driven-development
navegar F pantalla completa I índex

Índice completo

Click en cualquier slide para saltar. Cierra con Esc o el botón ×.