Hoe gebruik je Claude zonder door je limiet te gaan?
14 praktische tips om tokens en context slim te beheren
Zet bestanden om voor upload
Doe dit:
Vermijd pdf’s, screenshots en afbeeldingen. Plak de tekst in een document, exporteer als .md en upload dat bestand.
De berekening:
1 pdf-pagina = ongeveer 1.500–3.000 tokens. Dezelfde tekst in markdown = minder dan 200 tokens.
Plan in chat, bouw in Cowork
Doe dit:
Start in chat en maak eerst structuur en outline. Werk het daarna pas uit in Cowork.
De berekening:
Bestanden maken verbruikt meer tokens dan gewone chat.
Zeg: stel mij vragen
Doe dit:
Schrijf: “Ik wil [taak] tot [succescriteria]. Stel mij vragen.”
De berekening:
Opties aanklikken kost bijna 0 tokens. Een prompt van 500 woorden kost ongeveer 500 tokens.
Verbeter zonder alles opnieuw te doen
Doe dit:
Zeg: “Herwerk alleen sectie 3. Laat de rest gelijk.” Gebruik liefst “Edit” op je oorspronkelijke bericht.
De berekening:
Alles opnieuw laten maken kost opnieuw outputtokens. Claude leest ook alle extra correctieberichten opnieuw.
Bundel taken in één bericht
Doe dit:
Vraag in één keer: “Vat samen, maak een lijst en stel een titel voor.”
De berekening:
3 losse berichten = 3 keer context laden. 1 bericht = 1 keer context laden.
Hergebruik je promptstructuur
Doe dit:
Bewaar een promptbibliotheek en vervang alleen het variabele deel.
De berekening:
Stabiele prompts besparen tokens zonder je workflow te veranderen.
Kies het juiste model
Doe dit:
Gebruik Sonnet of Haiku voor lichte taken. Gebruik Opus + Extended Thinking voor zwaar denkwerk.
De berekening:
Chat is het lichtst, Cowork het zwaarst. Gebruik geen zwaarder model dan nodig.
Trim je bestanden en mappen
Doe dit:
Hou je “over mij”-bestand kort en voeg alleen bestanden toe die nodig zijn voor deze taak.
De berekening:
Elk extra bestand wordt telkens opnieuw gelezen. Minder ballast = minder tokens.
Start opnieuw in plaats van eindeloos bij te sturen
Doe dit:
Als Cowork verkeerd zit, gebruik “Restart the conversation from here” vanaf een eerder punt.
De berekening:
20 berichten ≈ 105.000 tokens. 30 berichten ≈ 232.000 tokens.
Vat elke 15–20 berichten samen
Doe dit:
Laat Claude de belangrijke punten samenvatten, kopieer de briefing en start een nieuwe sessie.
De berekening:
In één meting ging 98,5% van de tokens naar oude berichten; slechts 1,5% naar het echte antwoord.
Nieuw onderwerp = nieuwe chat
Doe dit:
Verander je onderwerp? Start een nieuwe chat.
De berekening:
Anders betaal je tokens voor irrelevante context.
Zet functies uit die je niet nodig hebt
Doe dit:
Zet web search en connectors alleen aan voor de taak die ze echt nodig heeft.
De berekening:
Minder opgehaalde resultaten = minder tokens.
Gebruik projecten voor terugkerende bestanden
Doe dit:
Upload terugkerende pdf’s één keer in een project en werk daarbinnen verder.
De berekening:
Hergebruikte projectcontext telt niet op dezelfde manier mee.
Stel voorkeuren in, zet memory uit
Doe dit:
Stel je schrijfstijl één keer in bij je voorkeuren. Zet Memory uit als je kosten wil beperken.
De berekening:
Zonder voorkeuren verlies je vaak 3–5 berichten aan dezelfde uitleg. Eén setup = blijvende besparing.
