Llana 3.2 · Släppt mars 2026Volym II · Nummer 07

En modell som tänker, tålmodigt, i offentligheten.

Llana är Kapllans flaggskepp inom resonemang — byggd för långsiktiga problem där formen på ett bra svar inte är uppenbar. Den läser noga, visar sina steg och föredrar att ha rätt framför att vara snabb.

Llana · liveCTX 128K · TEMP 0.3
Du
Varför flyter is på vatten?
Llana
De flesta fasta ämnen sjunker i sin egen vätska eftersom frysning packar molekylerna tätare. Vatten är ovanligt: när det kyls under 4°C tvingar vätebindningar molekylerna in i ett öppet hexagonalt gitter som tar mer plats, inte mindre. Is är ungefär 9% mindre tät än flytande vatten — så den flyter. En liten egenhet med stora följder: sjöar fryser från ytan och nedåt, och livet överlever vintern under isen.
§ I — Förmågor

Byggd för problem som inte ryms på en skärm.

01 / Reasoning

Long chains without drift.

Llana sustains multi-step arguments over thousands of tokens, re-reading its own premises when it needs to.

02 / Code

Reads codebases like prose.

128K context with structural awareness — call graphs, test intent, the difference between a bug and a choice.

03 / Research

Cites what it doesn't know.

Calibrated uncertainty — Llana will decline, hedge, or ask a clarifying question before it invents an answer.

04 / Agents

Plans. Executes. Reports back.

A tool-use interface that treats every action as revocable — Llana narrates its intent before it takes one.

05 / Vision

Describes what it sees.

Charts, diagrams, scanned pages, handwritten notes — Llana reads images with the same care it brings to text.

06 / Safety

Refuses with reasons.

Every refusal comes with a justification you can argue with — not a flat wall. Transparency is a design goal, not a patch.

§ II — Prestanda

På de tester vi litar på, och de vi inte litar på.

BenchmarkWhat it measuresLlana 3.2Prior SOTA
MMLU-ProMulti-discipline reasoning84.1 81.3
GPQA-DiamondGraduate science Q&A71.8 68.0
SWE-bench VerifiedReal-world coding tasks62.4 58.9
HumanEvalCode synthesis94.7 94.2
MATH-500Competition mathematics88.5 85.1
AIME 2025Olympiad-level problems54.2 52.0
"Vi vill inte ha en modell som talar tvärsäkert om allt. Vi vill ha en som känner formen på sin egen okunskap."
— Ur Llana 3:s tekniska rapport
§ III — Forskning

Öppet publicerat. Replikerat ute i världen.

26 Mar 2026

Calibrated refusal: learning when to not answer

A. Berisha · L. Mora · H. Tanaka · et al.
Pre-print
18 Feb 2026

Deliberation as inference: scaling thought at test time

M. Oduya · S. Whitlock · R. Kaur
NeurIPS '26
07 Jan 2026

The Llana 3 technical report

Kapllan Research
Report
22 Nov 2025

Interpretability without the spotlight effect

J. Pell · N. Moreau · D. Orlov
ICLR '26
§ IV — Så bygger vi

Tre arbetsprinciper. Alla förhandlingsbara.

Principle 01

Slow beats showy.

We release models when their behavior is understood, not when a demo looks clean. We would rather publish a late, calibrated model than an early, charismatic one.

Principle 02

Write it down.

Every capability claim is tied to a public evaluation, a dataset, or a paper. If we cannot describe how we measured it, we do not ship it.

Principle 03

Refuse the spectacle.

Research that doesn't reduce to a screenshot is still research. A good question is a legitimate deliverable. We pay for depth.

Arbeta med Llana.

Gratis under den öppna betafasen. API-åtkomst för forskare och utvecklare. Företagspiloter på begäran.