Vývoj dátových formátov rozpráva fascinujúci príbeh o tom, ako sa technológie prispôsobujú meniacim sa potrebám. Od jednoduchých súborov INI, cez štruktúrované a rozvláčne XML, praktické JSON, ľudsky čitateľné YAML, až po TOON formát optimalizovaný pre éru umelej inteligencie. Každý z nich vznikol ako odpoveď na konkrétne výzvy svojej doby.
Dnes, keď veľké jazykové modely (LLM) menia spôsob, akým spracúvame a vymieňame informácie, sa do popredia dostáva nová metrika: tokenová efektivita. Každý token stojí peniaze a energiu a práve tu prichádza TOON so svojou ambíciou stať sa preferovaným formátom pre AI vývojárov.
Krátky exkurz do histórie dátových formátov
INI súbory
Formát .ini patril medzi prvé spôsoby ukladania konfigurácií. Používa jednoduché kľúč-hodnota zápisy zoskupené do sekcií:
[database]
host=localhost
port=5432
username=dbadmin
password=superheslo
Ich sila je v jednoduchosti, preto sú dodnes bežné v nastaveniach aplikácií či Windows systémov.
XML
XML priniesol striktne definovanú štruktúru, validáciu a hierarchiu. Stal sa základom pre SOAP API, dokumentové systémy či skoré webové služby.
Množstvo značiek zvyšovalo veľkosť aj pracnosť zápisu.
JSON
Príchod JSON-u znamenal revolúciu. Je ľahký, ľudsky čitateľný a pre stroje rýchlo spracovateľný. Vďaka optimálnemu pomeru medzi jednoduchosťou a štruktúrou sa stal de facto štandardom pre API a webové služby.
YAML
S rastom automatizácie a DevOps komunít rástol dopyt po ešte prívetivejšom formáte. YAML stavil na odsadenie a minimum interpunkcie. Je skvelý pre konfiguráciu napríklad v CI/CD, no jeho citlivosť na odsadenie často spôsobuje problémy pri parsovaní.
TOON: Nová éra dátových formátov
S príchodom LLM-ov sa objavila nová výzva: akékoľvek zbytočné znaky = zbytočné tokeny. A tokeny sú to, za čo sa platí. Z toho dôvodu vznikol TOON (Token-Oriented Object Notation) , formát navrhnutý špeciálne pre efektívnu prácu s jazykovými modelmi.
users[1]{id,name,role}:
1,Sreeni,admin
TOON nie je len ďalší serializačný formát. Je to optimalizovaný spôsob reprezentácie dát, ktorý reflektuje spôsob, akým LLM pracujú s textom.
Moderná výzva: prečo JSON už nemusí stačiť
JSON je stále skvelý formát. No pri LLM workflowoch platí jednoduchá rovnica:
čím viac tokenov → tým vyššie náklady → tým pomalšie spracovanie.
Ak dokážeme rovnaké dáta zapísať s o 50 % menším počtom tokenov, výsledný rozdiel môže byť výrazný a to najmä pri veľkých alebo častých požiadavkách.
Čo je JSON?
JSON (JavaScript Object Notation) je textový formát založený na kľúčoch a hodnotách. Kedysi úzko spätý s JavaScriptom, dnes univerzálny a podporovaný prakticky každým programovacím jazykom.
Kľúčové vlastnosti JSON-u:
- používa
{},[],:,, - veľmi čitateľný
- podporuje zložitú štruktúru a vnorené objekty
- kompatibilný s takmer každým systémom
- mierne verbózny, najmä pri opakujúcich sa kľúčoch
Príklad:
Čo je TOON?
TOON (Token-Oriented Object Notation) je nový formát určený pre aplikácie, ktoré komunikujú s AI modelmi. Cieľom je minimalizovať tokeny a maximalizovať štruktúru.
Kľúčové vlastnosti TOON-u:
- založený na odsadení a tabuľkových hlavičkách
- používa o 30–60 % menej tokenov ako JSON
- extrémne kompaktný
- pôsobí podobne ako CSV spojené s JSON
- optimalizovaný pre spracovanie v LLM
Example:
users[3]{id,name,rola,mail}:
1,Michal,admin, michal@mail.ma
2,Eva,admin,eva@mail.ma
3,Boris,user,boris@mail.ma
TOON vs JSON: Kľúčové rozdiely
1. Syntax a štruktúra
JSON: množstvo zátvoriek, znakov a opakujúcich sa kľúčov.
TOON: hlavičky definujú stĺpce, dáta sa ukladajú čisto a kompaktne.
2. Tokenová efektivita
Pri LLM pracovných tokoch je toto zásadné.
| Formát | Tokeny | Úspora |
|---|---|---|
| JSON | ~89 | – |
| TOON | ~45 | ~50 % |
3. Čitateľnosť
JSON je mainstream, všetci ho poznajú.
TOON je nový, no pri opakujúcich sa dátach pôsobí intuitívne – „CSV ponorené v hierarchii“.
4. Použitie v praxi
JSON
- REST API
- webové aplikácie
- vysoká kompatibilita
TOON
- LLM agenty
- AI systémy zdieľajúce štruktúrované dáta
- veľké datasetové prenosy, kde záleží na tokenoch
Kedy použiť JSON a kedy TOON?
Použi JSON, keď:
- potrebuješ univerzálnu kompatibilitu
- pracuješ na klasických API alebo webových službách
- tím je zvyknutý na JSON
- nechceš riešiť nový tooling
Použi TOON, keď:
- pracuješ s LLM (ChatGPT, Claude, Mistral…)
- potrebuješ čo najmenšie tokenové náklady
- spracovávaš veľké tabuľkové alebo opakujúce sa dáta
- buduješ AI agentov a pipeline orientované na text
Podpora a nástroje
JSON
- dostupný v každom jazyku
- bohatý tooling (validátory, lintery, IDE podpora)
TOON
- JavaScript/TypeScript: https://github.com/toon-format/toon
- Python: https://pypi.org/project/toon-py/
- Konvertory:
Hoci oba formáty riešia podobné úlohy, každý exceluje v inej oblasti. JSON ostáva spoľahlivým štandardom pre výmenu dát medzi systémami, zatiaľ čo TOON reaguje na rastúce požiadavky AI aplikácií, ktoré potrebujú minimalizovať tokeny a náklady. V najbližších rokoch tak bude výhodné kombinovať ich JSON tam, kde je dôležitá kompatibilita, a TOON všade tam, kde hrá prím výkon a efektivita v LLM prostredí.