AI

TOON vs JSON: Súboj moderných dátových formátov

Vývoj dátových formátov rozpráva fascinujúci príbeh o tom, ako sa technológie prispôsobujú meniacim sa potrebám. Od jednoduchých súborov INI, cez štruktúrované a rozvláčne XML, praktické JSON, ľudsky čitateľné YAML, až po TOON formát optimalizovaný pre éru umelej inteligencie. Každý z nich vznikol ako odpoveď na konkrétne výzvy svojej doby.

Dnes, keď veľké jazykové modely (LLM) menia spôsob, akým spracúvame a vymieňame informácie, sa do popredia dostáva nová metrika: tokenová efektivita. Každý token stojí peniaze a energiu a práve tu prichádza TOON so svojou ambíciou stať sa preferovaným formátom pre AI vývojárov.

Krátky exkurz do histórie dátových formátov

INI súbory

Formát .ini patril medzi prvé spôsoby uklada­nia konfigurácií. Používa jednoduché kľúč-hodnota zápisy zoskupené do sekcií:

[database]
host=localhost
port=5432
username=dbadmin
password=superheslo

Ich sila je v jednoduchosti, preto sú dodnes bežné v nastaveniach aplikácií či Windows systémov.

XML

XML priniesol striktne definovanú štruktúru, validáciu a hierarchiu. Stal sa základom pre SOAP API, dokumentové systémy či skoré webové služby.

Množstvo značiek zvyšovalo veľkosť aj pracnosť zápisu.

JSON

Príchod JSON-u znamenal revolúciu. Je ľahký, ľudsky čitateľný a pre stroje rýchlo spracovateľný. Vďaka optimálnemu pomeru medzi jednoduchosťou a štruktúrou sa stal de facto štandardom pre API a webové služby.

YAML

S rastom automatizácie a DevOps komunít rástol dopyt po ešte prívetivejšom formáte. YAML stavil na odsadenie a minimum interpunkcie. Je skvelý pre konfiguráciu napríklad v CI/CD, no jeho citlivosť na odsadenie často spôsobuje problémy pri parsovaní.

TOON: Nová éra dátových formátov

S príchodom LLM-ov sa objavila nová výzva: akékoľvek zbytočné znaky = zbytočné tokeny. A tokeny sú to, za čo sa platí. Z toho dôvodu vznikol TOON (Token-Oriented Object Notation) , formát navrhnutý špeciálne pre efektívnu prácu s jazykovými modelmi.

users[1]{id,name,role}:
1,Sreeni,admin

TOON nie je len ďalší serializačný formát. Je to optimalizovaný spôsob reprezentácie dát, ktorý reflektuje spôsob, akým LLM pracujú s textom.

Moderná výzva: prečo JSON už nemusí stačiť

JSON je stále skvelý formát. No pri LLM workflowoch platí jednoduchá rovnica:
čím viac tokenov → tým vyššie náklady → tým pomalšie spracovanie.

Ak dokážeme rovnaké dáta zapísať s o 50 % menším počtom tokenov, výsledný rozdiel môže byť výrazný a to najmä pri veľkých alebo častých požiadavkách.

Čo je JSON?

JSON (JavaScript Object Notation) je textový formát založený na kľúčoch a hodnotách. Kedysi úzko spätý s JavaScriptom, dnes univerzálny a podporovaný prakticky každým programovacím jazykom.

Kľúčové vlastnosti JSON-u:

  • používa {}[]:,
  • veľmi čitateľný
  • podporuje zložitú štruktúru a vnorené objekty
  • kompatibilný s takmer každým systémom
  • mierne verbózny, najmä pri opakujúcich sa kľúčoch

Príklad:

Čo je TOON?

TOON (Token-Oriented Object Notation) je nový formát určený pre aplikácie, ktoré komunikujú s AI modelmi. Cieľom je minimalizovať tokeny a maximalizovať štruktúru.

Kľúčové vlastnosti TOON-u:

  • založený na odsadení a tabuľkových hlavičkách
  • používa o 30–60 % menej tokenov ako JSON
  • extrémne kompaktný
  • pôsobí podobne ako CSV spojené s JSON
  • optimalizovaný pre spracovanie v LLM

Example:

users[3]{id,name,rola,mail}:
1,Michal,admin, michal@mail.ma
2,Eva,admin,eva@mail.ma
3,Boris,user,boris@mail.ma

TOON vs JSON: Kľúčové rozdiely

1. Syntax a štruktúra

JSON: množstvo zátvoriek, znakov a opakujúcich sa kľúčov.
TOON: hlavičky definujú stĺpce, dáta sa ukladajú čisto a kompaktne.

2. Tokenová efektivita

Pri LLM pracovných tokoch je toto zásadné.

FormátTokenyÚspora
JSON~89
TOON~45~50 %

3. Čitateľnosť

JSON je mainstream, všetci ho poznajú.
TOON je nový, no pri opakujúcich sa dátach pôsobí intuitívne – „CSV ponorené v hierarchii“.

4. Použitie v praxi

JSON

  • REST API
  • webové aplikácie
  • vysoká kompatibilita

TOON

  • LLM agenty
  • AI systémy zdieľajúce štruktúrované dáta
  • veľké datasetové prenosy, kde záleží na tokenoch

Kedy použiť JSON a kedy TOON?

Použi JSON, keď:

  • potrebuješ univerzálnu kompatibilitu
  • pracuješ na klasických API alebo webových službách
  • tím je zvyknutý na JSON
  • nechceš riešiť nový tooling

Použi TOON, keď:

  • pracuješ s LLM (ChatGPT, Claude, Mistral…)
  • potrebuješ čo najmenšie tokenové náklady
  • spracovávaš veľké tabuľkové alebo opakujúce sa dáta
  • buduješ AI agentov a pipeline orientované na text

Podpora a nástroje

JSON

  • dostupný v každom jazyku
  • bohatý tooling (validátory, lintery, IDE podpora)

TOON


Hoci oba formáty riešia podobné úlohy, každý exceluje v inej oblasti. JSON ostáva spoľahlivým štandardom pre výmenu dát medzi systémami, zatiaľ čo TOON reaguje na rastúce požiadavky AI aplikácií, ktoré potrebujú minimalizovať tokeny a náklady. V najbližších rokoch tak bude výhodné kombinovať ich JSON tam, kde je dôležitá kompatibilita, a TOON všade tam, kde hrá prím výkon a efektivita v LLM prostredí.

Súvisiace príspevky

Keď sa AI stane parťákom aj pre „nelajka“

Krstný otec AI varuje: Máme dva roky na to, aby sme zmenili kurz

Google AI Overviews a konkurenčné AI vyhľadávacie nástroje