JSON을 그대로 LLM에 넣지 마라 — 데이터 포맷 9종 토큰 비용 실측
같은 50개 레코드를 JSON·YAML·CSV·TSV·XML 등 9가지 포맷으로 직렬화해 tiktoken으로 토큰을 직접 측정했다. 평탄한 데이터는 TSV가 pretty JSON 대비 62% 저렴했고, 중첩 데이터는 결론이 뒤집힌다.
jangwook.net
Personal technical notes on AI agents, automation, developer tools, and the process of building software.
Latest Notes
The root page stays intentionally small. Choose a language, then read the full archive and related posts there.
AI 에이전트, 자동화, 개발 도구, 소프트웨어 제작 과정을 한국어로 기록합니다.
같은 50개 레코드를 JSON·YAML·CSV·TSV·XML 등 9가지 포맷으로 직렬화해 tiktoken으로 토큰을 직접 측정했다. 평탄한 데이터는 TSV가 pretty JSON 대비 62% 저렴했고, 중첩 데이터는 결론이 뒤집힌다.
@modelcontextprotocol/sdk v1.29.0을 직접 설치해 TypeScript MCP 클라이언트를 만들어봤다. Claude Desktop 없이 MCP 서버의 tool을 프로그래밍으로 호출하고 resource를 읽는 실전 가이드. 실제 실행 로그와 에러 처리 패턴 포함.
Agno v2.6.17(구 phidata)로 Gemini 기반 AI 에이전트를 직접 구현했다. Calculator·Wikipedia 툴, 구조화 출력, 멀티 에이전트 팀까지 실행 로그로 검증. output_schema 혼동, deprecated 모델 ID 등 실제 트랩도 기록한다.
Personal notes on AI agents, automation, developer tools, and building software.
I serialized the same 50 records into JSON, YAML, CSV, TSV, XML and more, then counted tokens with tiktoken. For flat data, TSV was 62% cheaper than pretty JSON. For nested data, the answer flips.
I built a TypeScript MCP client with @modelcontextprotocol/sdk v1.29.0: calling server tools and reading resources programmatically, without Claude Desktop.
I ran Agno v2.6.17 (formerly Phidata) with Gemini: Calculator, Wikipedia, structured output, and multi-agent teams, plus the real traps I hit along the way.
AIエージェント、自動化、開発ツール、ソフトウェア開発の記録です。
同じ50件のレコードをJSON・YAML・CSV・TSV・XMLなど9形式に直列化し、tiktokenでトークンを実測した。平坦なデータはTSVがpretty JSONより62%安く、ネストすると結論が逆転する。
@modelcontextprotocol/sdk v1.29.0を実際にインストールしてTypeScript MCPクライアントを作った。 Claude Desktopなしでサーバーのツールをプログラムから呼び出す実践ガイド。 実際の実行ログとエラー処理パターンも含む。
phidataからリブランドされたAgno v2.6.17をサンドボックスで検証。Calculator・Wikipedia・構造化出力・マルチエージェントチームまで実際の実行ログと共に記録。output_schema vs output_model の混同、非推奨モデルID、Team API変更点など実際に遭遇したトラップも正直に残す。
记录 AI 代理、自动化、开发工具和软件构建过程。
把同样的50条记录序列化成JSON、YAML、CSV、TSV、XML等9种格式,用tiktoken实测token。平坦数据下TSV比pretty JSON便宜62%,而数据一旦嵌套,结论就反转。
我亲自安装了 @modelcontextprotocol/sdk v1.29.0,构建了一个 TypeScript MCP 客户端。 不依赖 Claude Desktop,通过编程方式调用 MCP 服务器工具和读取资源的实战指南,包含真实运行日志和错误处理模式。
在沙盒中安装并验证了从 phidata 更名的 Agno v2.6.17,包含 Calculator、Wikipedia、结构化输出和多智能体团队的实际执行日志。同时诚实记录了亲历的各种陷阱:output_schema 与 output_model 混淆、废弃的模型 ID、Team API 参数变更。