๋ฐ˜๋ณต๋˜๋Š” ๊ธฐ์ค€ ๋ฌธ์„œ๋Š” ์บ์‹œ์— ๋‘๊ณ , ์‚ฌ๋ฃŒ๋ณ„ ์ž…๋ ฅ๋งŒ ์ƒˆ๋กœ ์ฒ˜๋ฆฌํ•˜๋Š” Prompt Caching ๊ตฌ์กฐ๋ฅผ ํ‘œํ˜„ํ•œ AI ์ƒ์„ฑ ์ด๋ฏธ์ง€!

 

์ด๋ฒˆ ํ”„๋กœ์ ํŠธ์˜ ์ฒซ ๊ธ€์ด๋‹ˆ ๋ฐฐ๊ฒฝ์„ ๊ฐ„๋‹จํžˆ ์ ์ž๋ฉด, ํ•ด๋‹น ํ”„๋กœ์ ํŠธ๋Š” ์‚ฌ๋ฃŒ ๋ผ๋ฒจ๊ณผ ์„ฑ๋ถ„ ์ •๋ณด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋ณดํ˜ธ์ž์—๊ฒŒ ๋ณด์—ฌ์ค„ ์‚ฌ๋ฃŒ ์„ฑ์ ํ‘œ๋ฅผ ๋งŒ๋“ ๋‹ค. ์„ฑ์ ํ‘œ์˜ ํ•ต์‹ฌ ํŒ๋‹จ์€ ๊ทœ์น™ ๊ธฐ๋ฐ˜ ํŒŒ์ดํ”„๋ผ์ธ์ด ๋‹ด๋‹นํ•œ๋‹ค. LLM์€ ๋“ฑ๊ธ‰์ด๋‚˜ ์‚ฌ์‹ค์„ ์ƒˆ๋กœ ํŒ๋‹จํ•˜์ง€ ์•Š๊ณ  ์ด๋ฏธ ๊ณ„์‚ฐ๋œ ๊ฒฐ๊ณผ๋ฅผ ๋ณดํ˜ธ์ž๊ฐ€ ์ฝ๊ธฐ ์‰ฌ์šด ๋ฌธ์žฅ์œผ๋กœ ๋‹ค๋“ฌ๋Š” ์—ญํ• ๋งŒ ๋งก๋Š”๋‹ค.

 

๊ทธ๋Ÿฐ๋ฐ ์ด ๋ฌธ์žฅ ๋‹ค๋“ฌ๊ธฐ ํ•œ ๋ฒˆ์— ์•ฝ `$0.06`์ด ๋‚˜์™”๋‹ค..

 

์ฒ˜์Œ์—๋Š” ๋ชจ๋ธ ๋‹จ๊ฐ€๋ถ€ํ„ฐ ์˜์‹ฌํ–ˆ๋‹ค.. ๋ฌธ์žฅ ๋ช‡ ๊ฐœ๋ฅผ ๋‹ค๋“ฌ๋Š” ์ผ์ธ๋ฐ ํ•œ ๋ฒˆ์— `$0.06`์ด๋ฉด ์šด์˜ ๋น„์šฉ์œผ๋กœ ๋ถ€๋‹ด์ด ํฌ๋‹ค๊ณ  ๋А๊ผˆ๋‹ค.

๋‹ค๋งŒ ๋ฐ”๋กœ ๋ชจ๋ธ์„ ๋‚ฎ์ถ”๊ฑฐ๋‚˜ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ค„์ด๊ธฐ ์ „์—, ๋จผ์ € ์‹ค์ œ usage๋ถ€ํ„ฐ ํ™•์ธํ–ˆ๋‹ค. ๋น„์šฉ์ด ์ •๋ง ์ด์ƒํ•˜๊ฒŒ ๋‚˜์˜จ ๊ฒƒ์ธ์ง€, ์•„๋‹ˆ๋ฉด ๋‚ด๊ฐ€ ์š”์ฒญ์˜ ํฌ๊ธฐ๋ฅผ ์ž‘๊ฒŒ ์ฐฉ๊ฐํ•˜๊ณ  ์žˆ์—ˆ๋Š”์ง€๋ถ€ํ„ฐ ๋ถ„๋ฆฌํ•ด์„œ ๋ด์•ผ ํ–ˆ๋‹ค.

 

ํ™•์ธํ•ด๋ณด๋‹ˆ ๊ณผ๊ธˆ ์ž์ฒด๋Š” ์ด์ƒํ•˜์ง€ ์•Š์•˜๋‹ค.

input_tokens: 14,448
output_tokens: 1,034
model: claude-sonnet-4-20250514
cache_creation_input_tokens: 0
cache_read_input_tokens: 0

 

Anthropic ๊ณต์‹ ๊ฐ€๊ฒฉํ‘œ ๊ธฐ์ค€์œผ๋กœ Claude Sonnet 4 ๊ณ„์—ด์€ ์ž…๋ ฅ `$3 / 1M tokens`, ์ถœ๋ ฅ `$15 / 1M tokens`๋‹ค.

๊ณ„์‚ฐ์€ ๋‹จ์ˆœํ–ˆ๋‹ค.

์ž…๋ ฅ: 14,448 * $3 / 1,000,000 = ์•ฝ $0.043
์ถœ๋ ฅ: 1,034 * $15 / 1,000,000 = ์•ฝ $0.015
ํ•ฉ๊ณ„: ์•ฝ $0.058

 

์ด๊ฑธ ๋ณด๋‹ˆ.. `$0.06`์€ ๋‹น์—ฐํ•œ ๊ณผ๊ธˆ์ด์—ˆ๋‹ค ๐Ÿฅฒ

 

(ํ•ด๋‹น ๋ฌธ๋‹จ์€ ์ฝ์ง€ ์•Š์•„๋„ ๊ดœ์ฐฎ์•„์š”!)

์ด ๊ณผ์ •์—์„œ ํ•˜๋‚˜ ๋” ๋ฐœ๊ฒฌํ•œ ๊ฒƒ๋„ ์žˆ์—ˆ๋‹ค. ๋‹น์‹œ ํ”„๋กœ์ ํŠธ์—์„œ ์“ฐ๋˜ `claude-sonnet-4-20250514`๋Š” 2026๋…„ 5์›” ๊ธฐ์ค€ Anthropic ๋ฌธ์„œ์—์„œ deprecated ์ƒํƒœ๋กœ ํ‘œ์‹œ๋˜์–ด ์žˆ์—ˆ๋‹ค. deprecated๋Š” ์•„์ง ๋™์ž‘ํ•˜์ง€๋งŒ ๋” ์ด์ƒ ๊ถŒ์žฅ๋˜์ง€ ์•Š๋Š” ์ƒํƒœ์ธ๋ฐ, retirement ์ดํ›„์—๋Š” ์‹คํŒจํ•  ์ˆ˜ ์žˆ๋‹ค. ๋ฌธ์„œ์— ์ ํžŒ retirement ์˜ˆ์ •์ผ์€ 2026๋…„ 6์›” 15์ผ ์ด์—ˆ๊ณ  ๋ฐ”๋กœ `claude-sonnet-4-6`์œผ๋กœ ๋ณ€๊ฒฝํ–ˆ๋‹ค ๐Ÿ˜Ž

 

๊ทธ๋ž˜์„œ ์ด ๋ฌธ์ œ๋Š” ๋‘ ๊ฐˆ๋ž˜์˜€๋‹ค.

 

ํ•˜๋‚˜๋Š” `$0.06`์ด ์™œ ๋‚˜์™”๋Š”์ง€ ์ดํ•ดํ•˜๋Š” ๊ฒƒ!

๋‹ค๋ฅธ ํ•˜๋‚˜๋Š” deprecated ๋ชจ๋ธ์„ ๊ณ„์† ์“ฐ์ง€ ์•Š๋„๋ก ๊ธฐ๋ณธ ๋ชจ๋ธ์„ ๋ฐ”๊พธ๋Š” ๊ฒƒ!

๋‘˜์€ ๊ด€๋ จ์€ ์žˆ์ง€๋งŒ ๊ฐ™์€ ๋ฌธ์ œ๋Š” ์•„๋‹ˆ์—ˆ๋‹ค. ๋ชจ๋ธ์„ ๋ฐ”๊พผ๋‹ค๊ณ  ์ด ์š”์ฒญ์ด ๊ฐ‘์ž๊ธฐ ์‹ธ์ง€๋Š” ๊ฒƒ์ด ์•„๋‹ˆ์—ˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.. Sonnet 4์™€ Sonnet 4.6์˜ ๊ธฐ๋ณธ ์ž…๋ ฅ/์ถœ๋ ฅ ๋‹จ๊ฐ€๋Š” ๊ฐ™์€ ๊ตฌ๊ฐ„์ด์—ˆ๊ณ  ๊ทธ๋ ‡๊ธฐ์— ๋น„์šฉ ๋ฌธ์ œ๋Š” ์š”์ฒญ ๊ตฌ์กฐ๋ฅผ ๋ด์•ผ ํ–ˆ๋‹ค.

 

๋‹ค๋งŒ ๋ฐ”๋กœ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ค„์ด๊ธฐ์—” ๋ถˆ์•ˆํ–ˆ๋‹ค. ์ด 1.4๋งŒ ํ† ํฐ ์•ˆ์—๋Š” ๋ฌด์˜๋ฏธํ•œ ๋ฌธ์žฅ์ด ์•„๋‹ˆ๋ผ, ์‚ฌ๋ฃŒ ์„ฑ์ ํ‘œ์˜ ํ’ˆ์งˆ์„ ๋งž์ถ”๊ธฐ ์œ„ํ•œ ๊ธฐ์ค€ ๋ฌธ์„œ์™€ ๋ชจ๋ฒ” ์˜ˆ์‹œ๊ฐ€ ๋“ค์–ด ์žˆ์—ˆ๋‹ค. ๊ณผ๊ธˆ์ด ์ •์ƒ์ด๋ผ๋Š” ๊ฒƒ๊ณผ, ๊ทธ ํ”„๋กฌํ”„ํŠธ ์–‘์ด ์ตœ์ ์ด๋ผ๋Š” ๊ฒƒ์€ ๋‹ค๋ฅธ ๋ฌธ์ œ์˜€๊ธฐ์—.. ๋น„์šฉ์ด ์™œ ๋ฐœ์ƒํ–ˆ๋Š”์ง€ ํ™•์ธํ•˜๊ณ  ๋‚˜์„œ ๋ฌด์—‡์„ ์œ ์ง€ํ•˜๊ณ  ๋ฌด์—‡์„ ์ค„์ผ ์ˆ˜ ์žˆ๋Š”์ง€ ๋‚˜๋ˆ ์„œ ๋ด์•ผ ํ–ˆ๋‹ค.

 

์—ฌ๊ธฐ์„œ๋ถ€ํ„ฐ ์ฝ๊ธฐ ํŽธํ•˜๊ฒŒ ์ฃผ์ œ๋ฅผ ๋‚˜๋ˆ ๋ณด๊ฒ ๋‹ค

 

๋ฌธ์ œ๋Š” ๋ชจ๋ธ์ด ์•„๋‹ˆ๋ผ ์š”์ฒญ ๊ตฌ์กฐ์˜€๋‹ค

์‚ฌ๋ฃŒ ์„ฑ์ ํ‘œ๋ฅผ ๋งŒ๋“ค ๋•Œ LLM ํ˜ธ์ถœ์—๋Š” ์‚ฌ๋ฃŒ๋งˆ๋‹ค ๋‹ฌ๋ผ์ง€๋Š” ์ •๋ณด๋งŒ ๋“ค์–ด๊ฐ€์ง€ ์•Š์•˜๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ํŠน์ • ์ œํ’ˆ์˜ ์›์žฌ๋ฃŒ, ๋ณด์ฆ์„ฑ๋ถ„, ์นผ์Š˜/์ธ ํ‘œ๊ธฐ ์—ฌ๋ถ€, ์ฒ˜๋ฐฉ์‹ ์—ฌ๋ถ€์ฒ˜๋Ÿผ ์ œํ’ˆ ๋ผ๋ฒจ์—์„œ ์ถ”์ถœํ•œ ์‚ฌ์‹ค ๋ฐ์ดํ„ฐ๊ฐ€ ๋“ค์–ด๊ฐ„๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ์—ฌ๊ธฐ์— ๋”ํ•ด, ๋ฌธ์žฅ ํ’ˆ์งˆ์„ ๋งž์ถ”๊ธฐ ์œ„ํ•œ ๊ณ ์ • ๋ฌธ์„œ๋„ ํ•จ๊ป˜ ๋“ค์–ด๊ฐ”๋‹ค.

 

์˜ˆ๋ฅผ ๋“ค๋ฉด ์ด๋Ÿฐ ๊ฒƒ๋“ค์ด๋‹ค.

- 2026๋…„ ์‚ฌ๋ฃŒ ์„ฑ์ ํ‘œ ์ž‘์„ฑ ๊ฐ€์ด๋“œ
- ๋ณดํ˜ธ์ž์šฉ ๋ฌธ์žฅ ํ†ค์•ค๋งค๋„ˆ
- ๋‚ด๋ถ€ ์ฑ„์  ์šฉ์–ด๋ฅผ ๋…ธ์ถœํ•˜์ง€ ๋ง๋ผ๋Š” ๊ทœ์น™
- ์นผ์Š˜/์ธ ๋ˆ„๋ฝ, ์ฒ˜๋ฐฉ์‹ ๋“ฑ ํ•„์ˆ˜ ๊ณ ์ง€ ๋ฌธ๊ตฌ
- ์ฐธ๊ณ ๋ฅผ ์œ„ํ•œ ๋ชจ๋ฒ” ์„ฑ์ ํ‘œ ์˜ˆ์‹œ

 

์ด ๋ฌธ์„œ๋“ค์€ ์‚ฌ๋ฃŒ๊ฐ€ ๋ฐ”๋€Œ์–ด๋„ ๊ฑฐ์˜ ๋™์ผํ•˜๋‹ค. ๋กœ์–„์บ๋‹Œ์„ ๋ถ„์„ํ•  ๋•Œ๋„ ๋“ค์–ด๊ฐ€๊ณ , ๋‹ค๋ฅธ ๋ธŒ๋žœ๋“œ๋ฅผ ๋ถ„์„ํ•  ๋•Œ๋„ ๋“ค์–ด๊ฐ„๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ์บ์‹ฑ์ด ์—†์œผ๋ฉด ๋งค ์š”์ฒญ๋งˆ๋‹ค ๊ฐ™์€ ๋ฌธ์„œ๋ฅผ ์ƒˆ ์ž…๋ ฅ ํ† ํฐ์œผ๋กœ ๊ฒฐ์ œํ•œ๋‹ค.

 

๊ทธ๋ ‡๊ฒŒ ์ •๋ฆฌํ•œ ์š”์ฒญ ๊ตฌ์กฐ ๋ฌธ์ œ๋Š” ์ด๋ ‡๋‹ค.

์‚ฌ๋ฃŒ๋ณ„๋กœ ๋‹ฌ๋ผ์ง€๋Š” ์ •๋ณด๋Š” ์ผ๋ถ€์ธ๋ฐ, ์‚ฌ๋ฃŒ๋ณ„๋กœ ๋‹ฌ๋ผ์ง€์ง€ ์•Š๋Š” ๊ธด ๊ธฐ์ค€ ๋ฌธ์„œ๊ฐ€ ๋งค๋ฒˆ ์ƒˆ๋กœ ์ฝํžˆ๊ณ  ์žˆ์—ˆ๋‹ค.

 

ํ•˜์ง€๋งŒ ์ด ๊ธฐ์ค€ ๋ฌธ์„œ๋ฅผ ์–ผ๋งˆ๋‚˜ ์ค„์ผ ์ˆ˜ ์žˆ๋Š”์ง€๋Š” ๋ณ„๋„๋ผ ์ƒ๊ฐํ•œ๋‹ค. ๋ฌด์ž‘์ • ์ค„์ด๋ฉด ๋น„์šฉ์€ ๋‚ด๋ ค๊ฐ€๊ฒ ์ง€๋งŒ, ์„ฑ์ ํ‘œ ๋ฌธ์žฅ์ด ๋ชจ๋ฒ” ์„ฑ์ ํ‘œ ์˜ˆ์‹œ์—์„œ ๋ฉ€์–ด์งˆ ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋ž˜์„œ ์ฒซ ๋ฒˆ์งธ ์„ ํƒ์ง€๋Š” ํ”„๋กฌํ”„ํŠธ ์ถ•์†Œ๊ฐ€ ์•„๋‹ˆ๋ผ ์บ์‹ฑ์ด์—ˆ๋‹ค. ๊ฐ™์€ ๊ธฐ์ค€ ๋ฌธ์„œ๋ฅผ ์œ ์ง€ํ•˜๋˜, ๋ฐ˜๋ณต ์ž…๋ ฅ ๋น„์šฉ๋ถ€ํ„ฐ ์ค„์ด๋Š” ์ชฝ์ด ํ’ˆ์งˆ ๋ฆฌ์Šคํฌ๊ฐ€ ๊ฐ€์žฅ ์ž‘์•˜๋‹ค.

 

Prompt Caching์€ ๋‹ต๋ณ€ ์บ์‹œ๊ฐ€ ์•„๋‹ˆ๋‹ค

Prompt Caching์€ ์™„์„ฑ๋œ ์„ฑ์ ํ‘œ๋ฅผ ์ €์žฅํ•ด๋‘๋Š” ๊ธฐ๋Šฅ์ด ์•„๋‹ˆ๋‹ค. LLM ๋ชจ๋ธ์ด ๋ฐ˜๋ณต๋˜๋Š” ํ”„๋กฌํ”„ํŠธ ์•ž๋ถ€๋ถ„์„ ๋‹ค์‹œ ์ฒ˜๋ฆฌํ•˜์ง€ ์•Š๋„๋ก ์žฌ์‚ฌ์šฉํ•˜๋Š” ๊ธฐ๋Šฅ์ด๋‹ค.

 

์ด๋•Œ ๋ฐ˜๋ณต๋˜๋Š” ์•ž๋ถ€๋ถ„์„ ์บ์‹œ ๋Œ€์ƒ์ด ๋˜๋Š” ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๋ผ๊ณ  ๋ถ€๋ฅด๊ฒ ๋‹ค.

๋‚ด๊ฐ€ ์ƒ๊ฐํ•˜๋Š” ์ข‹์€ ๊ตฌ์กฐ๋Š” ์ด๋ ‡๋‹ค.

[๊ณ ์ • ์‹œ์Šคํ…œ ์ง€์นจ]
[์‚ฌ๋ฃŒ ์„ฑ์ ํ‘œ ์ž‘์„ฑ ๊ฐ€์ด๋“œ]
[๋ชจ๋ฒ” ์„ฑ์ ํ‘œ ์˜ˆ์‹œ]
[ํ•„์ˆ˜ ๊ณ ์ง€ ๊ทœ์น™]
-------------------------  ์—ฌ๊ธฐ๊นŒ์ง€๋ฅผ cache ๋Œ€์ƒ์œผ๋กœ ๋ดค๋‹ค
[์‚ฌ๋ฃŒ๋ณ„๋กœ ๋‹ฌ๋ผ์ง€๋Š” ์›์žฌ๋ฃŒ·์„ฑ๋ถ„ํ‘œ·๊ธ‰์—ฌ ์ •๋ณด]
[๋ฃฐ ์—”์ง„์ด ์ด๋ฏธ ๊ณ„์‚ฐํ•œ ๋“ฑ๊ธ‰ ๊ฒฐ๊ณผ]
[๋ฃฐ ์—”์ง„์ด ๋งŒ๋“  ๊ธฐ๋ณธ ์‚ฌ๋ฃŒ ๋“ฑ๊ธ‰ํ‘œ]
[์ด๋ฒˆ ์š”์ฒญ์˜ ์‚ฌ์šฉ์ž ์กฐ๊ฑด]

 

์œ„์ชฝ์˜ ๊ณ ์ • ์ง€์นจ๊ณผ ์˜ˆ์‹œ๋Š” ์‚ฌ๋ฃŒ๊ฐ€ ๋ฐ”๋€Œ์–ด๋„ ๊ฑฐ์˜ ๊ฐ™๋‹ค. ๊ทธ๋ž˜์„œ cache ๋Œ€์ƒ์ด ๋œ๋‹ค.

 

ํ•˜์ง€๋งŒ ๊ตฌ๋ถ„์„  ์•„๋ž˜์˜ ๋‚ด์šฉ์€ ์š”์ฒญ๋งˆ๋‹ค ๋‹ฌ๋ผ์ง„๋‹ค. ์ด ๊ฐ’๋“ค์€ cache ๋Œ€์ƒ์ด ์•„๋‹ˆ๋‹ค. ํŠนํžˆ `๋ฃฐ ์—”์ง„์ด ์ด๋ฏธ ๊ณ„์‚ฐํ•œ ๋“ฑ๊ธ‰ ๊ฒฐ๊ณผ`๋Š” LLM์ด ์ƒˆ๋กœ ๋งŒ๋“œ๋Š” ๊ฒฐ๊ณผ๊ฐ€ ์•„๋‹ˆ๋ผ, ๋ฃฐ ์—”์ง„์ด ๊ณ„์‚ฐํ•œ ๊ฒฐ๊ณผ๋ฅผ LLM์—๊ฒŒ ๋„˜๊ฒจ์ฃผ๋Š” ๊ฐ’์ด๋‹ค. LLM์€ ์ด ๊ฐ’์„ ๋ณด๊ณ  ๋ฌธ์žฅ์„ ๋งž์ถœ ๋ฟ, ๋“ฑ๊ธ‰ ์ž์ฒด๋ฅผ ๋ฐ”๊พธ๋ฉด ์•ˆ ๋œ๋‹ค.

 

๊ทธ๋ž˜์„œ ๋‚˜์œ ๊ตฌ์กฐ๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค๊ณ  ๋ณธ๋‹ค.

[์‚ฌ๋ฃŒ ์ด๋ฆ„]
[์‚ฌ์šฉ์ž ์กฐ๊ฑด]
[ํ˜„์žฌ ์‹œ๊ฐ„]
[๊ณ ์ • ๊ฐ€์ด๋“œ]
[๋ชจ๋ฒ” ์„ฑ์ ํ‘œ]

 

๋งค๋ฒˆ ๋ฐ”๋€Œ๋Š” ๊ฐ’์ด ์•ž์— ์„ž์ด๋ฉด cache hit๊ฐ€ ๊นจ์ง„๋‹ค. Prompt Caching์€ ๋™์ผํ•œ prefix๊ฐ€ ๋‹ค์‹œ ๋“ค์–ด์™”์„ ๋•Œ ํšจ๊ณผ๊ฐ€ ๋‚˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

 

Claude์—์„œ๋Š” ์–ด๋–ป๊ฒŒ ํ™•์ธํ•˜๋‚˜

Anthropic Claude API์—์„œ๋Š” Prompt Caching์„ ์“ฐ๋ ค๋ฉด ์š”์ฒญ์— `cache_control`์„ ๋„ฃ์–ด์•ผ ํ•œ๋‹ค.

(Anthropic์€ block๋ณ„ ์ง€์ • ์—†์ด top-level cache_control๋กœ breakpoint๋ฅผ ์ž๋™ ๋ฐฐ์น˜ํ•˜๋Š” ๋ฐฉ์‹๋„ ์ง€์›ํ•˜๋‹ˆ ์ด ๋ถ€๋ถ„ ๋งํฌ๋„ ์ฒจ๋ถ€ํ•ด ๋‘๊ฒ ๋‹ค!)

 

๊ทธ๋ฆฌ๊ณ  ์บ์‹ฑ์ด ์‹ค์ œ๋กœ ๋๋Š”์ง€๋Š” ์‘๋‹ต์˜ `usage`ํ•„๋“œ๋ฅผ ๋ณด๋ฉด ๋œ๋‹ค.

top-level ๋˜๋Š” content block ๋‹จ์œ„์˜ cache_control์„ ๋„ฃ๋Š”๋‹ค.

ํ•ต์‹ฌ ํ•„๋“œ๋Š” ์„ธ ๊ฐœ๋‹ค.

{
  "usage": {
    "input_tokens": 500,
    "cache_creation_input_tokens": 12095,
    "cache_read_input_tokens": 0,
    "output_tokens": 800
  }
}

 

์˜๋ฏธ๋Š” ์ด๋ ‡๋‹ค.

cache_creation_input_tokens
์ด๋ฒˆ ์š”์ฒญ์—์„œ ์บ์‹œ์— ์ƒˆ๋กœ ์“ด ํ† ํฐ ์ˆ˜

cache_read_input_tokens
์ด๋ฒˆ ์š”์ฒญ์—์„œ ์ด๋ฏธ ์บ์‹œ๋œ prefix๋ฅผ ์ฝ์€ ํ† ํฐ ์ˆ˜

input_tokens
์บ์‹œ๋˜์ง€ ์•Š์€ ์ผ๋ฐ˜ ์ž…๋ ฅ ํ† ํฐ ์ˆ˜

 

์ด ๋ถ€๋ถ„์€ ์‹ค์ œ๋กœ ๋‘ ๋ฒˆ ์—ฐ์† ํ˜ธ์ถœํ•ด์„œ ํ™•์ธํ–ˆ๋‹ค. ์ฒซ ๋ฒˆ์งธ ์š”์ฒญ์—์„œ๋Š” ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๊ฐ€ cache write๋กœ ์žกํžˆ๋Š”์ง€ ๋ณด๊ณ , ๊ฐ™์€ ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๋กœ ๋‘ ๋ฒˆ์งธ ์š”์ฒญ์„ ๋ณด๋‚ด cache read๊ฐ€ ์žกํžˆ๋Š”์ง€ ๋ดค๋‹ค. ๋น„์šฉ ๊ทธ๋ž˜ํ”„๋ฅผ ๋ˆˆ์œผ๋กœ ๋ณด๋Š” ๊ฒƒ๋ณด๋‹ค ์‘๋‹ต usage์— ์ฐํžˆ๋Š” ์ˆซ์ž๋ฅผ ํ™•์ธํ•˜๋Š” ํŽธ์ด ํ›จ์”ฌ ๋ช…ํ™•ํ–ˆ๋‹ค. (usage๋Š” API ์‘๋‹ต JSON body ์•ˆ์˜ ํ•„๋“œ๋‹ค)

 

์ •์ƒ์ ์œผ๋กœ ์บ์‹œ๊ฐ€ ์žกํžˆ๋ฉด ์ฒซ ์š”์ฒญ๊ณผ ๋‘ ๋ฒˆ์งธ ์š”์ฒญ์˜ usage๊ฐ€ ๋‹ค๋ฅด๊ฒŒ ๋‚˜์˜จ๋‹ค.

<์ฒซ ๋ฒˆ์งธ ์š”์ฒญ>
cache_creation_input_tokens = 12095
cache_read_input_tokens = 0

<๋‘ ๋ฒˆ์งธ ์š”์ฒญ>
cache_creation_input_tokens = 0
cache_read_input_tokens = 12095

 

์ด ๊ฒฐ๊ณผ๋Š” ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ 12,095ํ† ํฐ์ด ์ฒซ ์š”์ฒญ์—์„œ ์บ์‹œ์— ์“ฐ์˜€๊ณ , ๋‘ ๋ฒˆ์งธ ์š”์ฒญ์—์„œ ์žฌ์‚ฌ์šฉ๋๋‹ค๋Š” ๋œป์ด๋‹ค.

๋ฐ˜๋Œ€๋กœ ์•„๋ž˜์ฒ˜๋Ÿผ ๋‚˜์˜ค๋ฉด ์บ์‹ฑ์ด ์•ˆ ๋œ ๊ฒƒ์ด๋‹ค.

cache_creation_input_tokens = 0
cache_read_input_tokens = 0

 

์ด๋•Œ๋Š” `cache_control`์ด ๋น ์กŒ๋Š”์ง€, ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๊ฐ€ ์š”์ฒญ๋งˆ๋‹ค ๋‹ฌ๋ผ์ง€๋Š”์ง€, ์ œํ’ˆ๋ณ„ ๋ฐ์ดํ„ฐ๊ฐ€ ์บ์‹œ ๊ตฌ๊ฐ„ ์•ˆ์— ์„ž์˜€๋Š”์ง€, ์บ์‹œ ์œ ํšจ์‹œ๊ฐ„์ด ์ง€๋‚ฌ๋Š”์ง€ ํ™•์ธํ•ด์•ผ ํ•œ๋‹ค.

 

Claude์—์„œ ์ „์ฒด ์ž…๋ ฅ ํ† ํฐ์„ ๋ณผ ๋•Œ๋„ ์ฃผ์˜๊ฐ€ ํ•„์š”ํ•˜๋‹ค. `input_tokens`๋งŒ ๋ณด๋ฉด ์ „์ฒด ์ž…๋ ฅ์ด ์•„๋‹ˆ๋‹ค.

const total_input_tokens =
    input_tokens
    + cache_creation_input_tokens
    + cache_read_input_tokens

 

ํ•œ ๋ฒˆ์˜ ํ…Œ์ŠคํŠธ ํ˜ธ์ถœ์—์„œ๋Š” usage๋ฅผ ์ง์ ‘ ๋ณด๋ฉด ๋œ๋‹ค. ํ•˜์ง€๋งŒ ์šด์˜ ํ™˜๊ฒฝ์—์„œ๋Š” ์š”์ฒญ์ด ๊ณ„์† ๋“ค์–ด์˜ด์œผ๋กœ ๋งค๋ฒˆ ์‘๋‹ต JSON์„ ์‚ฌ๋žŒ์ด ํ™•์ธํ•˜๊ธด ํž˜๋“ค๋‹ค๊ณ  ์ƒ๊ฐํ•œ๋‹ค. ๊ทธ๋ž˜์„œ ๋ฌธ์žฅ ๋‹ค๋“ฌ๊ธฐ ํ˜ธ์ถœ๋งˆ๋‹ค ์ตœ์†Œํ•œ ์•„๋ž˜ ๊ฐ’์€ ๋กœ๊ทธ๋‚˜ ๋ฉ”ํŠธ๋ฆญ์œผ๋กœ ๋‚จ๊ฒจ๋‘๋ ค ํ•œ๋‹ค.

provider
model
input_tokens
output_tokens
cache_creation_input_tokens
cache_read_input_tokens
copy_source report_reused
estimated_cost

 

์บ์‹ฑ์„ ์ ์šฉํ•œ ๋’ค์—๋Š” ๋‹จ์ˆœํžˆ ์ฒญ๊ตฌ ๊ธˆ์•ก์ด ์ค„์—ˆ๋Š”์ง€๋งŒ ๋ณด๋ฉด ๋ถ€์กฑํ•˜๋‹ค. Claude ์‘๋‹ต์˜ `cache_read_input_tokens`๊ฐ€ 0๋ณด๋‹ค ํฌ๊ฒŒ ๋‚˜์˜ค๋Š”์ง€ ํ™•์ธํ•ด์•ผ ํ•œ๋‹ค. ์ด ๊ฐ’์ด ์žˆ์–ด์•ผ ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋งค๋ฒˆ ์ƒˆ๋กœ ์ฝ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์‹ค์ œ๋กœ ์บ์‹œ์—์„œ ์žฌ์‚ฌ์šฉํ–ˆ๋‹ค๋Š” ๋œป์ด ๋œ๋‹ค!

 

์บ์‹œ๋Š” ์–ผ๋งˆ๋‚˜ ์œ ์ง€๋˜๋‚˜

๋‹ค๋งŒ ๋‹น์—ฐํ•˜๊ฒŒ๋„ ์บ์‹œ๋Š” ์˜๊ตฌ ์ €์žฅ์†Œ๊ฐ€ ์•„๋‹ˆ๋‹ค!

์œ ํšจ์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด ๋‹ค์Œ ์š”์ฒญ์€ ๋‹ค์‹œ cache miss๊ฐ€ ๋‚˜๊ณ , ๊ทธ ์ˆœ๊ฐ„ ์ž…๋ ฅ ๋น„์šฉ์ด ๋‹ค์‹œ ํŠ„๋‹ค ๐Ÿฅฒ 

 

Anthropic ๊ณต์‹ ๋ฌธ์„œ ๊ธฐ์ค€์œผ๋กœ Claude์˜ `ephemeral` cache๋Š” ๊ธฐ๋ณธ์ ์œผ๋กœ 5๋ถ„ lifetime์„ ๊ฐ€์ง„๋‹ค. 1์‹œ๊ฐ„ TTL๋„ ์„ ํƒํ•  ์ˆ˜ ์žˆ์ง€๋งŒ.. write ๋น„์šฉ์ด ๋” ๋น„์‹ธ๋‹ค..! (๊ทธ๋Ÿฌ๋‹ˆ ๋ฌด์ž‘์ • ์„ ํƒํ•˜์ง€ ๋ง์ž!)

 

๊ฐ€๊ฒฉ ๊ตฌ์กฐ๋Š” ์ด๋ ‡๋‹ค.

5๋ถ„ cache write: ์ผ๋ฐ˜ input ๊ฐ€๊ฒฉ์˜ 1.25๋ฐฐ
1์‹œ๊ฐ„ cache write: ์ผ๋ฐ˜ input ๊ฐ€๊ฒฉ์˜ 2๋ฐฐ
cache read: ์ผ๋ฐ˜ input ๊ฐ€๊ฒฉ์˜ 0.1๋ฐฐ

 

๋”ฐ๋ผ์„œ ํŠธ๋ž˜ํ”ฝ์ด ๊พธ์ค€ํžˆ ๋“ค์–ด์˜ค๋Š” ์„œ๋น„์Šค๋ผ๋ฉด 5๋ถ„ ์บ์‹œ๊ฐ€ ํšจ์œจ์ ์ด๋ผ ์ƒ๊ฐํ•œ๋‹ค. 5๋ถ„ ์•ˆ์— ๊ฐ™์€ ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๊ฐ€ ๋ฐ˜๋ณตํ•ด์„œ ์‚ฌ์šฉ๋˜๋ฉด cache read๊ฐ€ ๋ฐœ์ƒํ•˜๊ณ , ๊ณต์‹ ๋ฌธ์„œ ๊ธฐ์ค€์œผ๋กœ 5๋ถ„ ์บ์‹œ๋Š” ๊ณ„์† refresh๋  ์ˆ˜ ์žˆ๋‹ค.

 

๋ฐ˜๋Œ€๋กœ ์š”์ฒญ ๊ฐ„๊ฒฉ์ด 5๋ถ„์„ ์ž์ฃผ ๋„˜๋Š”๋‹ค๋ฉด ์ฒซ ์š”์ฒญ๋งˆ๋‹ค ๋‹ค์‹œ cache write๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค. ์ด ๊ฒฝ์šฐ ๋น„์šฉ์ด ๋‹ค์‹œ ํŠ„๋‹ค..

์ด๋Ÿฐ ์›Œํฌ๋กœ๋“œ์—์„œ๋Š” 1์‹œ๊ฐ„ TTL์„ ๊ฒ€ํ† ํ•  ์ˆ˜ ์žˆ๋‹ค. ๋‹ค๋งŒ 1์‹œ๊ฐ„ cache write๋Š” 2๋ฐฐ ๊ฐ€๊ฒฉ์ด๋ฏ€๋กœ, ์š”์ฒญ ๋นˆ๋„์™€ cache hit ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด๊ณ  ๊ฒฐ์ •ํ•ด์•ผ ํ•œ๋‹ค.

 

์š”์•ฝ ์ •๋ฆฌํ•˜์ž๋ฉด ์ด๋ ‡๋‹ค.

์งง์€ ์‹œ๊ฐ„ ์•ˆ์— ๋ฐ˜๋ณต ํ˜ธ์ถœ์ด ๋งŽ๋‹ค → 5๋ถ„ cache๊ฐ€ ์œ ๋ฆฌํ•  ๊ฐ€๋Šฅ์„ฑ์ด ํผ
์š”์ฒญ ๊ฐ„๊ฒฉ์ด 5๋ถ„์„ ์ž์ฃผ ๋„˜์ง€๋งŒ 1์‹œ๊ฐ„ ์•ˆ์—๋Š” ๋ฐ˜๋ณต → 1์‹œ๊ฐ„ TTL ๊ฒ€ํ† 
์š”์ฒญ์ด ํ•˜๋ฃจ์— ๋ช‡ ๋ฒˆ ์ˆ˜์ค€ → Prompt Caching๋ณด๋‹ค DB ์žฌ์‚ฌ์šฉ, ๋ฐฐ์น˜, ํ”„๋กฌํ”„ํŠธ ์ถ•์†Œ๊ฐ€ ๋” ์ค‘์š”ํ•  ์ˆ˜ ์žˆ์Œ

 

๊ทธ๋ž˜์„œ ์บ์‹ฑ์„ ์ ์šฉํ–ˆ๋‹ค๊ณ  ๋์ด ์•„๋‹ˆ๋ผ cache hit ๋น„์œจ์„ ๋ด์•ผ ํ•œ๋‹ค!

const cache_hit_ratio =
	cache_read_input_tokens / total_input_tokens

 

์œ„์˜ ์ฝ”๋“œ์— ์•„๋ž˜ ๋‚ด์šฉ์„ ๋Œ€์ž…ํ•ด๋ณด์ž.

input_tokens = 500
cache_creation_input_tokens = 0
cache_read_input_tokens = 12095

 

๊ทธ๋Ÿผ ๊ฒฐ๊ณผ๋Š” ์•„๋ž˜์ฒ˜๋Ÿผ ๋‚˜์˜จ๋‹ค.

total_input_tokens = 12595
cache_hit_ratio = ์•ฝ 96%

 

์ด ์ •๋„๋ฉด ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ ์บ์‹ฑ์ด ์ž˜ ๋จน๊ณ  ์žˆ๋‹ค๊ณ  ๋ณธ๋‹ค.

๋ฐ˜๋Œ€๋กœ ํŠธ๋ž˜ํ”ฝ์ด ๋“œ๋ฌธ ์‹œ๊ฐ„๋Œ€๋งˆ๋‹ค ์•„๋ž˜์ฒ˜๋Ÿผ ๋‚˜์˜จ๋‹ค๋ฉด ์บ์‹œ๊ฐ€ ๋งŒ๋ฃŒ๋˜๊ณ  ์žˆ๋Š” ๊ฒƒ์ด๋‹ค.

cache_creation_input_tokens = 12095
cache_read_input_tokens = 0

 

์ด๊ฑด ์‹คํŒจ๊ฐ€ ์•„๋‹ˆ๋ผ cache miss๋‹ค. ๋‹ค๋งŒ ๋น„์šฉ์€ ๋‹ค์‹œ ์˜ค๋ฅธ๋‹ค ๐Ÿ˜ฑ

 

๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋ฐ”๊ฟ”์•ผ ํ•  ๋•Œ

์บ์‹œ ๋Œ€์ƒ ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๋Š” ๋ฐ”๊ฟ”๋„ ๋ ๊นŒ? ๋‹น์—ฐํžˆ ๋œ๋‹ค!

์ž‘์„ฑ ๊ฐ€์ด๋“œ๊ฐ€ ๊ฐœ์„ ๋˜๊ฑฐ๋‚˜, ๋ชจ๋ฒ” ์„ฑ์ ํ‘œ๊ฐ€ ๋ฐ”๋€Œ๊ฑฐ๋‚˜, ํ•„์ˆ˜ ๊ณ ์ง€ ๋ฌธ๊ตฌ๊ฐ€ ๋ฐ”๋€Œ๋ฉด ๋‹น์—ฐํžˆ ์—…๋ฐ์ดํŠธํ•ด์•ผ ํ•œ๋‹ค!

 

๋‹ค๋งŒ ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๊ฐ€ ๋ฐ”๋€Œ๋ฉด ๊ธฐ์กด ์บ์‹œ์™€ prefix๊ฐ€ ๋‹ฌ๋ผ์ง„๋‹ค. ๊ทธ๋Ÿฌ๋ฉด ์ฒซ ์š”์ฒญ์€ cache miss๊ฐ€ ๋‚˜๊ณ , ์ƒˆ ๋ฒ„์ „์˜ ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๊ฐ€ ๋‹ค์‹œ cache write๋œ๋‹ค. ์ดํ›„ ๊ฐ™์€ ์ƒˆ ๋ฒ„์ „์ด ๋ฐ˜๋ณต๋˜๋ฉด ๋‹ค์‹œ cache hit๊ฐ€ ๋‚œ๋‹ค.

 

์ฆ‰ ๋ฐฐํฌ ์งํ›„์—๋Š” ๋น„์šฉ์ด ์ž ๊น ํŠˆ ์ˆ˜ ์žˆ๋‹ค.

 

์ด๋•Œ ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๊ฐ€ ๋ณ€๊ฒฝ๋œ ๊ฑธ ๋ชจ๋ฅด๋Š” ๋‹ค๋ฅธ ํŒ€์› ์ž…์žฅ์—์„  ๋‹นํ™ฉ์Šค๋Ÿฌ์šธ ์ˆ˜ ์žˆ๋‹ค.

๊ทธ๋Ÿฌ๋‹ˆ ์šด์˜์—์„œ๋Š” ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋ฒ„์ „์œผ๋กœ ๊ด€๋ฆฌํ•˜๋Š” ํŽธ์ด ์ข‹๋‹ค๊ณ  ์ƒ๊ฐํ•œ๋‹ค.

feed_report_copy_prompt_version = 2605.1
feed_report_copy_prompt_version = 2605.2

 

์ด๋ ‡๊ฒŒ ํ•ด๋‘๋ฉด ์–ด๋–ค ์„ฑ์ ํ‘œ๊ฐ€ ์–ด๋–ค ๊ธฐ์ค€ ๋ฌธ์„œ๋กœ ๋ฌธ์žฅ ๋‹ค๋“ฌ๊ธฐ๋ฅผ ๊ฑฐ์ณค๋Š”์ง€ ์ถ”์ ํ•  ์ˆ˜ ์žˆ๋‹ค.

๋ณ€๊ฒฝ์˜ ์„ฑ๊ฒฉ๋„ ๋‚˜๋ˆ ์•ผ ํ•œ๋‹ค๊ณ  ๋ณธ๋‹ค.

๋ฌธ์ œ๊ฐ€ ์กฐ๊ธˆ ๋ฐ”๋€ ๊ฒฝ์šฐ
-> ๊ธฐ์กด ๋ฐœํ–‰ ์„ฑ์ ํ‘œ๋ฅผ ๋ฐ˜๋“œ์‹œ ํ๊ธฐํ•  ํ•„์š”๋Š” ์—†์Œ

ํ•„์ˆ˜ ๊ณ ์ง€, ์•ˆ์ „ ๋ฌธ๊ตฌ, ์ •์ฑ… ํŒ๋‹จ์ด ๋ฐ”๋€ ๊ฒฝ์šฐ
-> ๊ธฐ์กด ์„ฑ์ ํ‘œ ์žฌ์‚ฌ์šฉ ๊ธฐ์ค€์„ ๋‹ค์‹œ ๋ด์•ผ ํ•จ

์ฑ„์  ๊ทœ์น™์ด๋‚˜ ์‚ฌ๋ฃŒ๋ณ„๋กœ ๋‹ฌ๋ผ์ง€๋Š” ์ •๋ณด๋“ค์˜ ํ•ด์„์ด ๋ฐ”๋€ ๊ฒฝ์šฐ (์‚ฌ๋ฃŒ๋ณ„๋กœ ๋‹ฌ๋ผ์ง€๋Š” ์ •๋ณด๋“ค์„ ์•ž์œผ๋กœ facts ๋ผ๊ณ  ํ•˜๊ฒ ๋‹ค!)
-> ruleset version ๋˜๋Š” report publication ๊ธฐ์ค€๊นŒ์ง€ ๊ฐ™์ด ๋ด์•ผ ํ•จ

 

์šฐ๋ฆฌ ์„œ๋น„์Šค์—์„œ๋Š” ์ด๋ฏธ ๋ฐœํ–‰๋œ ์„ฑ์ ํ‘œ๋ฅผ ์žฌ์‚ฌ์šฉํ•˜๋Š” ๊ตฌ์กฐ๊ฐ€ ์žˆ๋‹ค. ์ด๋•Œ ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ๊ฐ€ ๋ฐ”๋€Œ์—ˆ๋‹ค๊ณ  ๋ฌด์กฐ๊ฑด ๊ธฐ์กด ์„ฑ์ ํ‘œ๋ฅผ ๋ฒ„๋ฆด ํ•„์š”๋Š” ์—†๋‹ค. ํ•˜์ง€๋งŒ ๋ฒ•์  ๊ณ ์ง€, ์•ˆ์ „ ๋ฌธ๊ตฌ, ๋ฆฌํฌํŠธ ์ •์ฑ…์ด ๋ฐ”๋€ ๊ฒฝ์šฐ๋ผ๋ฉด ๊ฐ™์€ facts์—ฌ๋„ ์‚ฌ์šฉ์ž์—๊ฒŒ ๋ณด์—ฌ์ค„ ๋ฌธ์žฅ์ด ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋Ÿฐ ๋ณ€๊ฒฝ์€ prompt version์ด๋‚˜ ruleset version์œผ๋กœ ๋ถ„๋ฆฌํ•ด์•ผ ํ•œ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ  ๋ฐฐํฌ ์งํ›„ ์ฒซ ์‚ฌ์šฉ์ž์—๊ฒŒ cache miss ๋น„์šฉ๊ณผ latency๋ฅผ ๋„˜๊ธฐ๊ณ  ์‹ถ์ง€ ์•Š๋‹ค๋ฉด pre-warming๋„ ๊ฐ€๋Šฅํ•˜๋‹ค. Anthropic ๊ณต์‹ ๋ฌธ์„œ์—์„œ๋Š” `max_tokens: 0`์„ ์‚ฌ์šฉํ•ด system prompt๋‚˜ tool definition์„ ๋ฏธ๋ฆฌ ์บ์‹œ์— ์˜ฌ๋ฆฌ๋Š” ๋ฐฉ์‹์ด ์•ˆ๋‚ด๋˜์–ด ์žˆ๋‹ค. ๋‹ค๋งŒ ์ด ๊ฒฝ์šฐ์—๋„ cache write ๋น„์šฉ์€ ๋ฐœ์ƒํ•œ๋‹ค.

 

A ์‚ฌ์šฉ์ž์˜ ์บ์‹œ๋ฅผ B ์‚ฌ์šฉ์ž๊ฐ€ ์“ธ ์ˆ˜ ์žˆ๋‚˜

๊ฐ€๋Šฅํ•˜๋‹ค! ๋‹จ, ๊ฐ™์€ Anthropic workspace ์•ˆ์—์„œ ๋™์ผํ•œ ํ”„๋กฌํ”„ํŠธ prefix๊ฐ€ ๋‹ค์‹œ ๋“ค์–ด์™€์•ผ ํ•œ๋‹ค.

Anthropic ๋ฌธ์„œ ๊ธฐ์ค€์œผ๋กœ 2026๋…„ 2์›” 5์ผ๋ถ€ํ„ฐ Claude API์˜ prompt cache๋Š” workspace ๋‹จ์œ„๋กœ ๊ฒฉ๋ฆฌ๋œ๋‹ค. ๋‹ค๋ฅธ ์กฐ์ง๊ณผ๋Š” ๊ณต์œ ๋˜์ง€ ์•Š๊ณ , ๊ฐ™์€ ์กฐ์ง ์•ˆ์—์„œ๋„ workspace๊ฐ€ ๋‹ค๋ฅด๋ฉด ๋ถ„๋ฆฌ๋œ๋‹ค.

 

์ฆ‰ ์šฐ๋ฆฌ ์„œ๋ฒ„๊ฐ€ ๊ฐ™์€ Anthropic workspace๋กœ ํ˜ธ์ถœํ•˜๊ณ , ๊ณ ์ • ์‚ฌ๋ฃŒ ์„ฑ์ ํ‘œ ๊ฐ€์ด๋“œ๊ฐ€ 100% ๋™์ผํ•˜๋‹ค๋ฉด A ์‚ฌ์šฉ์ž์˜ ์š”์ฒญ์—์„œ ๋งŒ๋“ค์–ด์ง„ ์บ์‹œ๋ฅผ B ์‚ฌ์šฉ์ž์˜ ์š”์ฒญ์ด ์žฌ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.

 

ํ•˜์ง€๋งŒ ์‚ฌ์šฉ์ž ์กฐ๊ฑด์ด๋‚˜ ์‚ฌ๋ฃŒ facts๊ฐ€ cache ๋Œ€์ƒ prefix ์•ˆ์— ๋“ค์–ด๊ฐ€๋ฉด ์•ˆ ๋œ๋‹ค. ๊ทธ ๊ฐ’๋“ค์€ ๋’ค๋กœ ๋นผ์•ผ ํ•œ๋‹ค.

 

OpenAI๋กœ ๋ฐ”๊พธ๋ฉด ์–ด๋–ป๊ฒŒ ๋˜๋‚˜

ํšŒ์˜์—์„œ OpenAI๋กœ ๋ณ€๊ฒฝ์€ ์–ด๋–ค๊ฐ€? ๋ผ๋Š” ์ด์•ผ๊ธฐ๊ฐ€ ๊ณ„์† ๋‚˜์˜ค๊ณ  ์žˆ๋Š” ์ค‘์ด๋ผ ์•Œ์•„๋ณธ ๊น€์— ์ ์–ด๋ณธ๋‹ค ๐Ÿ˜Ž

๊ฒฐ๋ก ๋ถ€ํ„ฐ ๋งํ•˜์ž๋ฉด OpenAI๋Š” ๋ฐฉ์‹์ด ๋‹ค๋ฅด๋‹ค.

 

OpenAI ๊ณต์‹ ๋ฌธ์„œ ๊ธฐ์ค€์œผ๋กœ Prompt Caching์€ ์ง€์› ๋ชจ๋ธ์—์„œ ์ž๋™ ์ ์šฉ๋œ๋‹ค. Claude์ฒ˜๋Ÿผ `cache_control`์„ ์ง์ ‘ ๋ถ™์ด๋Š” ๋ฐฉ์‹์ด ์•„๋‹ˆ๋‹ค. ํ™•์ธ์€ `usage.prompt_tokens_details.cached_tokens`๋กœ ํ•œ๋‹ค.

 

์˜ˆ์‹œ๋Š” ์•„๋ž˜์™€ ๊ฐ™์€ ํ˜•ํƒœ๋‹ค.

{
  "usage": {
    "prompt_tokens": 2006,
    "completion_tokens": 300,
    "total_tokens": 2306,
    "prompt_tokens_details": {
      "cached_tokens": 1920
    }
  }
}

 

OpenAI๋„ ์บ์‹œ ์œ ์ง€์‹œ๊ฐ„์ด ์žˆ๋‹ค. 2026๋…„ 5์›” ๊ธฐ์ค€ ๊ณต์‹ ๋ฌธ์„œ์—๋Š” in-memory cache๊ฐ€ ๋ณดํ†ต 5~10๋ถ„์˜ ๋น„ํ™œ์„ฑ ์‹œ๊ฐ„ ๋™์•ˆ ์œ ์ง€๋˜๊ณ , ์ตœ๋Œ€ 1์‹œ๊ฐ„๊นŒ์ง€ ๊ฐˆ ์ˆ˜ ์žˆ๋‹ค๊ณ  ๋˜์–ด ์žˆ๋‹ค. ์ผ๋ถ€ ๋ชจ๋ธ์—์„œ๋Š” extended retention์„ ํ†ตํ•ด ์ตœ๋Œ€ 24์‹œ๊ฐ„ ์ •์ฑ…์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ํŠนํžˆ ์ตœ์‹  ๋ชจ๋ธ๋“ค์—์„œ๋Š” `prompt_cache_retention` ์„ค์ •์„ ์ง€์›ํ•œ๋‹ค.

 

๋”ฐ๋ผ์„œ OpenAI๋กœ ๋ฐ”๊พผ๋‹ค๊ณ  ์บ์‹œ๊ฐ€ ์˜๊ตฌ์ ์œผ๋กœ ์•Œ์•„์„œ ์œ ์ง€๋œ๋‹ค๊ณ  ๋ณด๋ฉด ์•ˆ ๋œ๋‹ค. OpenAI๋„ ๋ฐ˜๋ณต prefix๊ฐ€ ์•ˆ์ •์ ์œผ๋กœ ์œ ์ง€๋˜์–ด์•ผ ํ•˜๊ณ , cache hit ์—ฌ๋ถ€๋Š” `cached_tokens` ๋กœ ํ™•์ธํ•ด์•ผ ํ•œ๋‹ค.

 

ํšŒ์˜๋ฅผ ์ง„ํ–‰ํ• ์ˆ˜๋ก provider๊ฐ€ ์ž์ฃผ ๋ณ€๊ฒฝ๋  ๊ฒƒ์ด ์˜ˆ์ƒ๋๋‹ค ๐Ÿค”

๊ทธ๋ž˜์„œ ๋‚˜๋Š” provider๋ณ„ client๋ฅผ ์•„๋ž˜์ฒ˜๋Ÿผ ๋ถ„๋ฆฌํ•ด๋‘์—ˆ๋‹ค.

LLM_PROVIDER=anthropic
-> Anthropic client
-> cache_control ํฌํ•จ
-> cache_creation_input_tokens / cache_read_input_tokens ํ™•์ธ

LLM_PROVIDER=openai
-> OpenAI client
-> cache_control ์—†์Œ
-> prompt_tokens_details.cached_tokens ํ™•์ธ

 

์ด๋ ‡๊ฒŒ ๋˜์–ด ์žˆ์œผ๋ฉด ๋‚˜์ค‘์— OpenAI๋กœ ๋ฐ”๊ฟ”๋„ ์บ์‹ฑ ๊ตฌ์กฐ๋ฅผ ๋œฏ์–ด๊ณ ์น  ํ•„์š”๋Š” ์—†๋‹ค. provider๋ณ„ usage ํ•„๋“œ๋งŒ ๊ณตํ†ต ๋กœ๊ทธ ํ˜•์‹์œผ๋กœ ์ •๋ฆฌํ•˜๋ฉด ๋œ๋‹ค.

 

OpenAI๋„ ์บ์‹œ๊ฐ€ ์กฐ์ง ๊ฐ„ ๊ณต์œ ๋˜์ง€๋Š” ์•Š๋Š”๋‹ค. ๊ทธ๋ฆฌ๊ณ  Claude์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ output token ์ƒ์„ฑ์—๋Š” ์˜ํ–ฅ์„ ์ฃผ์ง€ ์•Š๋Š”๋‹ค.

Prompt Caching์€ ๋ฐ˜๋ณต ์ž…๋ ฅ ๋น„์šฉ๊ณผ ์ง€์—ฐ ์‹œ๊ฐ„์„ ์ค„์ด๋Š” ๊ธฐ๋Šฅ์ด์ง€, ๋‹ต๋ณ€ ์ƒ์„ฑ์„ ์ƒ๋žตํ•˜๋Š” ๊ธฐ๋Šฅ์ด ์•„๋‹ˆ๋‹ค.

 

๋” ์‹ผ ํ˜ธ์ถœ์€ ํ˜ธ์ถœํ•˜์ง€ ์•Š๋Š” ๊ฒƒ

์‚ฌ์‹ค ์บ์‹ฑ๋ณด๋‹ค ๋” ๊ทผ๋ณธ์ ์ธ ์ตœ์ ํ™”๊ฐ€ ์žˆ๋‹ค..!

์ด๋ฏธ ๊ฐ™์€ ์‚ฌ๋ฃŒ์— ๋Œ€ํ•ด ๋ฐœํ–‰๋œ ์„ฑ์ ํ‘œ๊ฐ€ DB์— ์žˆ๋‹ค๋ฉด LLM์„ ๋‹ค์‹œ ๋ถ€๋ฅด๋ฉด ์•ˆ ๋œ๋‹ค.

ํ•˜์ง€๋งŒ ๋‹จ์ˆœํžˆ ์‚ฌ๋ฃŒ ์ด๋ฆ„์ด ๊ฐ™๋‹ค๊ณ  ์žฌ์‚ฌ์šฉํ•˜๋ฉด ์œ„ํ—˜ํ•˜๋‹ค. ์žฌ์‚ฌ์šฉ ๊ธฐ์ค€์€ ๋ช…ํ™•ํ•ด์•ผ ํ•œ๋‹ค.

(์•„๋ž˜๋Š” ์šฐ๋ฆฌ ํ”„๋กœ์ ํŠธ์—์„œ ์‚ฌ์šฉํ•˜๋Š” ์šฉ์–ด๊ฐ€ ์„ž์—ฌ์žˆ์œผ๋‹ˆ ์šฉ์–ด ์ดํ•ด๋ณด๋‹จ ๋А๋‚Œ๋งŒ ์ฑ™๊ธฐ์ž!)

- ๊ฐ™์€ product revision์ธ๊ฐ€
- ๊ฐ™์€ resolved facts์ธ๊ฐ€
- ๊ฐ™์€ ruleset version์ธ๊ฐ€
- ๊ฐ™์€ life stage / size / health issues context์ธ๊ฐ€
- ์ด๋ฏธ done ์ƒํƒœ๋กœ ๋ฐœํ–‰๋œ ์„ฑ์ ํ‘œ์ธ๊ฐ€

 

์ด ์กฐ๊ฑด์ด ๊ฐ™๋‹ค๋ฉด ๊ธฐ์กด ์„ฑ์ ํ‘œ๋ฅผ ๋ฐ˜ํ™˜ํ•˜๋Š” ๊ฒŒ ๋งž๋‹ค. ๋น„์šฉ๋„ ์ค„๊ณ , ๊ฒฐ๊ณผ๋„ ๋” ์ผ๊ด€์ ์ด๋‹ค.

์ด๊ฑด ๋‹จ์ˆœ ์บ์‹œ๊ฐ€ ์•„๋‹ˆ๋ผ ์ œํ’ˆ ์ •์ฑ…์„ ํ†ตํ•œ ํŒ๋‹จ์ด๋‹ค. ์ด๋ฏธ ๊ฒ€์ฆ๋œ ๊ณต์‹ ์„ฑ์ ํ‘œ๊ฐ€ ์žˆ๋‹ค๋ฉด ๋‹ค์‹œ LLM์—๊ฒŒ ๋ฌธ์žฅ์„ ๋งก๊ธธ ์ด์œ ๊ฐ€ ์—†๋‹ค.

 

๊ทธ๋ ‡๊ธฐ์— ๊ฐ€์žฅ ์‹ผ LLM ํ˜ธ์ถœ์€ ํ˜ธ์ถœํ•˜์ง€ ์•Š๋Š” ๊ฒƒ์ด๋‹ค! 

 

์ถœ๋ ฅ ๊ธธ์ด๋ฅผ ์ค„์ด๋‹ค๋Š” ๋ง

์ฒ˜์Œ์—๋Š” ์ถœ๋ ฅ ๊ธธ์ด๋„ ๋น„์šฉ ์ตœ์ ํ™” ํ›„๋ณด๋กœ ๋ดค๋‹ค. ํ•˜์ง€๋งŒ ์ž˜ ์ƒ๊ฐํ•ด๋ณด๋‹ˆ ์•„๋‹ˆ์—ˆ๋‹ค.. ๐Ÿ˜ฑ

 

์‚ฌ๋ฃŒ ์„ฑ์ ํ‘œ๊ฐ€ ์›๋ž˜ summary์™€ 10๊ฐœ์˜ ์นด๋“œ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค๋ฉด, ์นด๋“œ ์ˆ˜๋ฅผ ์ค„์ด๋Š” ๊ฒƒ์€ ๋น„์šฉ ์ตœ์ ํ™”๊ฐ€ ์•„๋‹ˆ๋‹ค. ์ œํ’ˆ ์š”๊ตฌ์‚ฌํ•ญ์„ ๋ฐ”๊พธ๋Š” ๊ฒƒ์ด๋‹ค.

 

๋งŒ์•ฝ ๊ทธ๋Ÿผ์—๋„ ๋ฌด์–ธ๊ฐ€๋ฅผ ์ค„์ธ๋‹ค๋ฉด, ์ค„์ผ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์€ ๊ตฌ์กฐ๊ฐ€ ์•„๋‹ˆ๋ผ ๊ตฐ๋”๋”๊ธฐ๋‹ค.

- JSON ๋ฐ–์˜ ์„ค๋ช…
- ๋ฐ˜๋ณต๋˜๋Š” ๋ฌธ์žฅ
- ๋ถˆํ•„์š”ํ•˜๊ฒŒ ๊ธด line1 / line2
- ๋ชจ๋ธ์ด ๋ง๋ถ™์ด๋Š” ์‚ฌ์กฑ

 

์„ฑ์ ํ‘œ์˜ ํ˜•์‹์€ ์œ ์ง€ํ•ด์•ผ ํ–ˆ๋‹ค. ๊ทธ๋ ‡๊ธฐ์— ๋‚˜๋Š” ๋ณดํ˜ธ์ž๊ฐ€ ๊ธฐ๋Œ€ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฌผ์€ ๊ทธ๋Œ€๋กœ ๋‘๊ณ , ๋ชจ๋ธ์ด ๋ถˆํ•„์š”ํ•˜๊ฒŒ ๊ธธ๊ฒŒ ์“ฐ์ง€ ์•Š๋„๋ก ์ œํ•œํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์˜๊ฒฌ์„ ๋ƒˆ๋‹ค. (์•„์ง ๊ฒฐ๋ก ์ด ๋‚˜์ง„ ์•Š์•˜๋‹ค!

 

Haiku๋กœ ๋ฐ”๊พธ๋ฉด ๋˜๋‚˜

Claude Haiku 4.5๋Š” Sonnet๋ณด๋‹ค ์ €๋ ดํ•˜๋‹ค. Anthropic ๊ณต์‹ ๊ฐ€๊ฒฉํ‘œ ๊ธฐ์ค€์œผ๋กœ Haiku 4.5๋Š” ์ž…๋ ฅ `$1 / 1M tokens`, ์ถœ๋ ฅ `$5 / 1M tokens`๋‹ค. Sonnet 4 ๊ณ„์—ด์˜ ์ž…๋ ฅ `$3`, ์ถœ๋ ฅ `$15`์™€ ๋น„๊ตํ•˜๋ฉด ๊ฐ™์€ ํ† ํฐ ์ˆ˜์—์„œ ์•ฝ 1/3 ์ˆ˜์ค€์ด๋‹ค.

 

ํ•˜์ง€๋งŒ ์ƒ๋Œ€์ ์œผ๋กœ ์ €๋ ดํ•˜๋‹ˆ Haiku๋กœ ๋ฐ”๊พธ๊ธฐ์—๋Š” ๋ถˆ์•ˆํ–ˆ๋‹ค ๐Ÿ˜

 

์‚ฌ๋ฃŒ ์„ฑ์ ํ‘œ์˜ LLM์€ ์‚ฌ์‹ค์„ ํŒ๋‹จํ•˜์ง€ ์•Š์ง€๋งŒ, ๊ทธ๋ž˜๋„ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•œ๋‹ค. ๋“ฑ๊ธ‰์„ ๋ฐ”๊พธ๋ฉด ์•ˆ ๋˜๊ณ , ๋‚ด๋ถ€ ์ฑ„์  ์šฉ์–ด๋ฅผ ๋…ธ์ถœํ•˜๋ฉด ์•ˆ ๋˜๊ณ , ์นผ์Š˜ ๋˜๋Š” ์ธ ๋ˆ„๋ฝ์ด๋‚˜ ์ฒ˜๋ฐฉ์‹ ์•ˆ๋‚ด ๊ฐ™์€ ํ•„์ˆ˜ ๋ฌธ๊ตฌ๋ฅผ ๋น ๋œจ๋ฆฌ๋ฉด ์•ˆ ๋œ๋‹ค.

 

๊ทธ๋ž˜์„œ ์ €๋ ดํ•œ ๋ชจ๋ธ์„ ์“ฐ๋ ค๋ฉด ์ž๋™ ๊ฒ€์ฆ์ด ๋จผ์ € ์žˆ์–ด์•ผ ํ•œ๋‹ค.

1. ์ผ๋ฐ˜ ์ผ€์ด์Šค๋Š” Haiku ๊ฐ™์€ ์ €๋ ดํ•œ ๋ชจ๋ธ๋กœ ์‹œ๋„ํ•œ๋‹ค.
2. ์„œ๋ฒ„๊ฐ€ ์‘๋‹ต์„ ๊ฒ€์ฆํ•œ๋‹ค.
3. ํ†ต๊ณผํ•˜๋ฉด ์‚ฌ์šฉํ•œ๋‹ค.
4. ์‹คํŒจํ•˜๋ฉด Sonnet์œผ๋กœ ์Šน๊ฒฉํ•œ๋‹ค.
5. Sonnet๋„ ์‹คํŒจํ•˜๋ฉด rule-based copy๋กœ fallbackํ•œ๋‹ค.

 

์—ฌ๊ธฐ์„œ ์‹คํŒจ๋Š” ์‚ฌ๋žŒ์ด ๊ฐ์œผ๋กœ ๋ฌธ์žฅ์ด ๋ณ„๋กœ๋„ค๋ผ๊ณ  ํŒ๋‹จํ•˜๋Š” ๊ฒƒ์€ ์•„๋‹ˆ๋‹ค.

์„œ๋ฒ„๊ฐ€ ์ตœ์†Œํ•œ ์ด๋Ÿฐ ๊ธฐ์ค€์„ ๋ด์•ผ ํ•œ๋‹ค.

- JSON ํŒŒ์‹ฑ ๊ฐ€๋Šฅ ์—ฌ๋ถ€
- summary์™€ ์นด๋“œ ๋ฌธ์žฅ ์กด์žฌ ์—ฌ๋ถ€
- line1 / line2 ๊ธธ์ด ์ œํ•œ
- ๋‚ด๋ถ€ ์ฑ„์  ์šฉ์–ด ๋…ธ์ถœ ์—ฌ๋ถ€
- ํ•„์ˆ˜ ๊ณ ์ง€ ๋ฌธ๊ตฌ ์œ ์ง€ ์—ฌ๋ถ€
- ์ž…๋ ฅ์— ์—†๋˜ ์‚ฌ์‹ค์ด๋‚˜ ์ˆซ์ž ์ถ”๊ฐ€ ์—ฌ๋ถ€
- grade, rule_key, title ๊ฐ™์€ ์›๋ž˜ ๊ฒฐ๊ณผ ๋ณ€๊ฒฝ ์—ฌ๋ถ€

 

๋ชจ๋ธ์ด ์Šค์Šค๋กœ ์ž˜ ์ผ๋‹ค๊ณ  ๋งํ•˜๋Š” ๊ฒƒ์€ ๊ฒ€์ฆ์ด ์•„๋‹ˆ๋ผ๊ณ  ๋ณธ๋‹ค. ๊ฒ€์ฆ์€ ์šฐ๋ฆฌ์˜ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์ด ํ•ด์•ผ ํ•œ๋‹ค.

 

๋‚ด๊ฐ€ ์ •๋ฆฌํ•œ ์ตœ์ ํ™” ์ˆœ์„œ

์ด๋ฒˆ ๋น„์šฉ ๋ฌธ์ œ๋ฅผ ๋ณด๋ฉฐ ์ •๋ฆฌํ•œ ์ˆœ์„œ๋Š” ์ด๋ ‡๋‹ค.

1. deprecated ๋ชจ๋ธ์€ retirement ์ „์— ๊ต์ฒดํ•œ๋‹ค.
2. ์ด๋ฏธ ๋ฐœํ–‰๋œ ๋™์ผ ์‚ฌ๋ฃŒ ์„ฑ์ ํ‘œ๋Š” DB์—์„œ ์žฌ์‚ฌ์šฉํ•œ๋‹ค.
3. ์ƒˆ ์„ฑ์ ํ‘œ๊ฐ€ ํ•„์š”ํ•˜๋ฉด ๊ณ ์ • ๊ฐ€์ด๋“œ์™€ ๋ชจ๋ฒ” ์˜ˆ์‹œ๋Š” Prompt Caching์„ ์ ์šฉํ•œ๋‹ค.
4. ์บ์‹œ TTL๊ณผ cache hit ๋น„์œจ์„ ๋กœ๊ทธ๋กœ ํ™•์ธํ•œ๋‹ค.
5. ๊ณ ์ • ํ”„๋กฌํ”„ํŠธ ๋ณ€๊ฒฝ์€ version์œผ๋กœ ๊ด€๋ฆฌํ•œ๋‹ค.
6. Claude/OpenAI๋ณ„ usage ํ•„๋“œ๋ฅผ ๊ณตํ†ต ๋ฉ”ํŠธ๋ฆญ์œผ๋กœ ์ •๋ฆฌํ•œ๋‹ค.
7. ๊ฒ€์ฆ ๊ทœ์น™์„ ํ†ต๊ณผํ•˜๋Š” ๋ฒ”์œ„์—์„œ ์ €๋ ดํ•œ ๋ชจ๋ธ์„ ํ…Œ์ŠคํŠธํ•œ๋‹ค.
8. ์‹คํŒจํ•˜๊ฑฐ๋‚˜ ๊ณ ์œ„ํ—˜ ์ผ€์ด์Šค๋Š” ์ƒ์œ„ ๋ชจ๋ธ๋กœ ์Šน๊ฒฉํ•œ๋‹ค.
9. ๊ทธ๋ž˜๋„ ์‹คํŒจํ•˜๋ฉด rule-based copy๋กœ fallbackํ•œ๋‹ค.
10. ๋งˆ์ง€๋ง‰์œผ๋กœ ํ’ˆ์งˆ์„ ํ•ด์น˜์ง€ ์•Š๋Š” ๋ฒ”์œ„์—์„œ ํ”„๋กฌํ”„ํŠธ์™€ ์ถœ๋ ฅ ๊ตฐ๋”๋”๊ธฐ๋ฅผ ์ค„์ธ๋‹ค.

 

์ด๋•Œ ์ค‘์š”ํ•œ ๊ฒƒ์€ ์ˆœ์„œ๋‹ค.

 

deprecated ๋ชจ๋ธ ๊ต์ฒด๋Š” ์žฅ์•  ์˜ˆ๋ฐฉ์— ๊ฐ€๊น๊ณ , Prompt Caching์€ ๋ฐ˜๋ณต ์ž…๋ ฅ ๋น„์šฉ์„ ์ค„์ด๋Š” ์ผ์ด๋‹ค. ๋‘˜ ๋‹ค ํ•„์š”ํ•˜์ง€๋งŒ ์„œ๋กœ ํ•ด๊ฒฐํ•˜๋Š” ๋ฌธ์ œ๊ฐ€ ๋‹ค๋ฅด๋‹ค.

 

์ฒ˜์Œ๋ถ€ํ„ฐ ๊ฐ€์ด๋“œ๋ฅผ ์ค„์ด๋ฉด ์„ฑ์ ํ‘œ ํ’ˆ์งˆ์ด ํ”๋“ค๋ฆด ์ˆ˜ ์žˆ๋‹ค. ์ฒ˜์Œ๋ถ€ํ„ฐ ๋ชจ๋ธ์„ ๋‚ฎ์ถ”๋ฉด ํ•„์ˆ˜ ๊ณ ์ง€๋‚˜ ๋ฌธ์žฅ ์•ˆ์ •์„ฑ์ด ๊นจ์งˆ ์ˆ˜ ์žˆ๋‹ค. ๋ฐ˜๋ฉด Prompt Caching์€ ํ”„๋กฌํ”„ํŠธ ๋‚ด์šฉ์„ ์œ ์ง€ํ•œ ์ฑ„ ๋ฐ˜๋ณต ์ž…๋ ฅ ๋น„์šฉ์„ ์ค„์ธ๋‹ค.

 

๊ทธ๋ž˜์„œ ์ฒซ ๋ฒˆ์งธ ์•ˆ์ „ํ•œ ๋น„์šฉ ์ตœ์ ํ™”๋Š” ์บ์‹ฑ์ด์—ˆ๋‹ค.

 

๋‹ค๋งŒ ์บ์‹ฑ์€ ์˜๊ตฌ ๋ณด๊ด€์ด ์•„๋‹ˆ๋‹ค. 5๋ถ„ TTL์ด๋ฉด ์š”์ฒญ ๊ฐ„๊ฒฉ์ด 5๋ถ„์„ ๋„˜๋Š” ์ˆœ๊ฐ„ cache miss๊ฐ€ ๋‚  ์ˆ˜ ์žˆ๋‹ค. ์ด๋•Œ ๋น„์šฉ์ด ๋‹ค์‹œ ํŠ€๋Š” ๊ฒƒ์€ ๋ฒ„๊ทธ๊ฐ€ ์•„๋‹ˆ๋ผ ์บ์‹œ์˜ ์ˆ˜๋ช… ๋•Œ๋ฌธ์ด๋‹ค. ๊ทธ๋ž˜์„œ ์šด์˜์—์„œ๋Š” ์บ์‹ฑ์„ ์ผฐ๋‹ค๊ฐ€ ์•„๋‹ˆ๋ผ cache_read_input_tokens๊ฐ€ ๊พธ์ค€ํžˆ ์žกํžŒ๋‹ค๊นŒ์ง€ ํ™•์ธํ•ด์•ผ ํ–ˆ๋‹ค.

 

๊ฒฐ๋ก 

`$0.06`์€ ๋น„์ •์ƒ ๊ณผ๊ธˆ์ด ์•„๋‹ˆ์—ˆ๋‹ค.

 

์‚ฌ๋ฃŒ ์„ฑ์ ํ‘œ์˜ ํ’ˆ์งˆ์„ ๋งž์ถ”๊ธฐ ์œ„ํ•ด ๊ธด ๊ณ ์ • ๋ฌธ์„œ๋ฅผ ๋งค๋ฒˆ ๋„ฃ๊ณ  ์žˆ์—ˆ๊ณ , ๊ทธ ๋ฌธ์„œ๊ฐ€ ์บ์‹œ๋˜์ง€ ์•Š์•˜๊ณ , ์ถœ๋ ฅ๋„ 1์ฒœ ํ† ํฐ ์ •๋„ ์ƒ์„ฑ๋๊ธฐ ๋•Œ๋ฌธ์— ๋‚˜์˜จ ์ •์ƒ ๋น„์šฉ์ด์—ˆ๋‹ค.

 

๋™์‹œ์— deprecated ๋ชจ๋ธ์„ ๊ณ„์† ์“ฐ๊ณ  ์žˆ๋‹ค๋Š” ์šด์˜ ๋ฆฌ์Šคํฌ๋„ ๋ฐœ๊ฒฌํ–ˆ๋‹ค. ์ด๊ฑด ๋น„์šฉ ์ตœ์ ํ™”์™€๋Š” ๋ณ„๊ฐœ๋กœ ์ฒ˜๋ฆฌํ•ด์•ผ ํ•  ๋ฌธ์ œ์˜€๋‹ค. ๊ทธ๋ž˜์„œ ๊ธฐ๋ณธ ๋ชจ๋ธ์„ retirement ์ „์— `claude-sonnet-4-6`์œผ๋กœ ๋ฐ”๊พธ๋Š” ๊ฒƒ์ด ๋งž์•˜๋‹ค.

 

์ด๋ฒˆ์— ๋ฐ”๋กœ Haiku๋กœ ๋‚ฎ์ถ”๊ฑฐ๋‚˜ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ค„์ด์ง€ ์•Š์€ ์ด์œ ๋„ ์—ฌ๊ธฐ์— ์žˆ๋‹ค. ๋น„์šฉ์€ ์ค„์ผ ์ˆ˜ ์žˆ์–ด๋„, ์„ฑ์ ํ‘œ์˜ ์‹ ๋ขฐ๊ฐ€ ํ”๋“ค๋ฆฌ๋ฉด ์ œํ’ˆ ์ž…์žฅ์—์„œ๋Š” ๋” ํฐ ์†ํ•ด๋‹ค. ๋จผ์ € ๊ฐ™์€ ๊ฒฐ๊ณผ๋Š” ์žฌ์‚ฌ์šฉํ•˜๊ณ , ๋ฐ˜๋ณต๋˜๋Š” ๊ธฐ์ค€ ๋ฌธ์„œ๋Š” ์บ์‹œํ•˜๊ณ , cache read๊ฐ€ ์‹ค์ œ๋กœ ์žกํžˆ๋Š”์ง€ ๊ด€์ฐฐํ•˜๋Š” ์ชฝ์ด ๋” ์•ˆ์ „ํ–ˆ๋‹ค.

 

๊ทธ๋Ÿฌ๋‹ˆ LLM ๋น„์šฉ ์ตœ์ ํ™”๋Š” ๋” ์‹ผ ๋ชจ๋ธ์„ ๊ณ ๋ฅด๋Š” ์ผ๋กœ ์‹œ์ž‘ํ•˜๋ฉด ์•ˆ๋œ๋‹ค! ๋จผ์ € ๋ฌด์—‡์ด ๋งค๋ฒˆ ๋‹ค์‹œ ์ฝํžˆ๊ณ  ์žˆ๋Š”์ง€ ๋ด์•ผ ํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๋ชจ๋ธ lifecycle์ฒ˜๋Ÿผ ๊ณง ์žฅ์• ๊ฐ€ ๋  ์ˆ˜ ์žˆ๋Š” ์šด์˜ ๋ฆฌ์Šคํฌ๋„ ํ•จ๊ป˜ ๋ด์•ผ ํ•œ๋‹ค. ๊ทธ๋‹ค์Œ์— ๋ชจ๋ธ ๊ต์ฒด, ํ”„๋กฌํ”„ํŠธ ์ถ•์†Œ, fallback ์ „๋žต์„ ๊ฒ€์ฆ ๊ทœ์น™ ์œ„์—์„œ ๋‹ค๋ค„์•ผ ํ•œ๋‹ค.

 

๊ทธ ์ˆœ์„œ๋ฅผ ์ง€ํ‚ค๋ฉด ๋น„์šฉ์„ ์ค„์ด๋ฉด์„œ๋„ ์ œํ’ˆ ํ’ˆ์งˆ์„ ์ง€ํ‚ฌ ์ˆ˜ ์žˆ๋‹ค.

 

์ฐธ๊ณ ๋ฌธ์„œ

 

 

+ Recent posts