niuzj

#OpenAI

搞懂 LLM 缓存机制:一个改动让 API 调用省 80% Token

搞懂 LLM 缓存机制:一个改动让 API 调用省 80% Token

让 LLM 同时返回文字和结构化数据:用假 Tool Call 做 Side Channel

让 LLM 同时返回文字和结构化数据:用假 Tool Call 做 Side Channel