Модель · Claude 4.X
Claude Haiku 4.5
Быстрая и дешёвая для массовых задач
API ID
claude-haiku-4-5Контекстное окно
200K токенов
Максимальный вывод
32K токенов
Скорость
Молниеносная
О модели
Самая быстрая и самая дешёвая модель в семействе Claude. Идеально для реалтайм-сценариев: чат-ботов с высокой нагрузкой, классификаторов, модерации, коротких ответов.
Цена
Стоимость за 1 миллион токенов. Конвертация в ₽ по курсу 90 за $.
Ввод
$1/ 1M
≈ 90 ₽
Вывод
$5/ 1M
≈ 450 ₽
Кешированный ввод
$0.10/ 1M
≈ 9 ₽
Prompt Caching
Кеширование промпта (prompt caching) позволяет переиспользовать постоянную часть запроса с огромной скидкой — до 10× дешевле. Особенно выгодно для агентов с длинным system prompt и tool definitions.
Где хороша
- Чат-боты в поддержке (миллионы запросов в сутки)
- Классификация и модерация контента
- Суммирование коротких фрагментов
- Извлечение структурированных данных из простых текстов
- Любой сценарий, чувствительный к latency и бюджету
Где стоит выбрать другую
- Сложный код и агенты (не хватит глубины)
- Длинные документы (контекст 200K против 1M у старших)
- Творческие задачи высокой сложности
Примеры запроса
Минимальные рабочие примеры на curl и Python. Для JS/TS пример — на странице API.
curl
bash
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-haiku-4-5",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Привет! Расскажи о себе."}
]
}'Python SDK
py
from anthropic import Anthropic
client = Anthropic()
response = client.messages.create(
model="claude-haiku-4-5",
max_tokens=1024,
messages=[
{"role": "user", "content": "Привет! Расскажи о себе."}
],
)
print(response.content[0].text)Посмотреть другие модели
Сравни параметры всех трёх в одной таблице.