Делегирование работы агенту

Определение результатов

Скажите агенту, как выглядит «готово», и позвольте ему итерировать до достижения цели.

Outcomes — это функция в режиме Research Preview. Запросите доступ, чтобы попробовать её.

outcome переводит сессию из режима разговора в режим работы. Вы определяете, как должен выглядеть конечный результат и как измерять качество. Агент работает в направлении этой цели, самостоятельно оценивая и итерируя до тех пор, пока результат не будет достигнут.

Когда вы определяете результат, система автоматически создаёт оценщика (grader) для проверки артефакта по рубрике. Для этого используется отдельное контекстное окно, чтобы избежать влияния решений основного агента.

Оценщик возвращает разбивку по каждому критерию: либо подтверждение того, что артефакт соответствует рубрике, либо конкретные расхождения между текущей работой и требованиями. Эта обратная связь передаётся агенту для следующей итерации.

Все запросы к Managed Agents API требуют бета-заголовка managed-agents-2026-04-01. Функции Research Preview дополнительно требуют managed-agents-2026-04-01-research-preview. SDK устанавливает эти бета-заголовки автоматически.

Создание рубрики

Рубрика — это markdown-документ, описывающий оценку по каждому критерию. Рубрика обязательна.

Пример рубрики:

# DCF Model Rubric

## Revenue Projections
- Uses historical revenue data from the last 5 fiscal years
- Projects revenue for at least 5 years forward
- Growth rate assumptions are explicitly stated and reasonable

## Cost Structure
- COGS and operating expenses are modeled separately
- Margins are consistent with historical trends or deviations are justified

## Discount Rate
- WACC is calculated with stated assumptions for cost of equity and cost of debt
- Beta, risk-free rate, and equity risk premium are sourced or justified

## Terminal Value
- Uses either perpetuity growth or exit multiple method (stated which)
- Terminal growth rate does not exceed long-term GDP growth

## Output Quality
- All figures are in a single .xlsx file with clearly labeled sheets
- Key assumptions are on a separate "Assumptions" sheet
- Sensitivity analysis on WACC and terminal growth rate is included

Was this page helpful?

rubric=$(curl -fsSL https://api.anthropic.com/v1/files \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: managed-agents-2026-04-01,files-api-2025-04-14" \
  -F file=@/path/to/pr_review_rubric.md)
rubric_id=$(jq -r '.id' <<<"$rubric")
printf 'Uploaded rubric: %s\n' "$rubric_id"

# Create a session
session=$(curl -fsSL https://api.anthropic.com/v1/sessions \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: managed-agents-2026-04-01-research-preview" \
  --json @- <<EOF
{
  "agent": "$agent_id",
  "environment_id": "$environment_id",
  "title": "Financial analysis on Costco"
}
EOF
)
session_id=$(jq -r '.id' <<<"$session")

# Define the outcome — agent starts working on receipt
curl -fsSL "https://api.anthropic.com/v1/sessions/$session_id/events" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: managed-agents-2026-04-01-research-preview" \
  --json @- >/dev/null <<EOF
{
  "events": [
    {
      "type": "user.define_outcome",
      "description": "Build a DCF model for Costco in .xlsx",
      "rubric": {"type": "text", "content": "# DCF Model Rubric\n..."},
      "max_iterations": 5
    }
  ]
}
EOF
# or: "rubric": {"type": "file", "file_id": "$rubric_id"}
# "max_iterations" is optional; default 3, max 20

Результат	Следующий шаг
`satisfied`	Сессия переходит в состояние `idle`.
`needs_revision`	Агент начинает новый итерационный цикл.
`max_iterations_reached`	Дальнейших циклов оценки нет. Агент может выполнить одну финальную ревизию перед переходом сессии в состояние `idle`.
`failed`	Сессия переходит в состояние `idle`. Возвращается, когда рубрика принципиально не соответствует задаче, например если описание и рубрика противоречат друг другу.
`interrupted`	Генерируется только в том случае, если `outcome_evaluation_start` уже сработал до прерывания.

{
  "type": "span.outcome_evaluation_end",
  "id": "sevt_01jkl...",
  "outcome_evaluation_start_id": "sevt_01def...",
  "outcome_id": "outc_01a...",
  "result": "satisfied",
  "explanation": "All 12 criteria met: revenue projections use 5 years of historical data, WACC assumptions are stated, sensitivity table is included...",
  "iteration": 0,
  "usage": {
    "input_tokens": 2400,
    "output_tokens": 350,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 1800
  },
  "processed_at": "2026-03-25T14:03:00Z"
}

session=$(curl -fsSL "https://api.anthropic.com/v1/sessions/$session_id" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: managed-agents-2026-04-01-research-preview")

jq -r '.outcome_evaluations[] | "\(.outcome_id): \(.result)"' <<<"$session"
# outc_01a...: satisfied

# List files produced by this session
curl -fsSL "https://api.anthropic.com/v1/files?scope_id=$session_id" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14,managed-agents-2026-04-01-research-preview" \
| jq '.data[] | {id, filename, size_bytes}'

# Download by file_id
curl -fsSL "https://api.anthropic.com/v1/files/$file_id/content" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -o costco_dcf.xlsx

Определение результатов

Создание рубрики

Определение результатов

Создание рубрики

Создание сессии с результатом

События результата

Пользовательское событие определения результата

Начало оценки результата

Оценка результата в процессе

Завершение оценки результата

Проверка статуса результата

Получение результатов работы

Создание рубрики

Советы по написанию эффективных рубрик

Создание рубрики

Советы по написанию эффективных рубрик

Создание сессии с результатом

События результата

Пользовательское событие определения результата

Начало оценки результата

Оценка результата в процессе

Завершение оценки результата

Проверка статуса результата

Получение результатов работы