Runbooks Index
Каталог операторских runbooks AngaraBase. Все runbooks привязаны к коду и обновляются вместе с release trains.
По категориям
Lifecycle
| Runbook | Когда использовать |
|---|---|
| Upgrade and migration | Перед обновлением версии — pre-flight, rolling, verification |
| MVCC and GC operator minimum | Настройка AngaraGC, диагностика visibility |
Reliability
| Runbook | Когда использовать |
|---|---|
| Backup and restore | Регулярный backup, base/PITR-restore, верификация |
| Disaster recovery playbook | Полная потеря instance, host migration, restore-oracle |
| Replication v2 operations guide | Управление AngaraReplica v2 |
Performance
| Runbook | Когда использовать |
|---|---|
| Performance tuning guide | Точечная оптимизация workload |
| Parallel runtime observability | Диагностика параллельного исполнения, DOP-капы |
| jemalloc heap profiling | Расследование роста памяти |
Observability
| Runbook | Когда использовать |
|---|---|
| Observability metrics checklist | Настройка минимального набора метрик/алертов |
| Diagnostics bundle | Сбор артефактов при инциденте |
| Troubleshooting guide | Симптом → причина → действие |
| Alert runbooks (RM-0.6.3.8 S7) | Per-alert remediation: backing pages для каждого runbook_url в tools/observability/alerts/angarabase_alerts.yaml |
Security
| Runbook | Когда использовать |
|---|---|
| Security operations baseline | Регулярные security checks, knobs registry |
| Hardening | Перевод инстанса в production-ready security configuration |
Reference (operator)
| Документ | Что внутри |
|---|---|
| Configuration schema reference | Полный реестр TOML/env параметров |
| Client compatibility baseline | Протестированные клиенты, известные ограничения |
| Known issues baseline | Operator-уровень known issues |
| Operational policies baseline | Production policy baseline |
Validation
| Документ | Когда использовать |
|---|---|
| Testing and validation baseline | Acceptance-проверки перед production |
| Golden dataset management | Управление эталонными датасетами |
| CI reproducibility contract | Контракт воспроизводимости артефактов |
По симптому (быстрая навигация)
| Симптом | Куда смотреть |
|---|---|
| Сервер не стартует | Troubleshooting → Configuration → Crash recovery |
| Запросы стали медленнее | Performance tuning → Diagnostics → Diagnostics bundle |
Ошибка 0A000 feature_not_supported | SQL compatibility → Known issues |
| Растёт занятый размер на диске | MVCC and GC operator minimum → Diagnostics |
| Растёт RSS / OOM | jemalloc profiling → Configuration |
| Backup или restore завершился ошибкой | Backup and restore → Disaster recovery |
| Аутентификация / RLS / audit ведут себя неожиданно | Security operations → Security model |
| Проблема с клиентом / ORM | Client compatibility → SQL compatibility |
| Подозрение на data corruption | Verify release artifacts → Disaster recovery |
Если runbook не помог
Соберите diagnostics bundle и обратитесь по Support flow.
Дальше
- Troubleshooting guide — индекс симптомов и первых действий.
- Disaster recovery playbook — сценарии «потерян lease / повреждён datadir».
- Diagnostics bundle runbook — как собрать всё необходимое для эскалации одним пакетом.