Operações

# HPA Configuration
metrics:
- type: Resource
  resource:
    name: cpu
    target:
      type: Utilization
      averageUtilization: 70
- type: Resource
  resource:
    name: memory
    target:
      type: Utilization
      averageUtilization: 80
- type: Pods
  pods:
    metric:
      name: http_requests_per_second
    target:
      type: AverageValue
      averageValue: "1000"

Patches de segurança aplicados mensalmente Certificados SSL renovados automaticamente Logs de auditoria retidos por 1 ano Pen-test trimestral Disaster recovery testado semestralmente Secrets rotacionados a cada 90 dias

Runbooks

Problemas Comuns

API Timeout → Runbook #001 [Em breve]
DB Connection Pool → Runbook #002 [Em breve]
High Memory Usage → Runbook #003 [Em breve]
Queue Backlog → Runbook #004 [Em breve]

Comandos Úteis

# Status dos pods
kubectl get pods -n sinapse

# Logs em tempo real
kubectl logs -f deployment/sinapse-api -n sinapse

# Métricas do banco
kubectl exec -it postgres-0 -- psql -U sinapse -c "SELECT * FROM pg_stat_activity;"

# Cache status
kubectl exec -it redis-0 -- redis-cli INFO stats

# Force restart
kubectl rollout restart deployment/sinapse-api -n sinapse

Importante: Sempre siga o processo de Change Management para mudanças em produção!

Continue com os guias específicos através dos cards acima.

Operações

Guias Operacionais

Monitoramento

Backup

Scaling

Troubleshooting

Visão Geral Operacional

Métricas Chave (KPIs)

Stack de Monitoramento

Alertas Críticos

P1 - Crítico (Resposta: 15min)

P2 - Alto (Resposta: 1h)

P3 - Médio (Resposta: 4h)

Processos Operacionais

Deploy

Manutenção

Incident Response

Backup e DR

Estratégia 3-2-1

RPO/RTO

Tipos de Backup

Capacity Planning

Métricas para Scaling

Segurança Operacional

Runbooks

Problemas Comuns

Comandos Úteis

On this page