Añadido: - MANUAL_USUARIO_ARCHITECT.md - MANUAL_USUARIO_CORP.md - MANUAL_USUARIO_DECK.md - MANUAL_USUARIO_HST.md - 07_OPERACION/ (monitoring, runbooks, incident_response) - glosario_she_enterprise_v3.md Eliminado: - glosario_she_enterprise_v2.md (reemplazado por v3) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
98 lines
3.2 KiB
Markdown
98 lines
3.2 KiB
Markdown
# Skynet v8 - Sección 07: OPERACIÓN
|
|
|
|
## Documentos de Operación
|
|
|
|
### 1. Runbooks (runbooks.md)
|
|
Procedimientos estandarizados para operaciones comunes:
|
|
- **Reinicio de servicios**: Procedimiento seguro para reiniciar servicios sin downtime
|
|
- **Failover de base de datos**: Cambio automático a réplica en caso de fallo
|
|
- **Restauración de backups**: Opciones de restauración (completa, PITR, tabla)
|
|
- **Escalado de recursos**: CPU, RAM, almacenamiento
|
|
|
|
**Ubicación**: `/system/skynet v8/07_OPERACION/runbooks.md`
|
|
|
|
### 2. Respuesta ante Incidentes (incident_response.md)
|
|
Procedimientos de respuesta para situaciones de crisis:
|
|
- **Caída de servidor**: Detección, escalación, mitigación, recovery
|
|
- **Ataque DDoS**: Identificación, rate limiting, activación de servicios de protección
|
|
- **Breach de seguridad**: Aislamiento, investigación forense, recovery, notificación
|
|
|
|
Incluye:
|
|
- Fases de respuesta (detección, confirmación, escalación, investigación, mitigación, resolución)
|
|
- Escaleras de escalación por severidad (P1-P4)
|
|
- Contactos de emergencia
|
|
- Tiempos de respuesta objetivo (SLA)
|
|
|
|
**Ubicación**: `/system/skynet v8/07_OPERACION/incident_response.md`
|
|
|
|
### 3. Monitoreo y Observabilidad (monitoring.md)
|
|
Arquitectura y configuración de monitoreo:
|
|
- **Métricas a monitorear**: Aplicación, BD, sistema, seguridad
|
|
- **Alertas configuradas**: P1 (críticas), P2 (altas), P3 (medias)
|
|
- **Dashboards**: Sistema, aplicación, BD, infraestructura, seguridad
|
|
- **Logs**: Ubicaciones, análisis, comandos útiles
|
|
- **Exporters**: Prometheus, custom, PostgreSQL
|
|
|
|
**Ubicación**: `/system/skynet v8/07_OPERACION/monitoring.md`
|
|
|
|
---
|
|
|
|
## Estructura de Carpetas R2
|
|
|
|
```
|
|
s3://architect/system/skynet v8/07_OPERACION/
|
|
├── runbooks.md (6.6 KB)
|
|
├── incident_response.md (10.9 KB)
|
|
├── monitoring.md (17.0 KB)
|
|
└── INDEX_07_OPERACION.md (este archivo)
|
|
```
|
|
|
|
---
|
|
|
|
## Acceso Rápido
|
|
|
|
### Para operadores
|
|
1. Problema con servicio → Consultar `runbooks.md`
|
|
2. Incidente crítico → Consultar `incident_response.md`
|
|
3. Verificar estado del sistema → Consultar `monitoring.md`
|
|
|
|
### Para automatización
|
|
- Scripts de backup: Referir a `runbooks.md` - Restauración de backups
|
|
- Alertas automáticas: Referir a `monitoring.md` - Alertas Configuradas
|
|
- Escalación automática: Referir a `incident_response.md` - Escaleras de escalación
|
|
|
|
---
|
|
|
|
## Integración con otras secciones
|
|
|
|
| Sección | Relación |
|
|
|---------|----------|
|
|
| 01_ARCHITECTURE | Define componentes monitorear |
|
|
| 02_SECURITY | Colabora en incident response |
|
|
| 03_INFRASTRUCTURE | Detalles técnicos para runbooks |
|
|
| 04_DEPLOYMENT | Coordina con reinicio de servicios |
|
|
| 05_TESTING | Valida runbooks en staging |
|
|
| 06_TROUBLESHOOTING | Diagnostico previo a incidentes |
|
|
|
|
---
|
|
|
|
## Mejoras Futuras
|
|
|
|
1. Automatización adicional:
|
|
- Scripts Python para ejecutar runbooks
|
|
- Integración con orchestration tools (Kubernetes, etc.)
|
|
|
|
2. Aprendizaje automático:
|
|
- Análisis predictivo de fallos
|
|
- Detección anomalías avanzada
|
|
|
|
3. Documentación mejorada:
|
|
- Videos de procedimientos críticos
|
|
- Simulacros periódicos
|
|
|
|
---
|
|
|
|
**Última actualización**: 2025-12-30
|
|
**Versión**: Skynet v8.0
|
|
**Estado**: Operacional
|