diff --git a/07_OPERACION/ESTUDIO_DEBILIDADES_MEJORAS_2026-01-01.md b/07_OPERACION/ESTUDIO_DEBILIDADES_MEJORAS_2026-01-01.md
new file mode 100644
index 0000000..011e674
--- /dev/null
+++ b/07_OPERACION/ESTUDIO_DEBILIDADES_MEJORAS_2026-01-01.md
@@ -0,0 +1,396 @@
+# Estudio de Debilidades y Mejoras - Sistema TZZR
+
+**Fecha**: 2026-01-01  
+**Alcance**: DECK (72.62.1.113), CORP (92.112.181.188), ARCHITECT (69.62.126.110)
+
+---
+
+## Resumen Ejecutivo
+
+Se identificaron **12 debilidades críticas/moderadas** y se proponen **18 mejoras** organizadas por prioridad. Las áreas más afectadas son **seguridad de red**, **monitoreo** y **mantenibilidad**.
+
+### Matriz de Riesgo
+
+| Categoría | Crítico | Alto | Medio | Bajo |
+|-----------|---------|------|-------|------|
+| Seguridad | 1 | 2 | 2 | 1 |
+| Rendimiento | 0 | 1 | 2 | 1 |
+| Mantenibilidad | 0 | 1 | 3 | 2 |
+| Disponibilidad | 0 | 1 | 1 | 0 |
+
+---
+
+## 1. DEBILIDADES DE SEGURIDAD
+
+### 1.1 [CRÍTICO] Microservicios Expuestos a Internet
+
+**Problema**: Los puertos 5051-5054 están accesibles desde cualquier IP externa.
+
+```
+Port 5051 (Clara): ACCESIBLE desde internet
+Port 5052 (Alfred): ACCESIBLE desde internet  
+Port 5053 (Mason): ACCESIBLE desde internet
+Port 5054 (Feldman): ACCESIBLE desde internet
+```
+
+**Mitigación**: Aunque existe autenticación via `X-Auth-Key`, un atacante podría:
+- Realizar ataques de fuerza bruta al header
+- Explotar vulnerabilidades en el código
+- Causar DoS
+
+**Recomendación**: 
+```bash
+# Restringir acceso solo a IPs del sistema
+ufw delete allow 5051:5054/tcp
+ufw allow from 69.62.126.110 to any port 5051:5054 proto tcp
+ufw allow from 92.112.181.188 to any port 5051:5054 proto tcp
+ufw allow from 72.62.2.84 to any port 5051:5054 proto tcp
+```
+
+---
+
+### 1.2 [ALTO] Sin Rate Limiting
+
+**Problema**: Las APIs no tienen límite de requests por segundo.
+
+**Evidencia**:
+```
+5 requests consecutivos: 200 200 200 200 200 (sin throttling)
+```
+
+**Impacto**: Vulnerable a:
+- Ataques de fuerza bruta
+- DDoS a nivel de aplicación
+- Abuso de recursos
+
+**Recomendación**: Implementar rate limiting con Flask-Limiter:
+```python
+from flask_limiter import Limiter
+limiter = Limiter(app, default_limits=["100 per minute", "10 per second"])
+```
+
+---
+
+### 1.3 [ALTO] Clave SSH Compartida
+
+**Problema**: La misma clave `~/.ssh/tzzr` se usa para acceso a todos los servidores.
+
+**Impacto**: Si se compromete un servidor, todos están comprometidos.
+
+**Recomendación**: 
+- Usar claves únicas por servidor
+- Implementar rotación de claves cada 90 días
+- Considerar HashiCorp Vault para gestión de secretos
+
+---
+
+### 1.4 [MEDIO] Sin Certificados Let's Encrypt
+
+**Problema**: Los certificados SSL son de `/home/user-data/ssl/` (probablemente auto-generados o de mailcow).
+
+**Recomendación**: 
+```bash
+apt install certbot python3-certbot-nginx
+certbot --nginx -d link.tzzrdeck.me -d flows.tzzrdeck.me
+```
+
+---
+
+### 1.5 [MEDIO] Headers de Seguridad Ausentes
+
+**Problema**: Las APIs no implementan headers de seguridad HTTP.
+
+**Recomendación**: Agregar en nginx o Flask:
+```python
+@app.after_request
+def add_security_headers(response):
+    response.headers['X-Content-Type-Options'] = 'nosniff'
+    response.headers['X-Frame-Options'] = 'DENY'
+    response.headers['X-XSS-Protection'] = '1; mode=block'
+    return response
+```
+
+---
+
+### 1.6 [BAJO] Logs de Autenticación No Centralizados
+
+**Problema**: Los intentos fallidos de autenticación no se registran de forma centralizada.
+
+**Recomendación**: Implementar logging estructurado con envío a un SIEM o ELK stack.
+
+---
+
+## 2. DEBILIDADES DE RENDIMIENTO
+
+### 2.1 [ALTO] Uso Excesivo de Swap (DECK)
+
+**Problema**: 
+```
+Swap: 1.5Gi usado de 2.0Gi (75%)
+```
+
+**Impacto**: 
+- Degradación de rendimiento
+- Posibles timeouts en operaciones de DB
+
+**Causa probable**: 
+- Demasiados contenedores Docker
+- Memoria insuficiente (7.8Gi para 34 contenedores)
+
+**Recomendación**:
+1. Aumentar RAM a 16GB
+2. Optimizar límites de memoria por contenedor
+3. Reducir workers de gunicorn
+
+---
+
+### 2.2 [MEDIO] Docker Images Sin Limpiar
+
+**Problema**:
+```
+Images: 32.67GB (99% reclamable)
+```
+
+**Recomendación**:
+```bash
+docker image prune -a --filter "until=720h"  # Eliminar imágenes > 30 días
+docker system prune -f --volumes
+```
+
+---
+
+### 2.3 [MEDIO] Conexiones DB Sin Pool
+
+**Problema**: Cada request crea una nueva conexión a PostgreSQL.
+
+```python
+def get_db_connection():
+    return psycopg2.connect(...)  # Nueva conexión cada vez
+```
+
+**Impacto**: Overhead de conexión, posibles errores "too many connections".
+
+**Recomendación**: Usar connection pool:
+```python
+from psycopg2 import pool
+db_pool = pool.ThreadedConnectionPool(5, 20, ...)
+
+def get_db_connection():
+    return db_pool.getconn()
+```
+
+---
+
+### 2.4 [BAJO] Gunicorn con Workers Sync
+
+**Problema**: Los workers son síncronos, bloqueantes durante I/O.
+
+**Recomendación**:
+```bash
+gunicorn --workers 4 --worker-class gevent app:app
+```
+
+---
+
+## 3. DEBILIDADES DE MANTENIBILIDAD
+
+### 3.1 [ALTO] Sin CI/CD
+
+**Problema**: Los deploys son manuales via SSH.
+
+**Impacto**:
+- Propenso a errores humanos
+- Tiempo de deploy alto
+- Sin rollback automático
+
+**Recomendación**: Implementar pipeline en Gitea Actions:
+```yaml
+# .gitea/workflows/deploy.yml
+name: Deploy
+on:
+  push:
+    branches: [main]
+jobs:
+  deploy:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v3
+      - name: Deploy to DECK
+        run: ssh root@72.62.1.113 'cd /opt/clara && git pull && docker-compose up -d --build'
+```
+
+---
+
+### 3.2 [MEDIO] Código Duplicado DECK/CORP
+
+**Problema**: MindLink y Flow-UI tienen código casi idéntico en DECK y CORP.
+
+**Recomendación**: 
+- Usar variables de entorno para configuración específica de instancia
+- Un solo repositorio con configuración por ambiente
+
+---
+
+### 3.3 [MEDIO] Sin Tests Automatizados
+
+**Problema**: No hay tests unitarios ni de integración.
+
+**Recomendación**:
+```python
+# tests/test_clara.py
+def test_health_endpoint(client):
+    response = client.get('/health')
+    assert response.status_code == 200
+    assert response.json['status'] == 'ok'
+```
+
+---
+
+### 3.4 [MEDIO] Dependencias Desactualizadas
+
+**Problema**:
+```
+Flask==3.0.0  (actual: 3.1.0)
+psycopg2-binary==2.9.9  (actual: 2.9.10)
+```
+
+**Recomendación**: Actualizar regularmente y usar Dependabot.
+
+---
+
+### 3.5 [BAJO] Documentación de API Ausente
+
+**Problema**: No hay documentación OpenAPI/Swagger.
+
+**Recomendación**: Implementar Flask-RESTx o FastAPI.
+
+---
+
+### 3.6 [BAJO] Sin Versionado de API
+
+**Problema**: Las rutas no incluyen versión (`/ingest` en vez de `/v1/ingest`).
+
+---
+
+## 4. DEBILIDADES DE DISPONIBILIDAD
+
+### 4.1 [ALTO] Sin Monitoreo
+
+**Problema**: No hay Prometheus, Grafana ni alertas.
+
+**Impacto**:
+- No hay visibilidad de métricas
+- Problemas se detectan tarde
+- Sin historial de rendimiento
+
+**Recomendación**:
+```yaml
+# docker-compose.monitoring.yml
+services:
+  prometheus:
+    image: prom/prometheus
+    ports: ["9090:9090"]
+  grafana:
+    image: grafana/grafana
+    ports: ["3001:3000"]
+  alertmanager:
+    image: prom/alertmanager
+```
+
+---
+
+### 4.2 [MEDIO] Healthchecks Incompletos
+
+**Problema**: Solo Clara y Alfred tienen healthcheck en Docker.
+
+```
+clara-service: Healthcheck configurado ✓
+feldman-service: Sin healthcheck ✗
+mason-service: Sin healthcheck ✗
+```
+
+**Recomendación**: Agregar a docker-compose.yml:
+```yaml
+healthcheck:
+  test: ["CMD", "curl", "-f", "http://localhost:5054/health"]
+  interval: 30s
+  timeout: 10s
+  retries: 3
+```
+
+---
+
+## 5. PLAN DE MEJORAS PRIORIZADO
+
+### Fase 1: Seguridad Inmediata (1-2 días)
+
+| # | Mejora | Esfuerzo | Impacto |
+|---|--------|----------|---------|
+| 1 | Restringir puertos 5051-5054 en UFW | 1h | Crítico |
+| 2 | Implementar rate limiting | 2h | Alto |
+| 3 | Agregar headers de seguridad | 1h | Medio |
+
+### Fase 2: Estabilidad (3-5 días)
+
+| # | Mejora | Esfuerzo | Impacto |
+|---|--------|----------|---------|
+| 4 | Implementar connection pool DB | 4h | Alto |
+| 5 | Limpiar Docker images | 1h | Medio |
+| 6 | Agregar healthchecks faltantes | 2h | Medio |
+| 7 | Configurar Let's Encrypt | 2h | Medio |
+
+### Fase 3: Monitoreo (1 semana)
+
+| # | Mejora | Esfuerzo | Impacto |
+|---|--------|----------|---------|
+| 8 | Desplegar Prometheus + Grafana | 8h | Alto |
+| 9 | Configurar alertas básicas | 4h | Alto |
+| 10 | Implementar logging estructurado | 4h | Medio |
+
+### Fase 4: Mantenibilidad (2 semanas)
+
+| # | Mejora | Esfuerzo | Impacto |
+|---|--------|----------|---------|
+| 11 | Implementar CI/CD básico | 8h | Alto |
+| 12 | Escribir tests unitarios core | 16h | Alto |
+| 13 | Documentar APIs con OpenAPI | 8h | Medio |
+| 14 | Unificar código DECK/CORP | 8h | Medio |
+
+### Fase 5: Optimización (continuo)
+
+| # | Mejora | Esfuerzo | Impacto |
+|---|--------|----------|---------|
+| 15 | Aumentar RAM DECK a 16GB | - | Alto |
+| 16 | Migrar a workers async | 4h | Medio |
+| 17 | Implementar caché Redis | 8h | Medio |
+| 18 | Rotación automática de claves SSH | 4h | Bajo |
+
+---
+
+## 6. MÉTRICAS DE ÉXITO
+
+| Métrica | Actual | Objetivo |
+|---------|--------|----------|
+| Puertos expuestos públicamente | 4 | 0 |
+| Cobertura de tests | 0% | 70% |
+| Uptime monitorizado | No | Sí |
+| Tiempo de deploy | ~30min | <5min |
+| Uso de swap DECK | 75% | <20% |
+| Alertas configuradas | 0 | 10+ |
+
+---
+
+## 7. CONCLUSIONES
+
+El sistema TZZR está funcionalmente operativo pero presenta debilidades significativas en seguridad de red y observabilidad. Las mejoras más urgentes son:
+
+1. **Restringir acceso a puertos de microservicios** (riesgo crítico)
+2. **Implementar rate limiting** (prevención de abuso)
+3. **Desplegar monitoreo** (visibilidad operacional)
+
+Con la implementación de las 18 mejoras propuestas, el sistema alcanzaría un nivel de madurez adecuado para producción empresarial.
+
+---
+
+*Generado por CAPTAIN CLAUDE*  
+*Sistema TZZR - 2026-01-01*