Files
system-docs/05_INTEGRACIONES/gpu-services.md
ARCHITECT 6ea70bd34f Update to Skynet v7 - Complete documentation restructure
- Nueva estructura de carpetas según Skynet v7
- Añadidos schemas SQL completos
- Documentación de entidades, componentes e integraciones
- Modelo de seguridad actualizado
- Infraestructura y operaciones reorganizadas
2025-12-29 18:23:41 +00:00

4.0 KiB

GPU Services

Plataforma: RunPod
Estado: Operativo


Servicios

Servicio Endpoint ID GPU Workers Función
Grace {grace_id} NVIDIA L4 2 Procesamiento IA
Penny 0mxhaokgsmgee3 NVIDIA L4 2 Asistente voz
The Factory {factory_id} NVIDIA L4 2 Generación iterativa

Arquitectura

┌─────────────────────────────────────────────────────────────────┐
│                         RunPod                                  │
├─────────────────────────────────────────────────────────────────┤
│                                                                 │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐            │
│  │    GRACE    │  │    PENNY    │  │   FACTORY   │            │
│  │             │  │             │  │             │            │
│  │  18 módulos │  │  ASR + TTS  │  │  Iterativo  │            │
│  │  NVIDIA L4  │  │  + Claude   │  │  NVIDIA L4  │            │
│  └─────────────┘  └─────────────┘  └─────────────┘            │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘
          ▲                  ▲                  ▲
          │                  │                  │
          └──────────────────┼──────────────────┘
                             │
                     ┌───────┴───────┐
                     │  S-CONTRACT   │
                     │    v2.1       │
                     └───────────────┘
                             ▲
                             │
              ┌──────────────┴──────────────┐
              │                             │
         ┌────┴────┐                   ┌────┴────┐
         │  DECK   │                   │  CORP   │
         │ Alfred  │                   │  Jared  │
         └─────────┘                   └─────────┘

Llamada a Servicio

URL Base

https://api.runpod.ai/v2/{endpoint_id}/runsync

Headers

Authorization: Bearer {RUNPOD_API_KEY}
Content-Type: application/json

Request

{
  "input": {
    "contract": {
      "contract_version": "2.1",
      "source": { "system": "DECK" },
      "target": { "service": "GRACE", "module": "SUMMARIZER" },
      "input": { "type": "text", "data": "..." }
    }
  }
}

Response

{
  "id": "job_id",
  "status": "COMPLETED",
  "output": {
    "status": "completed",
    "output": { "data": "..." },
    "usage": { "cost_usd": 0.002 }
  }
}

Modos de Ejecución

Modo Endpoint Uso
runsync /runsync Espera respuesta
run /run Asíncrono, devuelve job_id
status /status/{job_id} Consultar estado

Costes

Recurso Coste
NVIDIA L4 ~$0.20/hora
Worker idle $0 (serverless)
Por request Variable según tokens

Monitoreo

# Estado de endpoints
curl -H "Authorization: Bearer $RUNPOD_API_KEY" \
  https://api.runpod.ai/v2/{endpoint_id}/health