- Nueva estructura de carpetas según Skynet v7 - Añadidos schemas SQL completos - Documentación de entidades, componentes e integraciones - Modelo de seguridad actualizado - Infraestructura y operaciones reorganizadas
4.0 KiB
4.0 KiB
GPU Services
Plataforma: RunPod
Estado: Operativo
Servicios
| Servicio | Endpoint ID | GPU | Workers | Función |
|---|---|---|---|---|
| Grace | {grace_id} | NVIDIA L4 | 2 | Procesamiento IA |
| Penny | 0mxhaokgsmgee3 | NVIDIA L4 | 2 | Asistente voz |
| The Factory | {factory_id} | NVIDIA L4 | 2 | Generación iterativa |
Arquitectura
┌─────────────────────────────────────────────────────────────────┐
│ RunPod │
├─────────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ GRACE │ │ PENNY │ │ FACTORY │ │
│ │ │ │ │ │ │ │
│ │ 18 módulos │ │ ASR + TTS │ │ Iterativo │ │
│ │ NVIDIA L4 │ │ + Claude │ │ NVIDIA L4 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────┘
▲ ▲ ▲
│ │ │
└──────────────────┼──────────────────┘
│
┌───────┴───────┐
│ S-CONTRACT │
│ v2.1 │
└───────────────┘
▲
│
┌──────────────┴──────────────┐
│ │
┌────┴────┐ ┌────┴────┐
│ DECK │ │ CORP │
│ Alfred │ │ Jared │
└─────────┘ └─────────┘
Llamada a Servicio
URL Base
https://api.runpod.ai/v2/{endpoint_id}/runsync
Headers
Authorization: Bearer {RUNPOD_API_KEY}
Content-Type: application/json
Request
{
"input": {
"contract": {
"contract_version": "2.1",
"source": { "system": "DECK" },
"target": { "service": "GRACE", "module": "SUMMARIZER" },
"input": { "type": "text", "data": "..." }
}
}
}
Response
{
"id": "job_id",
"status": "COMPLETED",
"output": {
"status": "completed",
"output": { "data": "..." },
"usage": { "cost_usd": 0.002 }
}
}
Modos de Ejecución
| Modo | Endpoint | Uso |
|---|---|---|
| runsync | /runsync | Espera respuesta |
| run | /run | Asíncrono, devuelve job_id |
| status | /status/{job_id} | Consultar estado |
Costes
| Recurso | Coste |
|---|---|
| NVIDIA L4 | ~$0.20/hora |
| Worker idle | $0 (serverless) |
| Por request | Variable según tokens |
Monitoreo
# Estado de endpoints
curl -H "Authorization: Bearer $RUNPOD_API_KEY" \
https://api.runpod.ai/v2/{endpoint_id}/health