- Nueva estructura de carpetas según Skynet v7 - Añadidos schemas SQL completos - Documentación de entidades, componentes e integraciones - Modelo de seguridad actualizado - Infraestructura y operaciones reorganizadas
126 lines
4.0 KiB
Markdown
126 lines
4.0 KiB
Markdown
# GPU Services
|
|
|
|
**Plataforma:** RunPod
|
|
**Estado:** Operativo
|
|
|
|
---
|
|
|
|
## Servicios
|
|
|
|
| Servicio | Endpoint ID | GPU | Workers | Función |
|
|
|----------|-------------|-----|---------|---------|
|
|
| **Grace** | {grace_id} | NVIDIA L4 | 2 | Procesamiento IA |
|
|
| **Penny** | 0mxhaokgsmgee3 | NVIDIA L4 | 2 | Asistente voz |
|
|
| **The Factory** | {factory_id} | NVIDIA L4 | 2 | Generación iterativa |
|
|
|
|
---
|
|
|
|
## Arquitectura
|
|
|
|
```
|
|
┌─────────────────────────────────────────────────────────────────┐
|
|
│ RunPod │
|
|
├─────────────────────────────────────────────────────────────────┤
|
|
│ │
|
|
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
|
|
│ │ GRACE │ │ PENNY │ │ FACTORY │ │
|
|
│ │ │ │ │ │ │ │
|
|
│ │ 18 módulos │ │ ASR + TTS │ │ Iterativo │ │
|
|
│ │ NVIDIA L4 │ │ + Claude │ │ NVIDIA L4 │ │
|
|
│ └─────────────┘ └─────────────┘ └─────────────┘ │
|
|
│ │
|
|
└─────────────────────────────────────────────────────────────────┘
|
|
▲ ▲ ▲
|
|
│ │ │
|
|
└──────────────────┼──────────────────┘
|
|
│
|
|
┌───────┴───────┐
|
|
│ S-CONTRACT │
|
|
│ v2.1 │
|
|
└───────────────┘
|
|
▲
|
|
│
|
|
┌──────────────┴──────────────┐
|
|
│ │
|
|
┌────┴────┐ ┌────┴────┐
|
|
│ DECK │ │ CORP │
|
|
│ Alfred │ │ Jared │
|
|
└─────────┘ └─────────┘
|
|
```
|
|
|
|
---
|
|
|
|
## Llamada a Servicio
|
|
|
|
### URL Base
|
|
|
|
```
|
|
https://api.runpod.ai/v2/{endpoint_id}/runsync
|
|
```
|
|
|
|
### Headers
|
|
|
|
```
|
|
Authorization: Bearer {RUNPOD_API_KEY}
|
|
Content-Type: application/json
|
|
```
|
|
|
|
### Request
|
|
|
|
```json
|
|
{
|
|
"input": {
|
|
"contract": {
|
|
"contract_version": "2.1",
|
|
"source": { "system": "DECK" },
|
|
"target": { "service": "GRACE", "module": "SUMMARIZER" },
|
|
"input": { "type": "text", "data": "..." }
|
|
}
|
|
}
|
|
}
|
|
```
|
|
|
|
### Response
|
|
|
|
```json
|
|
{
|
|
"id": "job_id",
|
|
"status": "COMPLETED",
|
|
"output": {
|
|
"status": "completed",
|
|
"output": { "data": "..." },
|
|
"usage": { "cost_usd": 0.002 }
|
|
}
|
|
}
|
|
```
|
|
|
|
---
|
|
|
|
## Modos de Ejecución
|
|
|
|
| Modo | Endpoint | Uso |
|
|
|------|----------|-----|
|
|
| **runsync** | /runsync | Espera respuesta |
|
|
| **run** | /run | Asíncrono, devuelve job_id |
|
|
| **status** | /status/{job_id} | Consultar estado |
|
|
|
|
---
|
|
|
|
## Costes
|
|
|
|
| Recurso | Coste |
|
|
|---------|-------|
|
|
| NVIDIA L4 | ~$0.20/hora |
|
|
| Worker idle | $0 (serverless) |
|
|
| Por request | Variable según tokens |
|
|
|
|
---
|
|
|
|
## Monitoreo
|
|
|
|
```bash
|
|
# Estado de endpoints
|
|
curl -H "Authorization: Bearer $RUNPOD_API_KEY" \
|
|
https://api.runpod.ai/v2/{endpoint_id}/health
|
|
```
|