Update to Skynet v7 - Complete documentation restructure
- Nueva estructura de carpetas según Skynet v7 - Añadidos schemas SQL completos - Documentación de entidades, componentes e integraciones - Modelo de seguridad actualizado - Infraestructura y operaciones reorganizadas
This commit is contained in:
125
05_INTEGRACIONES/gpu-services.md
Normal file
125
05_INTEGRACIONES/gpu-services.md
Normal file
@@ -0,0 +1,125 @@
|
||||
# GPU Services
|
||||
|
||||
**Plataforma:** RunPod
|
||||
**Estado:** Operativo
|
||||
|
||||
---
|
||||
|
||||
## Servicios
|
||||
|
||||
| Servicio | Endpoint ID | GPU | Workers | Función |
|
||||
|----------|-------------|-----|---------|---------|
|
||||
| **Grace** | {grace_id} | NVIDIA L4 | 2 | Procesamiento IA |
|
||||
| **Penny** | 0mxhaokgsmgee3 | NVIDIA L4 | 2 | Asistente voz |
|
||||
| **The Factory** | {factory_id} | NVIDIA L4 | 2 | Generación iterativa |
|
||||
|
||||
---
|
||||
|
||||
## Arquitectura
|
||||
|
||||
```
|
||||
┌─────────────────────────────────────────────────────────────────┐
|
||||
│ RunPod │
|
||||
├─────────────────────────────────────────────────────────────────┤
|
||||
│ │
|
||||
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
|
||||
│ │ GRACE │ │ PENNY │ │ FACTORY │ │
|
||||
│ │ │ │ │ │ │ │
|
||||
│ │ 18 módulos │ │ ASR + TTS │ │ Iterativo │ │
|
||||
│ │ NVIDIA L4 │ │ + Claude │ │ NVIDIA L4 │ │
|
||||
│ └─────────────┘ └─────────────┘ └─────────────┘ │
|
||||
│ │
|
||||
└─────────────────────────────────────────────────────────────────┘
|
||||
▲ ▲ ▲
|
||||
│ │ │
|
||||
└──────────────────┼──────────────────┘
|
||||
│
|
||||
┌───────┴───────┐
|
||||
│ S-CONTRACT │
|
||||
│ v2.1 │
|
||||
└───────────────┘
|
||||
▲
|
||||
│
|
||||
┌──────────────┴──────────────┐
|
||||
│ │
|
||||
┌────┴────┐ ┌────┴────┐
|
||||
│ DECK │ │ CORP │
|
||||
│ Alfred │ │ Jared │
|
||||
└─────────┘ └─────────┘
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## Llamada a Servicio
|
||||
|
||||
### URL Base
|
||||
|
||||
```
|
||||
https://api.runpod.ai/v2/{endpoint_id}/runsync
|
||||
```
|
||||
|
||||
### Headers
|
||||
|
||||
```
|
||||
Authorization: Bearer {RUNPOD_API_KEY}
|
||||
Content-Type: application/json
|
||||
```
|
||||
|
||||
### Request
|
||||
|
||||
```json
|
||||
{
|
||||
"input": {
|
||||
"contract": {
|
||||
"contract_version": "2.1",
|
||||
"source": { "system": "DECK" },
|
||||
"target": { "service": "GRACE", "module": "SUMMARIZER" },
|
||||
"input": { "type": "text", "data": "..." }
|
||||
}
|
||||
}
|
||||
}
|
||||
```
|
||||
|
||||
### Response
|
||||
|
||||
```json
|
||||
{
|
||||
"id": "job_id",
|
||||
"status": "COMPLETED",
|
||||
"output": {
|
||||
"status": "completed",
|
||||
"output": { "data": "..." },
|
||||
"usage": { "cost_usd": 0.002 }
|
||||
}
|
||||
}
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## Modos de Ejecución
|
||||
|
||||
| Modo | Endpoint | Uso |
|
||||
|------|----------|-----|
|
||||
| **runsync** | /runsync | Espera respuesta |
|
||||
| **run** | /run | Asíncrono, devuelve job_id |
|
||||
| **status** | /status/{job_id} | Consultar estado |
|
||||
|
||||
---
|
||||
|
||||
## Costes
|
||||
|
||||
| Recurso | Coste |
|
||||
|---------|-------|
|
||||
| NVIDIA L4 | ~$0.20/hora |
|
||||
| Worker idle | $0 (serverless) |
|
||||
| Por request | Variable según tokens |
|
||||
|
||||
---
|
||||
|
||||
## Monitoreo
|
||||
|
||||
```bash
|
||||
# Estado de endpoints
|
||||
curl -H "Authorization: Bearer $RUNPOD_API_KEY" \
|
||||
https://api.runpod.ai/v2/{endpoint_id}/health
|
||||
```
|
||||
Reference in New Issue
Block a user