04/03/2026
🚨 Workato tối ưu hóa 67% chi phí vận hành với giải pháp từ DigitalOcean🚨
Workato xử lý tới 1 nghìn tỷ tác vụ tự động hóa. Khi đó, hiệu suất suy luận (inference) không còn là một lựa chọn—đó là yêu cầu bắt buộc.
Giải pháp Agentic Inference Cloud của DigitalOcean, vận hành bởi GPU NVIDIA Hopper, đã mang lại những kết quả vượt trội:
✅ Thông lượng (throughput) trên mỗi GPU cao hơn 67%
✅ Độ trễ đầu-cuối (end-to-end latency) thấp hơn 79%
✅ Thời gian phản hồi token đầu tiên (TTFT) nhanh hơn 77%
✅ Chi phí vận hành mô hình thấp hơn 67% dù chỉ sử dụng một nửa số lượng GPU
Công nghệ NVIDIA Dynamo với cơ chế định tuyến tối ưu hóa bộ nhớ đệm (KV-aware routing) giúp điều hướng mọi yêu cầu đến đúng nơi dữ liệu ngữ cảnh (context) đang sẵn có. Giảm thiểu tính toán lại. Tối ưu độ trễ. Nâng cao hiệu quả kinh tế. 🌊