[Kuberentes] ML Serving Framework 비교


비교 항목

  • Tensorflow Serving
  • Torch Serve
  • BentoML
  • NVIDIA Triton Inference Server
  • 이력서 다듬고
  • 벤토에멜 공부해오고
  • 쿠버네티스 책 보고
Tensorflow ServingTorchServeBentoMLTriton Inference Server
지원 모델TensorflowPytorch, TensorRTTensorflow, Pytorch, ONNX, TensorRTTensorflow, PyTorch, ONNX, TensorRT
API 및 프로토콜REST, gRPCREST, gRPCREST, gRPCREST, gRPC
BatchDynamic BatchBatch InferenceAdaptive BatchDynamic Batch
모델 버전 관리지원지원지원지원
모니터링PrometheusPrometheusPrometheusPrometheus
언어Python, C++, JavascriptPython, JavaPythonPython, C++