跳至内容

飞翔黑鲨的博客

  • Linux教学
  • JAX教学
  • FLAX教学

MaxText/JetStream推理最小部署和自定义方法

us-docker.pkg.dev/cloud-tpu-images/inference/jetstream-http:v0.2.2 对应的github路径是ai-on-gke项目的tutorials-and-examples/inference-servers/jetstream/http-server

us-docker.pkg.dev/google-samples/containers/gke/gradio-app:v1.0.3对应的是GoogleCloudPlatform/kubernetes-engine-samples项目的ai-ml/llm-serving-gemma/gradio

us-docker.pkg.dev/cloud-tpu-images/inference/maxengine-server:v0.2.2对应的是AI-Hypercomputer/maxtext项目 以及 ai-on-gke项目的tutorials-and-examples/inference-servers/jetstream/maxtext/maxengine-server

作者 fbs发布于 2025年6月28日2025年6月29日分类 未分类

文章导航

上一篇 上篇文章: 宇宙究极GCP白嫖指南

最新文章

  • MaxText/JetStream推理最小部署和自定义方法
  • 宇宙究极GCP白嫖指南
  • TPU + Docker部署JAX-F5-TTS指南
  • 如何使用无限白嫖TPU Spot
  • 在TPU v4通过vllm运行QwQ 32B的教程

文章分类

  • AURORA粉丝向
  • AURORA资讯
  • AURORA音乐评论
  • FLAX教学
  • JAX教学
  • Linux教学
  • Rust教学
  • TPU教学
  • Web教学
  • Windows教学
  • 人工智能教学
  • 搬运教学
  • 未分类
  • 电影电视剧评论
  • Linux教学
  • JAX教学
  • FLAX教学
飞翔黑鲨的博客 自豪地采用WordPress