powderluv · February 12, 2026 21:19
diff --git a/gistfile1.txt b/gistfile1.txt
 Launch docker:
 rocm/sgl-dev:v0.5.8.post1-rocm720-mi30x-20260211-preview


 Inside container -
 
 Install Sglang from source by following -
 https://docs.sglang.io/platforms/amd_gpu.html#install-from-source
 
 Install transformer from source -
 pip install git+https://github.com/huggingface/transformers.git


 Launch the serve -
 
 python -m sglang.launch_server \
  --model zai-org/GLM-5-FP8 \
  --tp 8 \
  --tool-call-parser glm47 \
  --reasoning-parser glm45 \
  --mem-fraction-static 0.8 \
  --nsa-prefill-backend tilelang \
  --nsa-decode-backend tilelang
 
 GSM8K accuracy -
 
 |Tasks|Version|     Filter     |n-shot|  Metric   |   |Value |   |Stderr|
 |-----|------:|----------------|-----:|-----------|---|-----:|---|-----:|
 |gsm8k|      3|flexible-extract|     5|exact_match|↑  |0.9545|±  |0.0057|
 |     |       |strict-match    |     5|exact_match|↑  |0.9553|±  |0.0057|
	Launch docker:
	rocm/sgl-dev:v0.5.8.post1-rocm720-mi30x-20260211-preview


	Inside container -

	Install Sglang from source by following -
	https://docs.sglang.io/platforms/amd_gpu.html#install-from-source

	Install transformer from source -
	pip install git+https://github.com/huggingface/transformers.git


	Launch the serve -

	python -m sglang.launch_server \
	--model zai-org/GLM-5-FP8 \
	--tp 8 \
	--tool-call-parser glm47 \
	--reasoning-parser glm45 \
	--mem-fraction-static 0.8 \
	--nsa-prefill-backend tilelang \
	--nsa-decode-backend tilelang

	GSM8K accuracy -

	\|Tasks\|Version\| Filter \|n-shot\| Metric \| \|Value \| \|Stderr\|
	\|-----\|------:\|----------------\|-----:\|-----------\|---\|-----:\|---\|-----:\|
	\|gsm8k\| 3\|flexible-extract\| 5\|exact_match\|↑ \|0.9545\|± \|0.0057\|
	\| \| \|strict-match \| 5\|exact_match\|↑ \|0.9553\|± \|0.0057\|
No results found