inference/README.md at 466c38a2d43837c82f6c09c55dbd69eb7a8f2336 - inference - AI Wolves Team

205 B

Raw Blame History

Run benchmark

Benchmark sglang

Run Llama-8b

python3 -m sglang.launch_server --model-path meta-llama/Llama-3.1-8B-Instruct --port 30000

Benchmark

python3 bench_sglang.py