性能测试

evalscope perf --parallel 20 --number 20 --model Qwen2.5-7B-Instruct --url http://127.0.0.1:10013/v1/chat/completions --api openai --dataset random --min-tokens 128 --max-tokens 128 --min-prompt-length 1024 --max-prompt-length 1024 --tokenizer-path /mnt/data/llm_models/Qwen/Qwen2.5-7B-Instruct --extra-args '{"ignore_eos": true}'