检查清单
问题描述
我的服务器是AMD 91352, 4824GB内存,4090。按照 KTransformers Optimized编译运行 Deepseek R1-Q4,总是遇到:
numa_sched_setaffinity_v2_int() failed: Invalid argument
set_mempolicy: Invalid argument
我在另外一台2TB内存机器上可以正常运行 fp8和 q4版本Deepseek模型。
复现步骤
我按照 KTransformers Optimized配置编译项目。
配置 GRUB_CMDLINE_LINUX如下:
(kt) ➜ ktransformers git:(optimize-latest) ✗ grep GRUB_CMDLINE_LINUX /etc/default/grub
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
GRUB_CMDLINE_LINUX="default_hugepagesz=1G hugepagesz=1G hugepages=950 hugepagesz=2M hugepages=16384"
运行ktransformer:
sudo chown zhao /dev/hugepages
echo 402653184000 > /tmp/kt_per_numa_huge_mem
env LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libstdc++.so.6:/home/zhao/vproxy/mimalloc/out/release/libmimalloc.so MIMALLOC_VERBOSE=1 MIMALLOC_ALLOW_LARGE_OS_PAGES=1 numactl --interleave=0 python -m ktransformers.local_chat --model_path ~/DeepSeek-R1 --gguf_path ~/DeepSeek-R1-Q4_K_M --cpu_infer 63 --max_new_tokens 9186 --cache_lens 9186 --force_think true --optimize_rule_path ./ktransformers/optimize/optimize_rules/DeepSeek-V3-Chat.yaml
numa_sched_setaffinity_v2_int() failed: Invalid argument
set_mempolicy: Invalid argument
环境信息
AMD 91352, 4824GB内存,4090
ubuntu 24.04
torch: 2.6.0+cu126
NVIDIA-SMI 570.124.06 Driver Version: 570.124.06 CUDA Version: 12.8
ktransformers 0.2.3.post1+cu128torch26fancy
检查清单
问题描述
我的服务器是AMD 91352, 4824GB内存,4090。按照 KTransformers Optimized编译运行 Deepseek R1-Q4,总是遇到:
numa_sched_setaffinity_v2_int() failed: Invalid argument
set_mempolicy: Invalid argument
我在另外一台2TB内存机器上可以正常运行 fp8和 q4版本Deepseek模型。
复现步骤
我按照 KTransformers Optimized配置编译项目。
配置 GRUB_CMDLINE_LINUX如下:
运行ktransformer:
numa_sched_setaffinity_v2_int() failed: Invalid argument
set_mempolicy: Invalid argument
环境信息
AMD 91352, 4824GB内存,4090
ubuntu 24.04
torch: 2.6.0+cu126
NVIDIA-SMI 570.124.06 Driver Version: 570.124.06 CUDA Version: 12.8
ktransformers 0.2.3.post1+cu128torch26fancy