安装指南
快速安装
pip install ktransformers
从源码安装
git clone https://github.com/kvcache-ai/ktransformers.git
cd ktransformers
pip install -e .
CUDA 配置
KTransformers 需要 CUDA 来进行 GPU 加速。请确保您具备:
- 计算能力 7.0+ 的 NVIDIA GPU
- CUDA Toolkit 11.8 或更高版本
- cuDNN 8.6 或更高版本
验证 CUDA 安装
nvidia-smi
nvcc --version
Docker
docker pull kvcache/ktransformers:latest
docker run --gpus all -it kvcache/ktransformers
故障排除
找不到 CUDA
确保 CUDA 在您的 PATH 中:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
内存不足
尝试减少 batch size 或在配置中启用 offloading。