使用华为MindIE¶
首先根据版本需求选择PyTorch MindIE镜像:
然后参考华为的文档:推理服务部署(DeepSeek-R1-Distill-Qwen-7B)-AI服务部署-方案部署指南-RAG一体化解决方案参考实践-鲲鹏RAG开发文档-鲲鹏社区
华为使用文档精简步骤:
-
准备好模型
-
编辑好
/usr/local/Ascend/mindie/latest/mindie-service/conf/config.json
文件,主要是修改模型的路径和Device Index等 -
加载环境变量:
source /usr/local/Ascend/ascend-toolkit/set_env.sh
source /usr/local/Ascend/nnal/atb/set_env.sh
source /usr/local/Ascend/atb-models/set_env.sh
source /usr/local/Ascend/mindie/set_env.sh
source /usr/local/Ascend/mindie/latest/mindie-service/set_env.sh
- 启动服务
cd /usr/local/Ascend/mindie/latest/mindie-service/bin
./mindieservice_daemon