lesson5作业

2024-02-21

543 words

基础作业

使用 LMDeploy 以本地对话、网页Gradio、API服务中的一种方式部署 InternLM-Chat-7B 模型，生成 300 字的小故事（需截图）

1 环境配置

设置开发机

创建虚拟环境

1 2	bash conda create -n Lmdeploy --clone /share/conda_envs/internlm-base

然后使用以下命令激活环境

1	conda activate Lmdeploy

下载imdeploy

1
2
3

pip install packaging
pip install /root/share/wheels/flash_attn-2.4.2+cu118torch2.0cxx11abiTRUE-cp310-cp310-linux_x86_64.whl
pip install 'lmdeploy[all]==v0.1.0'

2 服务部署

模型转换

离线转换：指定模型名称、模型路径，转换为turbomind需要的格式

1	lmdeploy convert internlm-chat-7b /root/share/temp/model_repos/internlm-chat-7b/

TurboMind 推理+命令行本地对话

1	lmdeploy chat turbomind ./workspace

Categories

Tags

Archives

Recent Posts

lesson5作业

基础作业

1 环境配置

2 服务部署

模型转换

TurboMind 推理+命令行本地对话

执行结果