GitHub

python tools/model_partition.py --config_file tasks/medusa_llama/config/vicuna_7b_config.json

python pipeline_inference.py  --world 4 --rank xxx --config_file  tasks/medusa_llama/config/vicuna_7b_config.json  --load_in_8bit

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
docs		docs
images		images
jupiter		jupiter
model/medusa-vicuna-7b-v1.3		model/medusa-vicuna-7b-v1.3
tasks/medusa_llama		tasks/medusa_llama
tools		tools
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pipeline_inference.py		pipeline_inference.py

Provide feedback