embedl
/

Llama-3.2-3B-Instruct-FlashHead-W4A16

flash_head_llama

text-generation-inference

compressed-tensors

Model card Files Files and versions

Llama-3.2-3B-Instruct-FlashHead-W4A16

3.25 GB

2 contributors

History: 15 commits

swaze's picture

Upload 3 files

006a2e6 verified 1 day ago