Intel
/

Ling-flash-2.0-gguf-q2ks-mixed-AutoRound

Model card Files Files and versions

n1ck-guo commited on Oct 28

Commit

12a6a65

·

verified ·

1 Parent(s): 0dff171

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -74,7 +74,7 @@ for n, m in model.named_modules():
     elif isinstance(m, torch.nn.Linear) and (not "expert" in n or "shared_experts" in n) and n != "lm_head":
         layer_config[n] = {"bits": 4}
-autoround = AutoRound(model, tokenizer, iters=0, layer_config=layer_config, nsamples=512)
 autoround.quantize_and_save("tmp_autoround", format="gguf:q2_k_s")

     elif isinstance(m, torch.nn.Linear) and (not "expert" in n or "shared_experts" in n) and n != "lm_head":
         layer_config[n] = {"bits": 4}
+autoround = AutoRound(model, tokenizer, iters=0, layer_config=layer_config, nsamples=4096, dataset="NeelNanda/pile-10k,HuggingFaceH4/ultrachat_200k", seqlen=1024)
 autoround.quantize_and_save("tmp_autoround", format="gguf:q2_k_s")