tatsuyaaaaaaa
/

Qwen3-8B-GPTQ-W4A16

compressed-tensors

Model card Files Files and versions

Qwen3-8Bをllm-compressorでGPTQ-W4A16量子化したモデルです。

キャリブレーションにはwikimedia/wikipediaの20231101.jaを使用しています。

Downloads last month: 17

Safetensors

Model size

2B params

Tensor type

F16

·

I64

·

I32

·

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for tatsuyaaaaaaa/Qwen3-8B-GPTQ-W4A16

Base model

Qwen/Qwen3-8B-Base

Finetuned

Quantized

(237)

this model

Dataset used to train tatsuyaaaaaaa/Qwen3-8B-GPTQ-W4A16