W1127 19:57:11.551000 371702 site-packages/torch/distributed/run.py:793] 
W1127 19:57:11.551000 371702 site-packages/torch/distributed/run.py:793] *****************************************
W1127 19:57:11.551000 371702 site-packages/torch/distributed/run.py:793] Setting OMP_NUM_THREADS environment variable for each process to be 1 in default, to avoid your system being overloaded, please further tune the variable for optimal performance in your application as needed. 
W1127 19:57:11.551000 371702 site-packages/torch/distributed/run.py:793] *****************************************
Trainer._get_train_sampler replaced with custom implementation.
Trainer._get_train_sampler replaced with custom implementation.
Trainer._get_train_sampler replaced with custom implementation.
Trainer._get_train_sampler replaced with custom implementation.
Trainer._get_train_sampler replaced with custom implementation.
Trainer._get_train_sampler replaced with custom implementation.
Trainer._get_train_sampler replaced with custom implementation.
[2025-11-27 19:57:17,989] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
[2025-11-27 19:57:18,005] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
[2025-11-27 19:57:18,096] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
[2025-11-27 19:57:18,187] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
[2025-11-27 19:57:18,272] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
[2025-11-27 19:57:18,329] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
[2025-11-27 19:57:18,336] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
Trainer._get_train_sampler replaced with custom implementation.
[2025-11-27 19:57:18,699] [INFO] [comm.py:658:init_distributed] cdb=None
[2025-11-27 19:57:18,815] [INFO] [comm.py:658:init_distributed] cdb=None
[2025-11-27 19:57:18,844] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
[2025-11-27 19:57:18,901] [INFO] [comm.py:658:init_distributed] cdb=None
[2025-11-27 19:57:18,953] [INFO] [comm.py:658:init_distributed] cdb=None
[2025-11-27 19:57:18,953] [INFO] [comm.py:689:init_distributed] Initializing TorchBackend in DeepSpeed with backend nccl
[2025-11-27 19:57:19,049] [INFO] [comm.py:658:init_distributed] cdb=None
[2025-11-27 19:57:19,060] [INFO] [comm.py:658:init_distributed] cdb=None
[2025-11-27 19:57:19,148] [INFO] [comm.py:658:init_distributed] cdb=None
[2025-11-27 19:57:19,733] [INFO] [comm.py:658:init_distributed] cdb=None
FlashAttention 3 is available
You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
FlashAttention 3 is available
You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
FlashAttention 3 is available
You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
FlashAttention 3 is available
FlashAttention 3 is available
FlashAttention 3 is available
You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
FlashAttention 3 is available
You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
FlashAttention 3 is available
You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.20it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.20it/s]
Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at /mnt/data0/zhengduo/model/Qwen2.5-VL-3B-Instruct/ and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'geometry_merger.ln_q.weight', 'geometry_merger.mlp.0.bias', 'geometry_merger.mlp.0.weight', 'geometry_merger.mlp.2.bias', 'geometry_merger.mlp.2.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.19it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.19it/s]
Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at /mnt/data0/zhengduo/model/Qwen2.5-VL-3B-Instruct/ and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'geometry_merger.ln_q.weight', 'geometry_merger.mlp.0.bias', 'geometry_merger.mlp.0.weight', 'geometry_merger.mlp.2.bias', 'geometry_merger.mlp.2.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.19it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.19it/s]
Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at /mnt/data0/zhengduo/model/Qwen2.5-VL-3B-Instruct/ and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'geometry_merger.ln_q.weight', 'geometry_merger.mlp.0.bias', 'geometry_merger.mlp.0.weight', 'geometry_merger.mlp.2.bias', 'geometry_merger.mlp.2.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.21it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.21it/s]
Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at /mnt/data0/zhengduo/model/Qwen2.5-VL-3B-Instruct/ and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'geometry_merger.ln_q.weight', 'geometry_merger.mlp.0.bias', 'geometry_merger.mlp.0.weight', 'geometry_merger.mlp.2.bias', 'geometry_merger.mlp.2.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.18it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.18it/s]
Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at /mnt/data0/zhengduo/model/Qwen2.5-VL-3B-Instruct/ and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'geometry_merger.ln_q.weight', 'geometry_merger.mlp.0.bias', 'geometry_merger.mlp.0.weight', 'geometry_merger.mlp.2.bias', 'geometry_merger.mlp.2.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.04it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.04it/s]
Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at /mnt/data0/zhengduo/model/Qwen2.5-VL-3B-Instruct/ and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'geometry_merger.ln_q.weight', 'geometry_merger.mlp.0.bias', 'geometry_merger.mlp.0.weight', 'geometry_merger.mlp.2.bias', 'geometry_merger.mlp.2.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.06it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.06it/s]
Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at /mnt/data0/zhengduo/model/Qwen2.5-VL-3B-Instruct/ and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'geometry_merger.ln_q.weight', 'geometry_merger.mlp.0.bias', 'geometry_merger.mlp.0.weight', 'geometry_merger.mlp.2.bias', 'geometry_merger.mlp.2.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.19it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:01<00:00,  1.19it/s]
Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at /mnt/data0/zhengduo/model/Qwen2.5-VL-3B-Instruct/ and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'geometry_merger.ln_q.weight', 'geometry_merger.mlp.0.bias', 'geometry_merger.mlp.0.weight', 'geometry_merger.mlp.2.bias', 'geometry_merger.mlp.2.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Loading weights from local directory
Loading weights from local directory
Loading weights from local directory
Loading weights from local directory
Loading weights from local directory
Loading weights from local directory
Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
Vision Module - Attention Blocks:
Trainable Block Indices: None
Non-Trainable Block Indices: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31]
Merger Module Trainable: False
LLM Module - Embed Tokens Trainable: True
LLM Module - Trainable Layer Indices: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35]
LLM Module - Non-Trainable Layer Indices: None
Qwen2_5_VLConfig {
  "_attn_implementation_autoset": true,
  "architectures": [
    "Qwen2_5_VLForConditionalGeneration"
  ],
  "attention_dropout": 0.0,
  "bos_token_id": 151643,
  "eos_token_id": 151645,
  "feature_fusion_method": "add",
  "fusion_num_layers": 1,
  "geometry_encoder_type": "vggt",
  "geometry_merger_type": "mlp",
  "hidden_act": "silu",
  "hidden_size": 2048,
  "image_token_id": 151655,
  "initializer_range": 0.02,
  "intermediate_size": 11008,
  "max_position_embeddings": 128000,
  "max_window_layers": 70,
  "model_type": "qwen2_5_vl",
  "num_attention_heads": 16,
  "num_hidden_layers": 36,
  "num_key_value_heads": 2,
  "reference_frame": "first",
  "rms_norm_eps": 1e-06,
  "rope_scaling": {
    "mrope_section": [
      16,
      24,
      24
    ],
    "rope_type": "default",
    "type": "default"
  },
  "rope_theta": 1000000.0,
  "sliding_window": 32768,
  "tie_word_embeddings": true,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.50.0",
  "use_cache": false,
  "use_geometry_encoder": true,
  "use_sliding_window": false,
  "video_token_id": 151656,
  "vision_config": {
    "depth": 32,
    "fullatt_block_indexes": [
      7,
      15,
      23,
      31
    ],
    "hidden_act": "silu",
    "hidden_size": 1280,
    "in_channels": 3,
    "in_chans": 3,
    "intermediate_size": 3420,
    "model_type": "qwen2_5_vl",
    "num_heads": 16,
    "out_hidden_size": 2048,
    "patch_size": 14,
    "spatial_merge_size": 2,
    "spatial_patch_size": 14,
    "temporal_patch_size": 2,
    "tokens_per_second": 2,
    "torch_dtype": "bfloat16",
    "window_size": 112
  },
  "vision_end_token_id": 151653,
  "vision_start_token_id": 151652,
  "vision_token_id": 151654,
  "vocab_size": 151936
}

Loading datasets: [{'annotation_path': 'data/new_train/scan2cap_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scan2cap'}, {'annotation_path': 'data/new_train/scanrefer_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scanrefer'}, {'annotation_path': 'data/new_train/scannet_det_train_4frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scannet_det'}]
Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
Qwen2_5_VLConfig {
  "_attn_implementation_autoset": true,
  "architectures": [
    "Qwen2_5_VLForConditionalGeneration"
  ],
  "attention_dropout": 0.0,
  "bos_token_id": 151643,
  "eos_token_id": 151645,
  "feature_fusion_method": "add",
  "fusion_num_layers": 1,
  "geometry_encoder_type": "vggt",
  "geometry_merger_type": "mlp",
  "hidden_act": "silu",
  "hidden_size": 2048,
  "image_token_id": 151655,
  "initializer_range": 0.02,
  "intermediate_size": 11008,
  "max_position_embeddings": 128000,
  "max_window_layers": 70,
  "model_type": "qwen2_5_vl",
  "num_attention_heads": 16,
  "num_hidden_layers": 36,
  "num_key_value_heads": 2,
  "reference_frame": "first",
  "rms_norm_eps": 1e-06,
  "rope_scaling": {
    "mrope_section": [
      16,
      24,
      24
    ],
    "rope_type": "default",
    "type": "default"
  },
  "rope_theta": 1000000.0,
  "sliding_window": 32768,
  "tie_word_embeddings": true,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.50.0",
  "use_cache": false,
  "use_geometry_encoder": true,
  "use_sliding_window": false,
  "video_token_id": 151656,
  "vision_config": {
    "depth": 32,
    "fullatt_block_indexes": [
      7,
      15,
      23,
      31
    ],
    "hidden_act": "silu",
    "hidden_size": 1280,
    "in_channels": 3,
    "in_chans": 3,
    "intermediate_size": 3420,
    "model_type": "qwen2_5_vl",
    "num_heads": 16,
    "out_hidden_size": 2048,
    "patch_size": 14,
    "spatial_merge_size": 2,
    "spatial_patch_size": 14,
    "temporal_patch_size": 2,
    "tokens_per_second": 2,
    "torch_dtype": "bfloat16",
    "window_size": 112
  },
  "vision_end_token_id": 151653,
  "vision_start_token_id": 151652,
  "vision_token_id": 151654,
  "vocab_size": 151936
}

Loading datasets: [{'annotation_path': 'data/new_train/scan2cap_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scan2cap'}, {'annotation_path': 'data/new_train/scanrefer_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scanrefer'}, {'annotation_path': 'data/new_train/scannet_det_train_4frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scannet_det'}]
Loading weights from local directory
Qwen2_5_VLConfig {
  "_attn_implementation_autoset": true,
  "architectures": [
    "Qwen2_5_VLForConditionalGeneration"
  ],
  "attention_dropout": 0.0,
  "bos_token_id": 151643,
  "eos_token_id": 151645,
  "feature_fusion_method": "add",
  "fusion_num_layers": 1,
  "geometry_encoder_type": "vggt",
  "geometry_merger_type": "mlp",
  "hidden_act": "silu",
  "hidden_size": 2048,
  "image_token_id": 151655,
  "initializer_range": 0.02,
  "intermediate_size": 11008,
  "max_position_embeddings": 128000,
  "max_window_layers": 70,
  "model_type": "qwen2_5_vl",
  "num_attention_heads": 16,
  "num_hidden_layers": 36,
  "num_key_value_heads": 2,
  "reference_frame": "first",
  "rms_norm_eps": 1e-06,
  "rope_scaling": {
    "mrope_section": [
      16,
      24,
      24
    ],
    "rope_type": "default",
    "type": "default"
  },
  "rope_theta": 1000000.0,
  "sliding_window": 32768,
  "tie_word_embeddings": true,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.50.0",
  "use_cache": false,
  "use_geometry_encoder": true,
  "use_sliding_window": false,
  "video_token_id": 151656,
  "vision_config": {
    "depth": 32,
    "fullatt_block_indexes": [
      7,
      15,
      23,
      31
    ],
    "hidden_act": "silu",
    "hidden_size": 1280,
    "in_channels": 3,
    "in_chans": 3,
    "intermediate_size": 3420,
    "model_type": "qwen2_5_vl",
    "num_heads": 16,
    "out_hidden_size": 2048,
    "patch_size": 14,
    "spatial_merge_size": 2,
    "spatial_patch_size": 14,
    "temporal_patch_size": 2,
    "tokens_per_second": 2,
    "torch_dtype": "bfloat16",
    "window_size": 112
  },
  "vision_end_token_id": 151653,
  "vision_start_token_id": 151652,
  "vision_token_id": 151654,
  "vocab_size": 151936
}

Loading datasets: [{'annotation_path': 'data/new_train/scan2cap_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scan2cap'}, {'annotation_path': 'data/new_train/scanrefer_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scanrefer'}, {'annotation_path': 'data/new_train/scannet_det_train_4frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scannet_det'}]
Qwen2_5_VLConfig {
  "_attn_implementation_autoset": true,
  "architectures": [
    "Qwen2_5_VLForConditionalGeneration"
  ],
  "attention_dropout": 0.0,
  "bos_token_id": 151643,
  "eos_token_id": 151645,
  "feature_fusion_method": "add",
  "fusion_num_layers": 1,
  "geometry_encoder_type": "vggt",
  "geometry_merger_type": "mlp",
  "hidden_act": "silu",
  "hidden_size": 2048,
  "image_token_id": 151655,
  "initializer_range": 0.02,
  "intermediate_size": 11008,
  "max_position_embeddings": 128000,
  "max_window_layers": 70,
  "model_type": "qwen2_5_vl",
  "num_attention_heads": 16,
  "num_hidden_layers": 36,
  "num_key_value_heads": 2,
  "reference_frame": "first",
  "rms_norm_eps": 1e-06,
  "rope_scaling": {
    "mrope_section": [
      16,
      24,
      24
    ],
    "rope_type": "default",
    "type": "default"
  },
  "rope_theta": 1000000.0,
  "sliding_window": 32768,
  "tie_word_embeddings": true,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.50.0",
  "use_cache": false,
  "use_geometry_encoder": true,
  "use_sliding_window": false,
  "video_token_id": 151656,
  "vision_config": {
    "depth": 32,
    "fullatt_block_indexes": [
      7,
      15,
      23,
      31
    ],
    "hidden_act": "silu",
    "hidden_size": 1280,
    "in_channels": 3,
    "in_chans": 3,
    "intermediate_size": 3420,
    "model_type": "qwen2_5_vl",
    "num_heads": 16,
    "out_hidden_size": 2048,
    "patch_size": 14,
    "spatial_merge_size": 2,
    "spatial_patch_size": 14,
    "temporal_patch_size": 2,
    "tokens_per_second": 2,
    "torch_dtype": "bfloat16",
    "window_size": 112
  },
  "vision_end_token_id": 151653,
  "vision_start_token_id": 151652,
  "vision_token_id": 151654,
  "vocab_size": 151936
}

Loading datasets: [{'annotation_path': 'data/new_train/scan2cap_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scan2cap'}, {'annotation_path': 'data/new_train/scanrefer_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scanrefer'}, {'annotation_path': 'data/new_train/scannet_det_train_4frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scannet_det'}]
Qwen2_5_VLConfig {
  "_attn_implementation_autoset": true,
  "architectures": [
    "Qwen2_5_VLForConditionalGeneration"
  ],
  "attention_dropout": 0.0,
  "bos_token_id": 151643,
  "eos_token_id": 151645,
  "feature_fusion_method": "add",
  "fusion_num_layers": 1,
  "geometry_encoder_type": "vggt",
  "geometry_merger_type": "mlp",
  "hidden_act": "silu",
  "hidden_size": 2048,
  "image_token_id": 151655,
  "initializer_range": 0.02,
  "intermediate_size": 11008,
  "max_position_embeddings": 128000,
  "max_window_layers": 70,
  "model_type": "qwen2_5_vl",
  "num_attention_heads": 16,
  "num_hidden_layers": 36,
  "num_key_value_heads": 2,
  "reference_frame": "first",
  "rms_norm_eps": 1e-06,
  "rope_scaling": {
    "mrope_section": [
      16,
      24,
      24
    ],
    "rope_type": "default",
    "type": "default"
  },
  "rope_theta": 1000000.0,
  "sliding_window": 32768,
  "tie_word_embeddings": true,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.50.0",
  "use_cache": false,
  "use_geometry_encoder": true,
  "use_sliding_window": false,
  "video_token_id": 151656,
  "vision_config": {
    "depth": 32,
    "fullatt_block_indexes": [
      7,
      15,
      23,
      31
    ],
    "hidden_act": "silu",
    "hidden_size": 1280,
    "in_channels": 3,
    "in_chans": 3,
    "intermediate_size": 3420,
    "model_type": "qwen2_5_vl",
    "num_heads": 16,
    "out_hidden_size": 2048,
    "patch_size": 14,
    "spatial_merge_size": 2,
    "spatial_patch_size": 14,
    "temporal_patch_size": 2,
    "tokens_per_second": 2,
    "torch_dtype": "bfloat16",
    "window_size": 112
  },
  "vision_end_token_id": 151653,
  "vision_start_token_id": 151652,
  "vision_token_id": 151654,
  "vocab_size": 151936
}

Loading datasets: [{'annotation_path': 'data/new_train/scan2cap_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scan2cap'}, {'annotation_path': 'data/new_train/scanrefer_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scanrefer'}, {'annotation_path': 'data/new_train/scannet_det_train_4frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scannet_det'}]
Qwen2_5_VLConfig {
  "_attn_implementation_autoset": true,
  "architectures": [
    "Qwen2_5_VLForConditionalGeneration"
  ],
  "attention_dropout": 0.0,
  "bos_token_id": 151643,
  "eos_token_id": 151645,
  "feature_fusion_method": "add",
  "fusion_num_layers": 1,
  "geometry_encoder_type": "vggt",
  "geometry_merger_type": "mlp",
  "hidden_act": "silu",
  "hidden_size": 2048,
  "image_token_id": 151655,
  "initializer_range": 0.02,
  "intermediate_size": 11008,
  "max_position_embeddings": 128000,
  "max_window_layers": 70,
  "model_type": "qwen2_5_vl",
  "num_attention_heads": 16,
  "num_hidden_layers": 36,
  "num_key_value_heads": 2,
  "reference_frame": "first",
  "rms_norm_eps": 1e-06,
  "rope_scaling": {
    "mrope_section": [
      16,
      24,
      24
    ],
    "rope_type": "default",
    "type": "default"
  },
  "rope_theta": 1000000.0,
  "sliding_window": 32768,
  "tie_word_embeddings": true,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.50.0",
  "use_cache": false,
  "use_geometry_encoder": true,
  "use_sliding_window": false,
  "video_token_id": 151656,
  "vision_config": {
    "depth": 32,
    "fullatt_block_indexes": [
      7,
      15,
      23,
      31
    ],
    "hidden_act": "silu",
    "hidden_size": 1280,
    "in_channels": 3,
    "in_chans": 3,
    "intermediate_size": 3420,
    "model_type": "qwen2_5_vl",
    "num_heads": 16,
    "out_hidden_size": 2048,
    "patch_size": 14,
    "spatial_merge_size": 2,
    "spatial_patch_size": 14,
    "temporal_patch_size": 2,
    "tokens_per_second": 2,
    "torch_dtype": "bfloat16",
    "window_size": 112
  },
  "vision_end_token_id": 151653,
  "vision_start_token_id": 151652,
  "vision_token_id": 151654,
  "vocab_size": 151936
}

Loading datasets: [{'annotation_path': 'data/new_train/scan2cap_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scan2cap'}, {'annotation_path': 'data/new_train/scanrefer_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scanrefer'}, {'annotation_path': 'data/new_train/scannet_det_train_4frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scannet_det'}]
Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
Qwen2_5_VLConfig {
  "_attn_implementation_autoset": true,
  "architectures": [
    "Qwen2_5_VLForConditionalGeneration"
  ],
  "attention_dropout": 0.0,
  "bos_token_id": 151643,
  "eos_token_id": 151645,
  "feature_fusion_method": "add",
  "fusion_num_layers": 1,
  "geometry_encoder_type": "vggt",
  "geometry_merger_type": "mlp",
  "hidden_act": "silu",
  "hidden_size": 2048,
  "image_token_id": 151655,
  "initializer_range": 0.02,
  "intermediate_size": 11008,
  "max_position_embeddings": 128000,
  "max_window_layers": 70,
  "model_type": "qwen2_5_vl",
  "num_attention_heads": 16,
  "num_hidden_layers": 36,
  "num_key_value_heads": 2,
  "reference_frame": "first",
  "rms_norm_eps": 1e-06,
  "rope_scaling": {
    "mrope_section": [
      16,
      24,
      24
    ],
    "rope_type": "default",
    "type": "default"
  },
  "rope_theta": 1000000.0,
  "sliding_window": 32768,
  "tie_word_embeddings": true,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.50.0",
  "use_cache": false,
  "use_geometry_encoder": true,
  "use_sliding_window": false,
  "video_token_id": 151656,
  "vision_config": {
    "depth": 32,
    "fullatt_block_indexes": [
      7,
      15,
      23,
      31
    ],
    "hidden_act": "silu",
    "hidden_size": 1280,
    "in_channels": 3,
    "in_chans": 3,
    "intermediate_size": 3420,
    "model_type": "qwen2_5_vl",
    "num_heads": 16,
    "out_hidden_size": 2048,
    "patch_size": 14,
    "spatial_merge_size": 2,
    "spatial_patch_size": 14,
    "temporal_patch_size": 2,
    "tokens_per_second": 2,
    "torch_dtype": "bfloat16",
    "window_size": 112
  },
  "vision_end_token_id": 151653,
  "vision_start_token_id": 151652,
  "vision_token_id": 151654,
  "vocab_size": 151936
}

Loading datasets: [{'annotation_path': 'data/new_train/scan2cap_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scan2cap'}, {'annotation_path': 'data/new_train/scanrefer_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scanrefer'}, {'annotation_path': 'data/new_train/scannet_det_train_4frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scannet_det'}]
Loading weights from local directory
Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
Qwen2_5_VLConfig {
  "_attn_implementation_autoset": true,
  "architectures": [
    "Qwen2_5_VLForConditionalGeneration"
  ],
  "attention_dropout": 0.0,
  "bos_token_id": 151643,
  "eos_token_id": 151645,
  "feature_fusion_method": "add",
  "fusion_num_layers": 1,
  "geometry_encoder_type": "vggt",
  "geometry_merger_type": "mlp",
  "hidden_act": "silu",
  "hidden_size": 2048,
  "image_token_id": 151655,
  "initializer_range": 0.02,
  "intermediate_size": 11008,
  "max_position_embeddings": 128000,
  "max_window_layers": 70,
  "model_type": "qwen2_5_vl",
  "num_attention_heads": 16,
  "num_hidden_layers": 36,
  "num_key_value_heads": 2,
  "reference_frame": "first",
  "rms_norm_eps": 1e-06,
  "rope_scaling": {
    "mrope_section": [
      16,
      24,
      24
    ],
    "rope_type": "default",
    "type": "default"
  },
  "rope_theta": 1000000.0,
  "sliding_window": 32768,
  "tie_word_embeddings": true,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.50.0",
  "use_cache": false,
  "use_geometry_encoder": true,
  "use_sliding_window": false,
  "video_token_id": 151656,
  "vision_config": {
    "depth": 32,
    "fullatt_block_indexes": [
      7,
      15,
      23,
      31
    ],
    "hidden_act": "silu",
    "hidden_size": 1280,
    "in_channels": 3,
    "in_chans": 3,
    "intermediate_size": 3420,
    "model_type": "qwen2_5_vl",
    "num_heads": 16,
    "out_hidden_size": 2048,
    "patch_size": 14,
    "spatial_merge_size": 2,
    "spatial_patch_size": 14,
    "temporal_patch_size": 2,
    "tokens_per_second": 2,
    "torch_dtype": "bfloat16",
    "window_size": 112
  },
  "vision_end_token_id": 151653,
  "vision_start_token_id": 151652,
  "vision_token_id": 151654,
  "vocab_size": 151936
}

Loading datasets: [{'annotation_path': 'data/new_train/scan2cap_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scan2cap'}, {'annotation_path': 'data/new_train/scanrefer_train_32frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scanrefer'}, {'annotation_path': 'data/new_train/scannet_det_train_4frames.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 1.0, 'dataset_name': 'scannet_det'}]
Total training samples: 245612
Formatting inputs...Skip in lazy mode
Total training samples: 245612
Formatting inputs...Skip in lazy mode
Total training samples: 245612
Formatting inputs...Skip in lazy mode
Total training samples: 245612
Total training samples: 245612
Formatting inputs...Skip in lazy mode
Total training samples: 245612
Formatting inputs...Skip in lazy mode
Formatting inputs...Skip in lazy mode
Total training samples: 245612
Formatting inputs...Skip in lazy mode
Total training samples: 245612
Formatting inputs...Skip in lazy mode
/home/zhengduo/miniconda3/envs/vgllm2/lib/python3.10/site-packages/torch/utils/checkpoint.py:87: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
  warnings.warn(
/home/zhengduo/miniconda3/envs/vgllm2/lib/python3.10/site-packages/torch/utils/checkpoint.py:87: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
  warnings.warn(
/home/zhengduo/workspace/vgllm/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:42: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(dtype=dtype):
/home/zhengduo/miniconda3/envs/vgllm2/lib/python3.10/site-packages/torch/utils/checkpoint.py:87: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
  warnings.warn(
/home/zhengduo/workspace/vgllm/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:42: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(dtype=dtype):
/home/zhengduo/miniconda3/envs/vgllm2/lib/python3.10/site-packages/torch/utils/checkpoint.py:87: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
  warnings.warn(
/home/zhengduo/miniconda3/envs/vgllm2/lib/python3.10/site-packages/torch/utils/checkpoint.py:87: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
  warnings.warn(
/home/zhengduo/workspace/vgllm/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:42: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(dtype=dtype):
/home/zhengduo/miniconda3/envs/vgllm2/lib/python3.10/site-packages/torch/utils/checkpoint.py:87: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
  warnings.warn(
/home/zhengduo/workspace/vgllm/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:42: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(dtype=dtype):
/home/zhengduo/miniconda3/envs/vgllm2/lib/python3.10/site-packages/torch/utils/checkpoint.py:87: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
  warnings.warn(
/home/zhengduo/workspace/vgllm/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:42: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(dtype=dtype):
/home/zhengduo/workspace/vgllm/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:42: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(dtype=dtype):
/home/zhengduo/workspace/vgllm/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:42: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(dtype=dtype):
  0%|          | 0/3837 [00:00<?, ?it/s]/home/zhengduo/miniconda3/envs/vgllm2/lib/python3.10/site-packages/torch/utils/checkpoint.py:87: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
  warnings.warn(
/home/zhengduo/workspace/vgllm/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:42: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(dtype=dtype):
  0%|          | 1/3837 [00:14<15:17:50, 14.36s/it]  0%|          | 2/3837 [00:21<10:43:26, 10.07s/it]  0%|          | 3/3837 [00:28<9:17:37,  8.73s/it]   0%|          | 4/3837 [00:35<8:35:30,  8.07s/it]  0%|          | 5/3837 [00:44<8:43:37,  8.20s/it]  0%|          | 6/3837 [00:53<9:12:14,  8.65s/it]  0%|          | 7/3837 [01:01<9:02:00,  8.49s/it]  0%|          | 8/3837 [01:10<8:57:56,  8.43s/it]  0%|          | 9/3837 [01:18<8:53:35,  8.36s/it]  0%|          | 10/3837 [01:26<8:50:43,  8.32s/it]  0%|          | 11/3837 [01:34<8:48:25,  8.29s/it]  0%|          | 12/3837 [01:41<8:25:27,  7.93s/it]  0%|          | 13/3837 [01:50<8:31:12,  8.02s/it]  0%|          | 14/3837 [01:58<8:35:31,  8.09s/it]  0%|          | 15/3837 [02:05<8:13:26,  7.75s/it]  0%|          | 16/3837 [02:12<7:58:10,  7.51s/it]  0%|          | 17/3837 [02:19<7:46:54,  7.33s/it]  0%|          | 18/3837 [02:27<8:03:23,  7.59s/it]  0%|          | 19/3837 [02:34<7:51:47,  7.41s/it]  1%|          | 20/3837 [02:42<8:07:08,  7.66s/it]                                                   {'loss': 10.0146, 'grad_norm': 34.668678283691406, 'learning_rate': 3.448275862068966e-06, 'epoch': 0.01}
  1%|          | 20/3837 [02:47<8:07:08,  7.66s/it]  1%|          | 21/3837 [02:56<9:59:19,  9.42s/it]  1%|          | 22/3837 [03:03<9:13:10,  8.70s/it]  1%|          | 23/3837 [03:11<9:02:55,  8.54s/it]  1%|          | 24/3837 [03:18<8:34:10,  8.09s/it]  1%|          | 25/3837 [03:26<8:37:33,  8.15s/it]  1%|          | 26/3837 [03:33<8:13:59,  7.78s/it]  1%|          | 27/3837 [03:41<8:22:58,  7.92s/it]  1%|          | 28/3837 [03:48<8:04:42,  7.64s/it]  1%|          | 29/3837 [03:56<8:15:40,  7.81s/it]  1%|          | 30/3837 [04:05<8:23:17,  7.93s/it]  1%|          | 31/3837 [04:13<8:28:58,  8.02s/it]  1%|          | 32/3837 [04:21<8:35:29,  8.13s/it]  1%|          | 33/3837 [04:30<8:37:57,  8.17s/it]  1%|          | 34/3837 [04:36<8:13:49,  7.79s/it]  1%|          | 35/3837 [04:43<7:56:19,  7.52s/it]  1%|          | 36/3837 [04:52<8:09:11,  7.72s/it]  1%|          | 37/3837 [05:00<8:18:49,  7.88s/it]  1%|          | 38/3837 [05:08<8:25:27,  7.98s/it]  1%|          | 39/3837 [05:15<8:05:07,  7.66s/it]  1%|          | 40/3837 [05:23<8:15:33,  7.83s/it]                                                   {'loss': 6.9397, 'grad_norm': 20.382936477661133, 'learning_rate': 6.896551724137932e-06, 'epoch': 0.01}
  1%|          | 40/3837 [05:23<8:15:33,  7.83s/it]  1%|          | 41/3837 [05:30<7:59:27,  7.58s/it]  1%|          | 42/3837 [05:37<7:46:18,  7.37s/it]  1%|          | 43/3837 [05:45<8:03:22,  7.64s/it]  1%|          | 44/3837 [05:54<8:15:28,  7.84s/it]  1%|          | 45/3837 [06:02<8:24:18,  7.98s/it]  1%|          | 46/3837 [06:10<8:29:22,  8.06s/it]  1%|          | 47/3837 [06:18<8:32:18,  8.11s/it]  1%|▏         | 48/3837 [06:27<8:33:07,  8.13s/it]  1%|▏         | 49/3837 [06:35<8:34:43,  8.15s/it]  1%|▏         | 50/3837 [06:42<8:11:53,  7.79s/it]  1%|▏         | 51/3837 [06:49<7:55:51,  7.54s/it]  1%|▏         | 52/3837 [06:56<7:43:16,  7.34s/it]  1%|▏         | 53/3837 [07:04<8:01:45,  7.64s/it]  1%|▏         | 54/3837 [07:11<7:50:22,  7.46s/it]  1%|▏         | 55/3837 [07:19<8:04:30,  7.69s/it]  1%|▏         | 56/3837 [07:27<8:15:06,  7.86s/it]  1%|▏         | 57/3837 [07:36<8:24:54,  8.01s/it]  2%|▏         | 58/3837 [07:45<8:40:44,  8.27s/it]  2%|▏         | 59/3837 [07:53<8:39:40,  8.25s/it]  2%|▏         | 60/3837 [08:00<8:16:12,  7.88s/it]                                                   {'loss': 6.3053, 'grad_norm': 17.0410213470459, 'learning_rate': 1.0344827586206898e-05, 'epoch': 0.02}
  2%|▏         | 60/3837 [08:00<8:16:12,  7.88s/it]  2%|▏         | 61/3837 [08:08<8:22:09,  7.98s/it]  2%|▏         | 62/3837 [08:16<8:26:51,  8.06s/it]  2%|▏         | 63/3837 [08:24<8:29:22,  8.10s/it]  2%|▏         | 64/3837 [08:33<8:32:08,  8.14s/it]  2%|▏         | 65/3837 [08:39<7:48:44,  7.46s/it]  2%|▏         | 66/3837 [08:48<8:27:07,  8.07s/it]  2%|▏         | 67/3837 [08:56<8:30:09,  8.12s/it]  2%|▏         | 68/3837 [09:04<8:30:59,  8.13s/it]  2%|▏         | 69/3837 [09:11<8:08:30,  7.78s/it]  2%|▏         | 70/3837 [09:20<8:17:50,  7.93s/it]  2%|▏         | 71/3837 [09:27<7:59:38,  7.64s/it]  2%|▏         | 72/3837 [09:34<7:51:07,  7.51s/it]  2%|▏         | 73/3837 [09:41<7:41:06,  7.35s/it]  2%|▏         | 74/3837 [09:48<7:32:10,  7.21s/it]  2%|▏         | 75/3837 [09:56<7:50:53,  7.51s/it]  2%|▏         | 76/3837 [10:04<8:03:37,  7.72s/it]  2%|▏         | 77/3837 [10:14<8:37:30,  8.26s/it]  2%|▏         | 78/3837 [10:22<8:37:46,  8.26s/it]  2%|▏         | 79/3837 [10:31<8:52:39,  8.50s/it]  2%|▏         | 80/3837 [10:39<8:47:08,  8.42s/it]                                                   {'loss': 5.9683, 'grad_norm': 15.925130844116211, 'learning_rate': 1.3793103448275863e-05, 'epoch': 0.02}
  2%|▏         | 80/3837 [10:39<8:47:08,  8.42s/it]  2%|▏         | 81/3837 [10:48<8:46:32,  8.41s/it]  2%|▏         | 82/3837 [10:57<9:06:37,  8.73s/it]  2%|▏         | 83/3837 [11:04<8:33:12,  8.20s/it]  2%|▏         | 84/3837 [11:12<8:31:56,  8.18s/it]  2%|▏         | 85/3837 [11:20<8:32:00,  8.19s/it]  2%|▏         | 86/3837 [11:29<8:32:32,  8.20s/it]  2%|▏         | 87/3837 [11:36<8:10:33,  7.85s/it]  2%|▏         | 88/3837 [11:44<8:17:07,  7.96s/it]  2%|▏         | 89/3837 [11:51<7:58:53,  7.67s/it]  2%|▏         | 90/3837 [11:59<8:08:00,  7.81s/it]  2%|▏         | 91/3837 [12:06<7:50:37,  7.54s/it]  2%|▏         | 92/3837 [12:14<8:02:34,  7.73s/it]  2%|▏         | 93/3837 [12:22<8:11:01,  7.87s/it]  2%|▏         | 94/3837 [12:31<8:17:33,  7.98s/it]  2%|▏         | 95/3837 [12:39<8:20:56,  8.03s/it]  3%|▎         | 96/3837 [12:46<8:00:57,  7.71s/it]  3%|▎         | 97/3837 [12:54<8:10:09,  7.86s/it]  3%|▎         | 98/3837 [13:02<8:16:28,  7.97s/it]  3%|▎         | 99/3837 [13:10<8:21:22,  8.05s/it]  3%|▎         | 100/3837 [13:17<7:59:26,  7.70s/it]                                                    {'loss': 6.1233, 'grad_norm': 17.99237060546875, 'learning_rate': 1.7241379310344828e-05, 'epoch': 0.03}
  3%|▎         | 100/3837 [13:17<7:59:26,  7.70s/it]  3%|▎         | 101/3837 [13:25<8:08:52,  7.85s/it]  3%|▎         | 102/3837 [13:32<7:53:55,  7.61s/it]  3%|▎         | 103/3837 [13:42<8:28:18,  8.17s/it]  3%|▎         | 104/3837 [13:49<8:06:12,  7.81s/it]  3%|▎         | 105/3837 [13:56<7:51:12,  7.58s/it]  3%|▎         | 106/3837 [14:03<7:38:35,  7.37s/it]  3%|▎         | 107/3837 [14:11<7:56:03,  7.66s/it]  3%|▎         | 108/3837 [14:18<7:42:50,  7.45s/it]  3%|▎         | 109/3837 [14:26<7:56:35,  7.67s/it]  3%|▎         | 110/3837 [14:35<8:06:18,  7.83s/it]  3%|▎         | 111/3837 [14:41<7:50:29,  7.58s/it]  3%|▎         | 112/3837 [14:50<8:01:46,  7.76s/it]  3%|▎         | 113/3837 [14:58<8:11:53,  7.93s/it]  3%|▎         | 114/3837 [15:06<8:18:35,  8.04s/it]  3%|▎         | 115/3837 [15:14<8:21:20,  8.08s/it]  3%|▎         | 116/3837 [15:23<8:22:48,  8.11s/it]  3%|▎         | 117/3837 [15:31<8:29:32,  8.22s/it]  3%|▎         | 118/3837 [15:39<8:27:42,  8.19s/it]  3%|▎         | 119/3837 [15:46<8:03:24,  7.80s/it]  3%|▎         | 120/3837 [15:54<8:11:24,  7.93s/it]                                                    {'loss': 5.9675, 'grad_norm': 16.948949813842773, 'learning_rate': 1.9999942974384754e-05, 'epoch': 0.03}
  3%|▎         | 120/3837 [15:54<8:11:24,  7.93s/it]  3%|▎         | 121/3837 [16:03<8:17:26,  8.03s/it]  3%|▎         | 122/3837 [16:11<8:20:51,  8.09s/it]  3%|▎         | 123/3837 [16:19<8:14:18,  7.99s/it]  3%|▎         | 124/3837 [16:27<8:19:13,  8.07s/it]  3%|▎         | 125/3837 [16:34<7:57:33,  7.72s/it]  3%|▎         | 126/3837 [16:42<8:07:25,  7.88s/it]  3%|▎         | 127/3837 [16:49<7:50:28,  7.61s/it]  3%|▎         | 128/3837 [16:56<7:39:12,  7.43s/it]  3%|▎         | 129/3837 [17:04<7:54:13,  7.67s/it]  3%|▎         | 130/3837 [17:11<7:40:13,  7.45s/it]  3%|▎         | 131/3837 [17:18<7:31:18,  7.31s/it]  3%|▎         | 132/3837 [17:25<7:25:56,  7.22s/it]  3%|▎         | 133/3837 [17:33<7:44:48,  7.53s/it]  3%|▎         | 134/3837 [17:40<7:34:33,  7.37s/it]  4%|▎         | 135/3837 [17:49<7:49:36,  7.61s/it]  4%|▎         | 136/3837 [17:56<7:36:33,  7.40s/it]  4%|▎         | 137/3837 [18:02<7:28:13,  7.27s/it]  4%|▎         | 138/3837 [18:11<7:45:04,  7.54s/it]  4%|▎         | 139/3837 [18:19<7:58:53,  7.77s/it]  4%|▎         | 140/3837 [18:27<8:08:56,  7.94s/it]                                                    {'loss': 5.7011, 'grad_norm': 13.900690078735352, 'learning_rate': 1.999794714614056e-05, 'epoch': 0.04}
  4%|▎         | 140/3837 [18:27<8:08:56,  7.94s/it]  4%|▎         | 141/3837 [18:34<7:50:10,  7.63s/it]  4%|▎         | 142/3837 [18:42<8:00:03,  7.80s/it]  4%|▎         | 143/3837 [18:49<7:43:57,  7.54s/it]  4%|▍         | 144/3837 [18:58<7:56:31,  7.74s/it]  4%|▍         | 145/3837 [19:06<8:05:57,  7.90s/it]  4%|▍         | 146/3837 [19:14<8:14:00,  8.03s/it]  4%|▍         | 147/3837 [19:22<8:16:50,  8.08s/it]  4%|▍         | 148/3837 [19:29<7:57:29,  7.77s/it]  4%|▍         | 149/3837 [19:38<8:06:42,  7.92s/it]  4%|▍         | 150/3837 [19:45<7:51:16,  7.67s/it]  4%|▍         | 151/3837 [19:53<8:01:14,  7.83s/it]  4%|▍         | 152/3837 [20:01<8:07:22,  7.94s/it]  4%|▍         | 153/3837 [20:09<8:11:29,  8.00s/it]  4%|▍         | 154/3837 [20:17<8:15:10,  8.07s/it]  4%|▍         | 155/3837 [20:26<8:23:35,  8.21s/it]  4%|▍         | 156/3837 [20:34<8:23:18,  8.20s/it]  4%|▍         | 157/3837 [20:41<7:59:27,  7.82s/it]  4%|▍         | 158/3837 [20:48<7:42:00,  7.53s/it]  4%|▍         | 159/3837 [20:57<8:17:51,  8.12s/it]  4%|▍         | 160/3837 [21:06<8:19:37,  8.15s/it]                                                    {'loss': 5.7868, 'grad_norm': 20.193538665771484, 'learning_rate': 1.9993100687484744e-05, 'epoch': 0.04}
  4%|▍         | 160/3837 [21:06<8:19:37,  8.15s/it]  4%|▍         | 161/3837 [21:13<7:57:11,  7.79s/it]  4%|▍         | 162/3837 [21:20<7:40:36,  7.52s/it]  4%|▍         | 163/3837 [21:28<7:52:27,  7.72s/it]  4%|▍         | 164/3837 [21:35<7:37:52,  7.48s/it]  4%|▍         | 165/3837 [21:43<7:51:53,  7.71s/it]  4%|▍         | 166/3837 [21:51<8:00:27,  7.85s/it]  4%|▍         | 167/3837 [21:59<8:07:10,  7.96s/it]  4%|▍         | 168/3837 [22:06<7:48:43,  7.67s/it]  4%|▍         | 169/3837 [22:13<7:35:40,  7.45s/it]  4%|▍         | 170/3837 [22:21<7:48:33,  7.67s/it]  4%|▍         | 171/3837 [22:30<7:58:14,  7.83s/it]  4%|▍         | 172/3837 [22:38<8:04:22,  7.93s/it]  5%|▍         | 173/3837 [22:45<7:47:44,  7.66s/it]  5%|▍         | 174/3837 [22:53<7:57:13,  7.82s/it]  5%|▍         | 175/3837 [23:01<8:05:36,  7.96s/it]  5%|▍         | 176/3837 [23:08<7:46:15,  7.64s/it]  5%|▍         | 177/3837 [23:15<7:33:35,  7.44s/it]  5%|▍         | 178/3837 [23:22<7:24:03,  7.28s/it]  5%|▍         | 179/3837 [23:29<7:18:06,  7.19s/it]  5%|▍         | 180/3837 [23:37<7:37:23,  7.50s/it]                                                    {'loss': 5.6863, 'grad_norm': 23.296497344970703, 'learning_rate': 1.9985404980247233e-05, 'epoch': 0.05}
  5%|▍         | 180/3837 [23:37<7:37:23,  7.50s/it]  5%|▍         | 181/3837 [23:46<7:51:21,  7.74s/it]  5%|▍         | 182/3837 [23:52<7:36:38,  7.50s/it]  5%|▍         | 183/3837 [24:01<7:55:07,  7.80s/it]  5%|▍         | 184/3837 [24:09<8:04:38,  7.96s/it]  5%|▍         | 185/3837 [24:18<8:09:11,  8.04s/it]  5%|▍         | 186/3837 [24:25<7:49:54,  7.72s/it]  5%|▍         | 187/3837 [24:33<7:59:03,  7.87s/it]  5%|▍         | 188/3837 [24:41<8:04:43,  7.97s/it]  5%|▍         | 189/3837 [24:48<7:46:14,  7.67s/it]  5%|▍         | 190/3837 [24:56<7:55:00,  7.81s/it]  5%|▍         | 191/3837 [25:03<7:38:33,  7.55s/it]  5%|▌         | 192/3837 [25:11<7:51:46,  7.77s/it]  5%|▌         | 193/3837 [25:19<7:59:42,  7.90s/it]  5%|▌         | 194/3837 [25:28<8:04:28,  7.98s/it]  5%|▌         | 195/3837 [25:35<7:47:16,  7.70s/it]  5%|▌         | 196/3837 [25:44<8:20:43,  8.25s/it]  5%|▌         | 197/3837 [25:51<7:58:41,  7.89s/it]  5%|▌         | 198/3837 [25:58<7:43:18,  7.64s/it]  5%|▌         | 199/3837 [26:05<7:29:43,  7.42s/it]  5%|▌         | 200/3837 [26:13<7:43:06,  7.64s/it]                                                    {'loss': 5.6261, 'grad_norm': 17.665918350219727, 'learning_rate': 1.997486221864017e-05, 'epoch': 0.05}
  5%|▌         | 200/3837 [26:13<7:43:06,  7.64s/it]  5%|▌         | 201/3837 [26:20<7:30:53,  7.44s/it]  5%|▌         | 202/3837 [26:28<7:37:04,  7.54s/it]  5%|▌         | 203/3837 [26:36<7:48:48,  7.74s/it]  5%|▌         | 204/3837 [26:43<7:34:12,  7.50s/it]  5%|▌         | 205/3837 [26:50<7:23:55,  7.33s/it]  5%|▌         | 206/3837 [26:59<7:42:29,  7.64s/it]  5%|▌         | 207/3837 [27:08<8:16:21,  8.20s/it]  5%|▌         | 208/3837 [27:15<7:55:10,  7.86s/it]  5%|▌         | 209/3837 [27:22<7:39:37,  7.60s/it]  5%|▌         | 210/3837 [27:30<7:51:08,  7.79s/it]  5%|▌         | 211/3837 [27:37<7:36:16,  7.55s/it]  6%|▌         | 212/3837 [27:44<7:24:13,  7.35s/it]  6%|▌         | 213/3837 [27:51<7:16:32,  7.23s/it]  6%|▌         | 214/3837 [28:00<7:36:47,  7.56s/it]  6%|▌         | 215/3837 [28:08<7:48:36,  7.76s/it]  6%|▌         | 216/3837 [28:15<7:33:10,  7.51s/it]  6%|▌         | 217/3837 [28:22<7:22:27,  7.33s/it]  6%|▌         | 218/3837 [28:30<7:39:35,  7.62s/it]  6%|▌         | 219/3837 [28:37<7:27:55,  7.43s/it]  6%|▌         | 220/3837 [28:45<7:42:12,  7.67s/it]                                                    {'loss': 5.5102, 'grad_norm': 20.64336395263672, 'learning_rate': 1.996147540863232e-05, 'epoch': 0.06}
  6%|▌         | 220/3837 [28:45<7:42:12,  7.67s/it]  6%|▌         | 221/3837 [28:53<7:54:09,  7.87s/it]  6%|▌         | 222/3837 [29:00<7:37:13,  7.59s/it]  6%|▌         | 223/3837 [29:09<7:50:04,  7.80s/it]  6%|▌         | 224/3837 [29:17<7:57:14,  7.93s/it]  6%|▌         | 225/3837 [29:25<8:01:14,  7.99s/it]  6%|▌         | 226/3837 [29:32<7:41:15,  7.66s/it]  6%|▌         | 227/3837 [29:39<7:29:21,  7.47s/it]  6%|▌         | 228/3837 [29:47<7:42:11,  7.68s/it]  6%|▌         | 229/3837 [29:54<7:28:36,  7.46s/it]  6%|▌         | 230/3837 [30:02<7:45:05,  7.74s/it]  6%|▌         | 231/3837 [30:11<7:54:40,  7.90s/it]  6%|▌         | 232/3837 [30:19<8:01:27,  8.01s/it]  6%|▌         | 233/3837 [30:27<8:04:40,  8.07s/it]  6%|▌         | 234/3837 [30:34<7:43:14,  7.71s/it]  6%|▌         | 235/3837 [30:41<7:29:02,  7.48s/it]  6%|▌         | 236/3837 [30:49<7:42:55,  7.71s/it]  6%|▌         | 237/3837 [30:59<8:14:52,  8.25s/it]  6%|▌         | 238/3837 [31:06<7:51:48,  7.87s/it]  6%|▌         | 239/3837 [31:15<8:20:48,  8.35s/it]  6%|▋         | 240/3837 [31:22<7:55:03,  7.92s/it]                                                    {'loss': 5.6464, 'grad_norm': 13.857915878295898, 'learning_rate': 1.9945248367092002e-05, 'epoch': 0.06}
  6%|▋         | 240/3837 [31:22<7:55:03,  7.92s/it]  6%|▋         | 241/3837 [31:30<8:00:25,  8.02s/it]  6%|▋         | 242/3837 [31:38<7:45:55,  7.78s/it]  6%|▋         | 243/3837 [31:46<7:53:53,  7.91s/it]  6%|▋         | 244/3837 [31:54<7:58:50,  8.00s/it]  6%|▋         | 245/3837 [32:02<8:02:47,  8.06s/it]  6%|▋         | 246/3837 [32:12<8:28:11,  8.49s/it]  6%|▋         | 247/3837 [32:20<8:23:00,  8.41s/it]  6%|▋         | 248/3837 [32:27<8:04:50,  8.11s/it]  6%|▋         | 249/3837 [32:36<8:06:05,  8.13s/it]  7%|▋         | 250/3837 [32:44<8:08:45,  8.18s/it]  7%|▋         | 251/3837 [32:51<7:47:10,  7.82s/it]  7%|▋         | 252/3837 [32:58<7:32:07,  7.57s/it]  7%|▋         | 253/3837 [33:05<7:21:00,  7.38s/it]  7%|▋         | 254/3837 [33:12<7:14:10,  7.27s/it]  7%|▋         | 255/3837 [33:20<7:32:42,  7.58s/it]  7%|▋         | 256/3837 [33:28<7:43:55,  7.77s/it]  7%|▋         | 257/3837 [33:35<7:29:47,  7.54s/it]  7%|▋         | 258/3837 [33:44<7:42:19,  7.75s/it]  7%|▋         | 259/3837 [33:53<8:13:41,  8.28s/it]  7%|▋         | 260/3837 [34:00<7:50:30,  7.89s/it]                                                    {'loss': 5.5896, 'grad_norm': 14.742045402526855, 'learning_rate': 1.992618572069882e-05, 'epoch': 0.07}
  7%|▋         | 260/3837 [34:00<7:50:30,  7.89s/it]  7%|▋         | 261/3837 [34:07<7:34:25,  7.62s/it]  7%|▋         | 262/3837 [34:15<7:44:52,  7.80s/it]  7%|▋         | 263/3837 [34:22<7:34:04,  7.62s/it]  7%|▋         | 264/3837 [34:32<8:07:11,  8.18s/it]  7%|▋         | 265/3837 [34:39<7:45:31,  7.82s/it]  7%|▋         | 266/3837 [34:47<7:52:56,  7.95s/it]  7%|▋         | 267/3837 [34:57<8:20:19,  8.41s/it]  7%|▋         | 268/3837 [35:04<7:55:40,  8.00s/it]  7%|▋         | 269/3837 [35:12<7:58:41,  8.05s/it]  7%|▋         | 270/3837 [35:20<8:00:40,  8.09s/it]  7%|▋         | 271/3837 [35:28<8:04:00,  8.14s/it]  7%|▋         | 272/3837 [35:37<8:06:44,  8.19s/it]  7%|▋         | 273/3837 [35:44<7:44:12,  7.81s/it]  7%|▋         | 274/3837 [35:52<7:49:44,  7.91s/it]  7%|▋         | 275/3837 [36:00<7:53:59,  7.98s/it]  7%|▋         | 276/3837 [36:07<7:35:33,  7.68s/it]  7%|▋         | 277/3837 [36:15<7:44:55,  7.84s/it]  7%|▋         | 278/3837 [36:23<7:51:31,  7.95s/it]  7%|▋         | 279/3837 [36:30<7:32:48,  7.64s/it]  7%|▋         | 280/3837 [36:37<7:21:33,  7.45s/it]                                                    {'loss': 5.573, 'grad_norm': 17.0246639251709, 'learning_rate': 1.9904292904624486e-05, 'epoch': 0.07}
  7%|▋         | 280/3837 [36:37<7:21:33,  7.45s/it]  7%|▋         | 281/3837 [36:45<7:35:18,  7.68s/it]  7%|▋         | 282/3837 [36:54<7:45:12,  7.85s/it]  7%|▋         | 283/3837 [37:02<7:51:39,  7.96s/it]  7%|▋         | 284/3837 [37:10<7:56:00,  8.04s/it]  7%|▋         | 285/3837 [37:17<7:36:02,  7.70s/it]  7%|▋         | 286/3837 [37:25<7:44:58,  7.86s/it]  7%|▋         | 287/3837 [37:32<7:28:37,  7.58s/it]  8%|▊         | 288/3837 [37:39<7:16:35,  7.38s/it]  8%|▊         | 289/3837 [37:46<7:08:23,  7.24s/it]  8%|▊         | 290/3837 [37:54<7:28:08,  7.58s/it]  8%|▊         | 291/3837 [38:04<8:02:03,  8.16s/it]  8%|▊         | 292/3837 [38:11<7:44:23,  7.86s/it]  8%|▊         | 293/3837 [38:18<7:29:02,  7.60s/it]  8%|▊         | 294/3837 [38:26<7:40:07,  7.79s/it]  8%|▊         | 295/3837 [38:34<7:47:36,  7.92s/it]  8%|▊         | 296/3837 [38:41<7:30:00,  7.63s/it]  8%|▊         | 297/3837 [38:50<7:46:01,  7.90s/it]  8%|▊         | 298/3837 [38:57<7:30:06,  7.63s/it]  8%|▊         | 299/3837 [39:05<7:40:12,  7.80s/it]  8%|▊         | 300/3837 [39:13<7:47:14,  7.93s/it]                                                    {'loss': 5.5143, 'grad_norm': 17.585227966308594, 'learning_rate': 1.9879576160983144e-05, 'epoch': 0.08}
  8%|▊         | 300/3837 [39:13<7:47:14,  7.93s/it]  8%|▊         | 301/3837 [39:22<7:51:33,  8.00s/it]  8%|▊         | 302/3837 [39:29<7:33:26,  7.70s/it]  8%|▊         | 303/3837 [39:35<7:20:00,  7.47s/it]  8%|▊         | 304/3837 [39:42<7:11:32,  7.33s/it]  8%|▊         | 305/3837 [39:51<7:26:23,  7.58s/it]  8%|▊         | 306/3837 [39:59<7:36:12,  7.75s/it]  8%|▊         | 307/3837 [40:07<7:45:56,  7.92s/it]  8%|▊         | 308/3837 [40:15<7:51:30,  8.02s/it]  8%|▊         | 309/3837 [40:24<7:54:58,  8.08s/it]  8%|▊         | 310/3837 [40:30<7:33:58,  7.72s/it]  8%|▊         | 311/3837 [40:39<7:42:16,  7.87s/it]  8%|▊         | 312/3837 [40:47<7:48:05,  7.97s/it]  8%|▊         | 313/3837 [40:55<7:51:25,  8.03s/it]  8%|▊         | 314/3837 [41:03<7:55:18,  8.10s/it]  8%|▊         | 315/3837 [41:12<7:58:02,  8.14s/it]  8%|▊         | 316/3837 [41:19<7:39:05,  7.82s/it]  8%|▊         | 317/3837 [41:26<7:24:48,  7.58s/it]  8%|▊         | 318/3837 [41:34<7:36:45,  7.79s/it]  8%|▊         | 319/3837 [41:42<7:45:37,  7.94s/it]  8%|▊         | 320/3837 [41:50<7:50:46,  8.03s/it]                                                    {'loss': 5.3403, 'grad_norm': 11.771653175354004, 'learning_rate': 1.9852042537051615e-05, 'epoch': 0.08}
  8%|▊         | 320/3837 [41:50<7:50:46,  8.03s/it]  8%|▊         | 321/3837 [41:58<7:40:34,  7.86s/it]  8%|▊         | 322/3837 [42:07<8:09:26,  8.35s/it]  8%|▊         | 323/3837 [42:14<7:44:17,  7.93s/it]  8%|▊         | 324/3837 [42:21<7:28:46,  7.66s/it]  8%|▊         | 325/3837 [42:28<7:17:06,  7.47s/it]  8%|▊         | 326/3837 [42:37<7:30:35,  7.70s/it]  9%|▊         | 327/3837 [42:45<7:39:46,  7.86s/it]  9%|▊         | 328/3837 [42:53<7:44:55,  7.95s/it]  9%|▊         | 329/3837 [43:00<7:26:33,  7.64s/it]  9%|▊         | 330/3837 [43:08<7:36:09,  7.80s/it]  9%|▊         | 331/3837 [43:16<7:44:37,  7.95s/it]  9%|▊         | 332/3837 [43:25<7:50:31,  8.05s/it]  9%|▊         | 333/3837 [43:33<7:53:01,  8.10s/it]  9%|▊         | 334/3837 [43:39<7:09:30,  7.36s/it]  9%|▊         | 335/3837 [43:47<7:23:26,  7.60s/it]  9%|▉         | 336/3837 [43:55<7:34:40,  7.79s/it]  9%|▉         | 337/3837 [44:03<7:41:38,  7.91s/it]  9%|▉         | 338/3837 [44:10<7:28:24,  7.69s/it]  9%|▉         | 339/3837 [44:19<7:40:50,  7.90s/it]  9%|▉         | 340/3837 [44:26<7:25:26,  7.64s/it]                                                    {'loss': 5.4047, 'grad_norm': 11.34125804901123, 'learning_rate': 1.9821699883260036e-05, 'epoch': 0.09}
  9%|▉         | 340/3837 [44:26<7:25:26,  7.64s/it]  9%|▉         | 341/3837 [44:34<7:34:23,  7.80s/it]  9%|▉         | 342/3837 [44:41<7:19:14,  7.54s/it]  9%|▉         | 343/3837 [44:49<7:31:41,  7.76s/it]  9%|▉         | 344/3837 [44:57<7:40:37,  7.91s/it]  9%|▉         | 345/3837 [45:06<7:46:42,  8.02s/it]  9%|▉         | 346/3837 [45:14<7:49:46,  8.07s/it]  9%|▉         | 347/3837 [45:21<7:31:14,  7.76s/it]  9%|▉         | 348/3837 [45:30<8:01:32,  8.28s/it]  9%|▉         | 349/3837 [45:37<7:37:49,  7.88s/it]  9%|▉         | 350/3837 [45:45<7:43:03,  7.97s/it]  9%|▉         | 351/3837 [45:52<7:25:25,  7.67s/it]  9%|▉         | 352/3837 [46:01<7:34:24,  7.82s/it]  9%|▉         | 353/3837 [46:08<7:18:15,  7.55s/it]  9%|▉         | 354/3837 [46:16<7:33:48,  7.82s/it]  9%|▉         | 355/3837 [46:26<8:04:30,  8.35s/it]  9%|▉         | 356/3837 [46:33<7:40:49,  7.94s/it]  9%|▉         | 357/3837 [46:41<7:45:10,  8.02s/it]  9%|▉         | 358/3837 [46:49<7:48:57,  8.09s/it]  9%|▉         | 359/3837 [46:59<8:13:32,  8.51s/it]  9%|▉         | 360/3837 [47:05<7:45:26,  8.03s/it]                                                    {'loss': 5.3918, 'grad_norm': 14.327924728393555, 'learning_rate': 1.978855685095358e-05, 'epoch': 0.09}
  9%|▉         | 360/3837 [47:05<7:45:26,  8.03s/it]  9%|▉         | 361/3837 [47:14<7:47:52,  8.08s/it]  9%|▉         | 362/3837 [47:21<7:28:11,  7.74s/it]  9%|▉         | 363/3837 [47:29<7:39:02,  7.93s/it]  9%|▉         | 364/3837 [47:36<7:22:56,  7.65s/it] 10%|▉         | 365/3837 [47:44<7:33:50,  7.84s/it] 10%|▉         | 366/3837 [47:52<7:38:32,  7.93s/it] 10%|▉         | 367/3837 [47:59<7:22:06,  7.64s/it] 10%|▉         | 368/3837 [48:08<7:32:40,  7.83s/it] 10%|▉         | 369/3837 [48:16<7:38:28,  7.93s/it] 10%|▉         | 370/3837 [48:24<7:43:47,  8.03s/it] 10%|▉         | 371/3837 [48:31<7:24:40,  7.70s/it] 10%|▉         | 372/3837 [48:38<7:10:17,  7.45s/it] 10%|▉         | 373/3837 [48:45<7:00:23,  7.28s/it] 10%|▉         | 374/3837 [48:53<7:17:00,  7.57s/it] 10%|▉         | 375/3837 [49:00<7:05:28,  7.37s/it] 10%|▉         | 376/3837 [49:08<7:19:19,  7.62s/it] 10%|▉         | 377/3837 [49:16<7:29:08,  7.79s/it] 10%|▉         | 378/3837 [49:23<7:15:33,  7.56s/it] 10%|▉         | 379/3837 [49:31<7:26:49,  7.75s/it] 10%|▉         | 380/3837 [49:40<7:34:37,  7.89s/it]                                                    {'loss': 5.3225, 'grad_norm': 14.889872550964355, 'learning_rate': 1.975262288992573e-05, 'epoch': 0.1}
 10%|▉         | 380/3837 [49:40<7:34:37,  7.89s/it] 10%|▉         | 381/3837 [49:48<7:40:43,  8.00s/it] 10%|▉         | 382/3837 [49:56<7:45:11,  8.08s/it] 10%|▉         | 383/3837 [50:04<7:47:43,  8.13s/it] 10%|█         | 384/3837 [50:13<7:49:46,  8.16s/it] 10%|█         | 385/3837 [50:20<7:28:14,  7.79s/it] 10%|█         | 386/3837 [50:28<7:35:01,  7.91s/it] 10%|█         | 387/3837 [50:36<7:40:18,  8.01s/it] 10%|█         | 388/3837 [50:43<7:21:14,  7.68s/it] 10%|█         | 389/3837 [50:51<7:30:24,  7.84s/it] 10%|█         | 390/3837 [50:59<7:36:00,  7.94s/it] 10%|█         | 391/3837 [51:08<7:40:57,  8.03s/it] 10%|█         | 392/3837 [51:16<7:43:58,  8.08s/it] 10%|█         | 393/3837 [51:24<7:45:30,  8.11s/it] 10%|█         | 394/3837 [51:32<7:47:42,  8.15s/it] 10%|█         | 395/3837 [51:40<7:48:42,  8.17s/it] 10%|█         | 396/3837 [51:46<7:05:20,  7.42s/it] 10%|█         | 397/3837 [51:54<7:18:47,  7.65s/it] 10%|█         | 398/3837 [52:03<7:29:30,  7.84s/it] 10%|█         | 399/3837 [52:11<7:36:42,  7.97s/it] 10%|█         | 400/3837 [52:19<7:41:48,  8.06s/it]                                                    {'loss': 5.2491, 'grad_norm': 12.738176345825195, 'learning_rate': 1.9713908245723956e-05, 'epoch': 0.1}
 10%|█         | 400/3837 [52:19<7:41:48,  8.06s/it] 10%|█         | 401/3837 [52:27<7:44:53,  8.12s/it] 10%|█         | 402/3837 [52:34<7:27:24,  7.82s/it] 11%|█         | 403/3837 [52:42<7:26:34,  7.80s/it] 11%|█         | 404/3837 [52:50<7:33:38,  7.93s/it] 11%|█         | 405/3837 [52:59<7:38:59,  8.02s/it] 11%|█         | 406/3837 [53:06<7:25:11,  7.79s/it] 11%|█         | 407/3837 [53:14<7:32:07,  7.91s/it] 11%|█         | 408/3837 [53:21<7:14:02,  7.59s/it] 11%|█         | 409/3837 [53:28<7:03:03,  7.40s/it] 11%|█         | 410/3837 [53:36<7:18:09,  7.67s/it] 11%|█         | 411/3837 [53:43<7:05:42,  7.46s/it] 11%|█         | 412/3837 [53:50<6:56:30,  7.30s/it] 11%|█         | 413/3837 [53:58<7:12:08,  7.57s/it] 11%|█         | 414/3837 [54:05<7:00:37,  7.37s/it] 11%|█         | 415/3837 [54:15<7:37:32,  8.02s/it] 11%|█         | 416/3837 [54:23<7:40:48,  8.08s/it] 11%|█         | 417/3837 [54:30<7:21:19,  7.74s/it] 11%|█         | 418/3837 [54:38<7:29:46,  7.89s/it] 11%|█         | 419/3837 [54:45<7:13:16,  7.61s/it] 11%|█         | 420/3837 [54:53<7:23:56,  7.80s/it]                                                    {'loss': 5.2325, 'grad_norm': 16.167095184326172, 'learning_rate': 1.9672423956728496e-05, 'epoch': 0.11}
 11%|█         | 420/3837 [54:53<7:23:56,  7.80s/it] 11%|█         | 421/3837 [55:00<7:10:04,  7.55s/it] 11%|█         | 422/3837 [55:08<7:19:56,  7.73s/it] 11%|█         | 423/3837 [55:17<7:27:22,  7.86s/it] 11%|█         | 424/3837 [55:25<7:33:19,  7.97s/it] 11%|█         | 425/3837 [55:32<7:16:49,  7.68s/it] 11%|█         | 426/3837 [55:40<7:24:49,  7.82s/it] 11%|█         | 427/3837 [55:48<7:31:23,  7.94s/it] 11%|█         | 428/3837 [55:55<7:13:56,  7.64s/it] 11%|█         | 429/3837 [56:03<7:23:37,  7.81s/it] 11%|█         | 430/3837 [56:10<7:08:12,  7.54s/it] 11%|█         | 431/3837 [56:20<7:41:51,  8.14s/it] 11%|█▏        | 432/3837 [56:28<7:42:51,  8.16s/it] 11%|█▏        | 433/3837 [56:35<7:21:31,  7.78s/it] 11%|█▏        | 434/3837 [56:43<7:28:46,  7.91s/it] 11%|█▏        | 435/3837 [56:51<7:33:49,  8.00s/it] 11%|█▏        | 436/3837 [57:00<7:37:39,  8.07s/it] 11%|█▏        | 437/3837 [57:09<8:01:52,  8.50s/it] 11%|█▏        | 438/3837 [57:16<7:36:14,  8.05s/it] 11%|█▏        | 439/3837 [57:23<7:18:18,  7.74s/it] 11%|█▏        | 440/3837 [57:30<7:04:03,  7.49s/it]                                                    {'loss': 5.3107, 'grad_norm': 12.354657173156738, 'learning_rate': 1.962818185100505e-05, 'epoch': 0.11}
 11%|█▏        | 440/3837 [57:30<7:04:03,  7.49s/it] 11%|█▏        | 441/3837 [57:37<6:55:22,  7.34s/it] 12%|█▏        | 442/3837 [57:45<7:10:17,  7.60s/it] 12%|█▏        | 443/3837 [57:52<6:59:08,  7.41s/it] 12%|█▏        | 444/3837 [58:00<7:13:04,  7.66s/it] 12%|█▏        | 445/3837 [58:07<7:02:07,  7.47s/it] 12%|█▏        | 446/3837 [58:16<7:19:27,  7.78s/it] 12%|█▏        | 447/3837 [58:24<7:27:32,  7.92s/it] 12%|█▏        | 448/3837 [58:32<7:33:01,  8.02s/it] 12%|█▏        | 449/3837 [58:39<7:14:34,  7.70s/it] 12%|█▏        | 450/3837 [58:48<7:23:12,  7.85s/it] 12%|█▏        | 451/3837 [58:56<7:29:33,  7.97s/it] 12%|█▏        | 452/3837 [59:04<7:34:35,  8.06s/it] 12%|█▏        | 453/3837 [59:12<7:38:14,  8.12s/it] 12%|█▏        | 454/3837 [59:21<7:39:50,  8.16s/it] 12%|█▏        | 455/3837 [59:28<7:20:25,  7.81s/it] 12%|█▏        | 456/3837 [59:36<7:26:57,  7.93s/it] 12%|█▏        | 457/3837 [59:44<7:31:25,  8.01s/it] 12%|█▏        | 458/3837 [59:51<7:13:37,  7.70s/it] 12%|█▏        | 459/3837 [59:59<7:22:10,  7.85s/it] 12%|█▏        | 460/3837 [1:00:06<7:05:53,  7.57s/it]                                                      {'loss': 5.2751, 'grad_norm': 13.358938217163086, 'learning_rate': 1.9581194542932383e-05, 'epoch': 0.12}
 12%|█▏        | 460/3837 [1:00:06<7:05:53,  7.57s/it] 12%|█▏        | 461/3837 [1:00:14<7:17:37,  7.78s/it] 12%|█▏        | 462/3837 [1:00:21<7:02:28,  7.51s/it] 12%|█▏        | 463/3837 [1:00:30<7:14:12,  7.72s/it] 12%|█▏        | 464/3837 [1:00:37<7:15:35,  7.75s/it] 12%|█▏        | 465/3837 [1:00:46<7:22:47,  7.88s/it] 12%|█▏        | 466/3837 [1:00:54<7:28:40,  7.99s/it] 12%|█▏        | 467/3837 [1:01:02<7:32:30,  8.06s/it] 12%|█▏        | 468/3837 [1:01:09<7:13:28,  7.72s/it] 12%|█▏        | 469/3837 [1:01:16<6:59:57,  7.48s/it] 12%|█▏        | 470/3837 [1:01:23<6:50:00,  7.31s/it] 12%|█▏        | 471/3837 [1:01:30<6:46:57,  7.25s/it] 12%|█▏        | 472/3837 [1:01:38<7:02:33,  7.53s/it] 12%|█▏        | 473/3837 [1:01:46<7:13:59,  7.74s/it] 12%|█▏        | 474/3837 [1:01:53<7:00:04,  7.49s/it] 12%|█▏        | 475/3837 [1:02:00<6:50:31,  7.33s/it] 12%|█▏        | 476/3837 [1:02:08<7:07:05,  7.62s/it] 12%|█▏        | 477/3837 [1:02:17<7:18:36,  7.83s/it] 12%|█▏        | 478/3837 [1:02:24<7:03:25,  7.56s/it] 12%|█▏        | 479/3837 [1:02:32<7:14:59,  7.77s/it] 13%|█▎        | 480/3837 [1:02:40<7:22:30,  7.91s/it]                                                      {'loss': 5.1295, 'grad_norm': 12.796502113342285, 'learning_rate': 1.953147542960565e-05, 'epoch': 0.13}
 13%|█▎        | 480/3837 [1:02:40<7:22:30,  7.91s/it] 13%|█▎        | 481/3837 [1:02:47<7:07:09,  7.64s/it] 13%|█▎        | 482/3837 [1:02:55<7:17:10,  7.82s/it] 13%|█▎        | 483/3837 [1:03:04<7:24:13,  7.95s/it] 13%|█▎        | 484/3837 [1:03:12<7:28:31,  8.03s/it] 13%|█▎        | 485/3837 [1:03:19<7:11:26,  7.72s/it] 13%|█▎        | 486/3837 [1:03:27<7:19:51,  7.88s/it] 13%|█▎        | 487/3837 [1:03:35<7:25:30,  7.98s/it] 13%|█▎        | 488/3837 [1:03:44<7:32:10,  8.10s/it] 13%|█▎        | 489/3837 [1:03:52<7:33:54,  8.13s/it] 13%|█▎        | 490/3837 [1:04:00<7:35:52,  8.17s/it] 13%|█▎        | 491/3837 [1:04:08<7:35:53,  8.17s/it] 13%|█▎        | 492/3837 [1:04:17<7:37:10,  8.20s/it] 13%|█▎        | 493/3837 [1:04:24<7:14:59,  7.80s/it] 13%|█▎        | 494/3837 [1:04:32<7:21:42,  7.93s/it] 13%|█▎        | 495/3837 [1:04:41<7:47:22,  8.39s/it] 13%|█▎        | 496/3837 [1:04:50<7:45:49,  8.37s/it] 13%|█▎        | 497/3837 [1:04:56<7:21:54,  7.94s/it] 13%|█▎        | 498/3837 [1:05:03<7:05:07,  7.64s/it] 13%|█▎        | 499/3837 [1:05:12<7:14:32,  7.81s/it] 13%|█▎        | 500/3837 [1:05:20<7:21:48,  7.94s/it]                                                      {'loss': 5.1958, 'grad_norm': 10.437331199645996, 'learning_rate': 1.9479038687016628e-05, 'epoch': 0.13}
 13%|█▎        | 500/3837 [1:05:20<7:21:48,  7.94s/it] 13%|█▎        | 501/3837 [1:05:29<7:47:13,  8.40s/it] 13%|█▎        | 502/3837 [1:05:38<7:44:25,  8.36s/it] 13%|█▎        | 503/3837 [1:05:46<7:42:12,  8.32s/it] 13%|█▎        | 504/3837 [1:05:53<7:19:32,  7.91s/it] 13%|█▎        | 505/3837 [1:06:00<7:03:24,  7.62s/it] 13%|█▎        | 506/3837 [1:06:07<6:50:52,  7.40s/it] 13%|█▎        | 507/3837 [1:06:15<7:04:31,  7.65s/it] 13%|█▎        | 508/3837 [1:06:23<7:13:27,  7.81s/it] 13%|█▎        | 509/3837 [1:06:31<7:20:46,  7.95s/it] 13%|█▎        | 510/3837 [1:06:39<7:24:23,  8.01s/it] 13%|█▎        | 511/3837 [1:06:46<7:06:12,  7.69s/it] 13%|█▎        | 512/3837 [1:06:55<7:13:44,  7.83s/it] 13%|█▎        | 513/3837 [1:07:03<7:20:01,  7.94s/it] 13%|█▎        | 514/3837 [1:07:10<7:04:30,  7.66s/it] 13%|█▎        | 515/3837 [1:07:17<6:52:39,  7.45s/it] 13%|█▎        | 516/3837 [1:07:24<6:45:51,  7.33s/it] 13%|█▎        | 517/3837 [1:07:32<7:02:01,  7.63s/it] 14%|█▎        | 518/3837 [1:07:40<7:12:32,  7.82s/it] 14%|█▎        | 519/3837 [1:07:49<7:18:49,  7.94s/it] 14%|█▎        | 520/3837 [1:07:57<7:23:35,  8.02s/it]                                                      {'loss': 5.3157, 'grad_norm': 12.927855491638184, 'learning_rate': 1.9423899266011818e-05, 'epoch': 0.14}
 14%|█▎        | 520/3837 [1:07:57<7:23:35,  8.02s/it] 14%|█▎        | 521/3837 [1:08:05<7:26:05,  8.07s/it] 14%|█▎        | 522/3837 [1:08:13<7:28:23,  8.12s/it] 14%|█▎        | 523/3837 [1:08:20<7:09:56,  7.78s/it] 14%|█▎        | 524/3837 [1:08:28<7:16:06,  7.90s/it] 14%|█▎        | 525/3837 [1:08:37<7:21:52,  8.01s/it] 14%|█▎        | 526/3837 [1:08:44<7:05:03,  7.70s/it] 14%|█▎        | 527/3837 [1:08:52<7:13:15,  7.85s/it] 14%|█▍        | 528/3837 [1:09:00<7:18:32,  7.95s/it] 14%|█▍        | 529/3837 [1:09:08<7:24:26,  8.06s/it] 14%|█▍        | 530/3837 [1:09:15<7:05:54,  7.73s/it] 14%|█▍        | 531/3837 [1:09:24<7:14:29,  7.89s/it] 14%|█▍        | 532/3837 [1:09:32<7:19:39,  7.98s/it] 14%|█▍        | 533/3837 [1:09:40<7:25:52,  8.10s/it] 14%|█▍        | 534/3837 [1:09:47<7:06:51,  7.75s/it] 14%|█▍        | 535/3837 [1:09:54<6:54:00,  7.52s/it] 14%|█▍        | 536/3837 [1:10:02<7:05:21,  7.73s/it] 14%|█▍        | 537/3837 [1:10:11<7:13:47,  7.89s/it] 14%|█▍        | 538/3837 [1:10:16<6:36:11,  7.21s/it] 14%|█▍        | 539/3837 [1:10:24<6:52:53,  7.51s/it] 14%|█▍        | 540/3837 [1:10:33<7:04:59,  7.73s/it]                                                      {'loss': 5.3037, 'grad_norm': 15.244512557983398, 'learning_rate': 1.9366072888029634e-05, 'epoch': 0.14}
 14%|█▍        | 540/3837 [1:10:33<7:04:59,  7.73s/it] 14%|█▍        | 541/3837 [1:10:41<7:17:32,  7.96s/it] 14%|█▍        | 542/3837 [1:10:51<7:43:59,  8.45s/it] 14%|█▍        | 543/3837 [1:10:58<7:18:11,  7.98s/it] 14%|█▍        | 544/3837 [1:11:05<7:01:09,  7.67s/it] 14%|█▍        | 545/3837 [1:11:10<6:28:06,  7.07s/it] 14%|█▍        | 546/3837 [1:11:17<6:26:26,  7.05s/it] 14%|█▍        | 547/3837 [1:11:24<6:25:47,  7.04s/it] 14%|█▍        | 548/3837 [1:11:31<6:23:56,  7.00s/it] 14%|█▍        | 549/3837 [1:11:38<6:23:03,  6.99s/it] 14%|█▍        | 550/3837 [1:11:46<6:43:52,  7.37s/it] 14%|█▍        | 551/3837 [1:11:55<6:57:30,  7.62s/it] 14%|█▍        | 552/3837 [1:12:03<7:07:41,  7.81s/it] 14%|█▍        | 553/3837 [1:12:10<6:52:50,  7.54s/it] 14%|█▍        | 554/3837 [1:12:18<7:04:01,  7.75s/it] 14%|█▍        | 555/3837 [1:12:26<7:10:46,  7.88s/it] 14%|█▍        | 556/3837 [1:12:34<7:15:50,  7.97s/it] 15%|█▍        | 557/3837 [1:12:43<7:20:25,  8.06s/it] 15%|█▍        | 558/3837 [1:12:50<7:02:30,  7.73s/it] 15%|█▍        | 559/3837 [1:12:57<6:51:19,  7.53s/it] 15%|█▍        | 560/3837 [1:13:05<7:02:50,  7.74s/it]                                                      {'loss': 5.135, 'grad_norm': 11.037443161010742, 'learning_rate': 1.9305576040617904e-05, 'epoch': 0.15}
 15%|█▍        | 560/3837 [1:13:05<7:02:50,  7.74s/it] 15%|█▍        | 561/3837 [1:13:13<7:11:48,  7.91s/it] 15%|█▍        | 562/3837 [1:13:21<7:16:30,  8.00s/it] 15%|█▍        | 563/3837 [1:13:31<7:40:43,  8.44s/it] 15%|█▍        | 564/3837 [1:13:38<7:16:16,  8.00s/it] 15%|█▍        | 565/3837 [1:13:46<7:18:54,  8.05s/it] 15%|█▍        | 566/3837 [1:13:53<7:00:29,  7.71s/it] 15%|█▍        | 567/3837 [1:14:01<7:07:40,  7.85s/it] 15%|█▍        | 568/3837 [1:14:09<7:13:24,  7.95s/it] 15%|█▍        | 569/3837 [1:14:17<7:17:24,  8.03s/it] 15%|█▍        | 570/3837 [1:14:26<7:20:28,  8.09s/it] 15%|█▍        | 571/3837 [1:14:34<7:22:47,  8.13s/it] 15%|█▍        | 572/3837 [1:14:42<7:25:25,  8.19s/it] 15%|█▍        | 573/3837 [1:14:50<7:25:30,  8.19s/it] 15%|█▍        | 574/3837 [1:14:59<7:25:58,  8.20s/it] 15%|█▍        | 575/3837 [1:15:07<7:26:47,  8.22s/it] 15%|█▌        | 576/3837 [1:15:14<7:07:39,  7.87s/it] 15%|█▌        | 577/3837 [1:15:22<7:13:34,  7.98s/it] 15%|█▌        | 578/3837 [1:15:30<7:17:06,  8.05s/it] 15%|█▌        | 579/3837 [1:15:40<7:39:43,  8.47s/it] 15%|█▌        | 580/3837 [1:15:48<7:34:30,  8.37s/it]                                                      {'loss': 5.1379, 'grad_norm': 12.093936920166016, 'learning_rate': 1.9242425972732886e-05, 'epoch': 0.15}
 15%|█▌        | 580/3837 [1:15:48<7:34:30,  8.37s/it] 15%|█▌        | 581/3837 [1:15:56<7:31:42,  8.32s/it] 15%|█▌        | 582/3837 [1:16:03<7:08:13,  7.89s/it] 15%|█▌        | 583/3837 [1:16:11<7:13:00,  7.98s/it] 15%|█▌        | 584/3837 [1:16:20<7:16:13,  8.05s/it] 15%|█▌        | 585/3837 [1:16:26<6:57:38,  7.71s/it] 15%|█▌        | 586/3837 [1:16:33<6:45:59,  7.49s/it] 15%|█▌        | 587/3837 [1:16:42<6:57:40,  7.71s/it] 15%|█▌        | 588/3837 [1:16:50<7:05:37,  7.86s/it] 15%|█▌        | 589/3837 [1:16:58<7:12:30,  7.99s/it] 15%|█▌        | 590/3837 [1:17:06<7:11:51,  7.98s/it] 15%|█▌        | 591/3837 [1:17:13<6:54:26,  7.66s/it] 15%|█▌        | 592/3837 [1:17:21<7:03:00,  7.82s/it] 15%|█▌        | 593/3837 [1:17:29<7:04:29,  7.85s/it] 15%|█▌        | 594/3837 [1:17:37<7:11:55,  7.99s/it] 16%|█▌        | 595/3837 [1:17:46<7:14:58,  8.05s/it] 16%|█▌        | 596/3837 [1:17:53<6:56:08,  7.70s/it] 16%|█▌        | 597/3837 [1:18:01<7:03:51,  7.85s/it] 16%|█▌        | 598/3837 [1:18:08<6:48:23,  7.57s/it] 16%|█▌        | 599/3837 [1:18:15<6:38:48,  7.39s/it] 16%|█▌        | 600/3837 [1:18:23<6:51:42,  7.63s/it]                                                      {'loss': 5.0741, 'grad_norm': 14.098821640014648, 'learning_rate': 1.9176640689821238e-05, 'epoch': 0.16}
 16%|█▌        | 600/3837 [1:18:23<6:51:42,  7.63s/it] 16%|█▌        | 601/3837 [1:18:30<6:40:38,  7.43s/it] 16%|█▌        | 602/3837 [1:18:37<6:32:50,  7.29s/it] 16%|█▌        | 603/3837 [1:18:45<6:47:31,  7.56s/it] 16%|█▌        | 604/3837 [1:18:53<6:57:49,  7.75s/it] 16%|█▌        | 605/3837 [1:19:00<6:44:46,  7.51s/it] 16%|█▌        | 606/3837 [1:19:08<6:56:50,  7.74s/it] 16%|█▌        | 607/3837 [1:19:17<7:04:53,  7.89s/it] 16%|█▌        | 608/3837 [1:19:26<7:30:45,  8.38s/it] 16%|█▌        | 609/3837 [1:19:33<7:08:54,  7.97s/it] 16%|█▌        | 610/3837 [1:19:41<7:12:40,  8.04s/it] 16%|█▌        | 611/3837 [1:19:50<7:14:46,  8.09s/it] 16%|█▌        | 612/3837 [1:19:58<7:17:13,  8.13s/it] 16%|█▌        | 613/3837 [1:20:07<7:39:38,  8.55s/it] 16%|█▌        | 614/3837 [1:20:16<7:34:11,  8.46s/it] 16%|█▌        | 615/3837 [1:20:24<7:30:19,  8.39s/it] 16%|█▌        | 616/3837 [1:20:31<7:07:01,  7.95s/it] 16%|█▌        | 617/3837 [1:20:38<6:50:38,  7.65s/it] 16%|█▌        | 618/3837 [1:20:46<6:59:45,  7.82s/it] 16%|█▌        | 619/3837 [1:20:54<7:07:23,  7.97s/it] 16%|█▌        | 620/3837 [1:21:02<7:11:15,  8.04s/it]                                                      {'loss': 5.1359, 'grad_norm': 11.909289360046387, 'learning_rate': 1.910823894868627e-05, 'epoch': 0.16}
 16%|█▌        | 620/3837 [1:21:02<7:11:15,  8.04s/it] 16%|█▌        | 621/3837 [1:21:11<7:15:03,  8.12s/it] 16%|█▌        | 622/3837 [1:21:19<7:16:28,  8.15s/it] 16%|█▌        | 623/3837 [1:21:27<7:17:37,  8.17s/it] 16%|█▋        | 624/3837 [1:21:35<7:18:52,  8.20s/it] 16%|█▋        | 625/3837 [1:21:42<6:57:44,  7.80s/it] 16%|█▋        | 626/3837 [1:21:50<7:03:29,  7.91s/it] 16%|█▋        | 627/3837 [1:21:59<7:08:22,  8.01s/it] 16%|█▋        | 628/3837 [1:22:07<7:12:47,  8.09s/it] 16%|█▋        | 629/3837 [1:22:14<6:53:26,  7.73s/it] 16%|█▋        | 630/3837 [1:22:21<6:42:38,  7.53s/it] 16%|█▋        | 631/3837 [1:22:29<6:52:41,  7.72s/it] 16%|█▋        | 632/3837 [1:22:37<7:00:03,  7.86s/it] 16%|█▋        | 633/3837 [1:22:44<6:45:57,  7.60s/it] 17%|█▋        | 634/3837 [1:22:53<6:57:36,  7.82s/it] 17%|█▋        | 635/3837 [1:23:00<6:44:26,  7.58s/it] 17%|█▋        | 636/3837 [1:23:08<6:54:32,  7.77s/it] 17%|█▋        | 637/3837 [1:23:16<7:03:04,  7.93s/it] 17%|█▋        | 638/3837 [1:23:24<7:08:18,  8.03s/it] 17%|█▋        | 639/3837 [1:23:33<7:10:50,  8.08s/it] 17%|█▋        | 640/3837 [1:23:41<7:12:44,  8.12s/it]                                                      {'loss': 5.1966, 'grad_norm': 10.885895729064941, 'learning_rate': 1.903724025213997e-05, 'epoch': 0.17}
 17%|█▋        | 640/3837 [1:23:41<7:12:44,  8.12s/it] 17%|█▋        | 641/3837 [1:23:49<7:16:06,  8.19s/it] 17%|█▋        | 642/3837 [1:23:57<7:16:22,  8.19s/it] 17%|█▋        | 643/3837 [1:24:06<7:16:05,  8.19s/it] 17%|█▋        | 644/3837 [1:24:13<7:09:07,  8.06s/it] 17%|█▋        | 645/3837 [1:24:20<6:51:15,  7.73s/it] 17%|█▋        | 646/3837 [1:24:30<7:19:32,  8.26s/it] 17%|█▋        | 647/3837 [1:24:38<7:19:20,  8.26s/it] 17%|█▋        | 648/3837 [1:24:46<7:18:27,  8.25s/it] 17%|█▋        | 649/3837 [1:24:55<7:18:17,  8.25s/it] 17%|█▋        | 650/3837 [1:25:03<7:17:27,  8.24s/it] 17%|█▋        | 651/3837 [1:25:10<6:56:03,  7.84s/it] 17%|█▋        | 652/3837 [1:25:17<6:42:02,  7.57s/it] 17%|█▋        | 653/3837 [1:25:24<6:32:26,  7.40s/it] 17%|█▋        | 654/3837 [1:25:32<6:47:09,  7.68s/it] 17%|█▋        | 655/3837 [1:25:40<6:56:47,  7.86s/it] 17%|█▋        | 656/3837 [1:25:50<7:23:12,  8.36s/it] 17%|█▋        | 657/3837 [1:25:57<7:00:30,  7.93s/it] 17%|█▋        | 658/3837 [1:26:04<6:44:49,  7.64s/it] 17%|█▋        | 659/3837 [1:26:12<6:53:08,  7.80s/it] 17%|█▋        | 660/3837 [1:26:20<7:00:10,  7.94s/it]                                                      {'loss': 5.0148, 'grad_norm': 14.091329574584961, 'learning_rate': 1.8963664843442338e-05, 'epoch': 0.17}
 17%|█▋        | 660/3837 [1:26:20<7:00:10,  7.94s/it] 17%|█▋        | 661/3837 [1:26:28<7:04:26,  8.02s/it] 17%|█▋        | 662/3837 [1:26:37<7:08:00,  8.09s/it] 17%|█▋        | 663/3837 [1:26:45<7:10:07,  8.13s/it] 17%|█▋        | 664/3837 [1:26:54<7:31:02,  8.53s/it] 17%|█▋        | 665/3837 [1:27:01<7:05:31,  8.05s/it] 17%|█▋        | 666/3837 [1:27:09<7:08:13,  8.10s/it] 17%|█▋        | 667/3837 [1:27:18<7:11:15,  8.16s/it] 17%|█▋        | 668/3837 [1:27:26<7:11:52,  8.18s/it] 17%|█▋        | 669/3837 [1:27:34<7:12:00,  8.18s/it] 17%|█▋        | 670/3837 [1:27:41<6:52:09,  7.81s/it] 17%|█▋        | 671/3837 [1:27:50<7:18:21,  8.31s/it] 18%|█▊        | 672/3837 [1:27:57<6:57:53,  7.92s/it] 18%|█▊        | 673/3837 [1:28:06<7:02:31,  8.01s/it] 18%|█▊        | 674/3837 [1:28:15<7:25:40,  8.45s/it] 18%|█▊        | 675/3837 [1:28:22<7:02:27,  8.02s/it] 18%|█▊        | 676/3837 [1:28:29<6:45:06,  7.69s/it] 18%|█▊        | 677/3837 [1:28:37<6:53:07,  7.84s/it] 18%|█▊        | 678/3837 [1:28:44<6:38:36,  7.57s/it] 18%|█▊        | 679/3837 [1:28:52<6:47:53,  7.75s/it] 18%|█▊        | 680/3837 [1:28:59<6:37:04,  7.55s/it]                                                      {'loss': 5.1101, 'grad_norm': 13.059889793395996, 'learning_rate': 1.8887533700529602e-05, 'epoch': 0.18}
 18%|█▊        | 680/3837 [1:28:59<6:37:04,  7.55s/it] 18%|█▊        | 681/3837 [1:29:08<6:47:48,  7.75s/it] 18%|█▊        | 682/3837 [1:29:16<6:55:18,  7.90s/it] 18%|█▊        | 683/3837 [1:29:23<6:39:21,  7.60s/it] 18%|█▊        | 684/3837 [1:29:30<6:29:40,  7.42s/it] 18%|█▊        | 685/3837 [1:29:38<6:41:32,  7.64s/it] 18%|█▊        | 686/3837 [1:29:46<6:51:38,  7.84s/it] 18%|█▊        | 687/3837 [1:29:53<6:37:00,  7.56s/it] 18%|█▊        | 688/3837 [1:30:03<7:07:13,  8.14s/it] 18%|█▊        | 689/3837 [1:30:11<7:09:05,  8.18s/it] 18%|█▊        | 690/3837 [1:30:19<7:10:19,  8.20s/it] 18%|█▊        | 691/3837 [1:30:26<6:49:45,  7.81s/it] 18%|█▊        | 692/3837 [1:30:34<6:56:41,  7.95s/it] 18%|█▊        | 693/3837 [1:30:43<7:00:41,  8.03s/it] 18%|█▊        | 694/3837 [1:30:50<6:43:52,  7.71s/it] 18%|█▊        | 695/3837 [1:30:58<6:52:17,  7.87s/it] 18%|█▊        | 696/3837 [1:31:06<6:57:33,  7.98s/it] 18%|█▊        | 697/3837 [1:31:14<7:01:08,  8.05s/it] 18%|█▊        | 698/3837 [1:31:20<6:23:41,  7.33s/it] 18%|█▊        | 699/3837 [1:31:28<6:37:46,  7.61s/it] 18%|█▊        | 700/3837 [1:31:36<6:47:10,  7.79s/it]                                                      {'loss': 4.9134, 'grad_norm': 10.563639640808105, 'learning_rate': 1.8808868530032935e-05, 'epoch': 0.18}
 18%|█▊        | 700/3837 [1:31:36<6:47:10,  7.79s/it] 18%|█▊        | 701/3837 [1:31:43<6:35:34,  7.57s/it] 18%|█▊        | 702/3837 [1:31:52<6:45:36,  7.76s/it] 18%|█▊        | 703/3837 [1:32:00<6:52:21,  7.89s/it] 18%|█▊        | 704/3837 [1:32:08<6:57:38,  8.00s/it] 18%|█▊        | 705/3837 [1:32:16<7:01:25,  8.07s/it] 18%|█▊        | 706/3837 [1:32:25<7:03:59,  8.12s/it] 18%|█▊        | 707/3837 [1:32:33<7:05:38,  8.16s/it] 18%|█▊        | 708/3837 [1:32:42<7:25:50,  8.55s/it] 18%|█▊        | 709/3837 [1:32:50<7:19:51,  8.44s/it] 19%|█▊        | 710/3837 [1:32:59<7:16:56,  8.38s/it] 19%|█▊        | 711/3837 [1:33:06<6:54:34,  7.96s/it] 19%|█▊        | 712/3837 [1:33:14<6:57:49,  8.02s/it] 19%|█▊        | 713/3837 [1:33:22<7:01:01,  8.09s/it] 19%|█▊        | 714/3837 [1:33:30<7:02:40,  8.12s/it] 19%|█▊        | 715/3837 [1:33:37<6:43:53,  7.76s/it] 19%|█▊        | 716/3837 [1:33:45<6:50:52,  7.90s/it] 19%|█▊        | 717/3837 [1:33:53<6:37:32,  7.65s/it] 19%|█▊        | 718/3837 [1:34:01<6:46:40,  7.82s/it] 19%|█▊        | 719/3837 [1:34:09<6:52:38,  7.94s/it] 19%|█▉        | 720/3837 [1:34:16<6:37:28,  7.65s/it]                                                      {'loss': 5.0703, 'grad_norm': 11.391222953796387, 'learning_rate': 1.8727691761089446e-05, 'epoch': 0.19}
 19%|█▉        | 720/3837 [1:34:16<6:37:28,  7.65s/it] 19%|█▉        | 721/3837 [1:34:25<7:06:32,  8.21s/it] 19%|█▉        | 722/3837 [1:34:34<7:06:36,  8.22s/it] 19%|█▉        | 723/3837 [1:34:42<7:06:38,  8.22s/it] 19%|█▉        | 724/3837 [1:34:50<7:07:42,  8.24s/it] 19%|█▉        | 725/3837 [1:34:58<7:07:20,  8.24s/it] 19%|█▉        | 726/3837 [1:35:07<7:06:52,  8.23s/it] 19%|█▉        | 727/3837 [1:35:14<6:46:51,  7.85s/it] 19%|█▉        | 728/3837 [1:35:22<6:51:58,  7.95s/it] 19%|█▉        | 729/3837 [1:35:30<6:55:22,  8.02s/it] 19%|█▉        | 730/3837 [1:35:38<6:58:59,  8.09s/it] 19%|█▉        | 731/3837 [1:35:46<7:00:07,  8.12s/it] 19%|█▉        | 732/3837 [1:35:53<6:41:08,  7.75s/it] 19%|█▉        | 733/3837 [1:36:02<6:48:51,  7.90s/it] 19%|█▉        | 734/3837 [1:36:10<6:53:41,  8.00s/it] 19%|█▉        | 735/3837 [1:36:18<6:57:01,  8.07s/it] 19%|█▉        | 736/3837 [1:36:25<6:39:37,  7.73s/it] 19%|█▉        | 737/3837 [1:36:33<6:45:58,  7.86s/it] 19%|█▉        | 738/3837 [1:36:41<6:52:13,  7.98s/it] 19%|█▉        | 739/3837 [1:36:48<6:36:30,  7.68s/it] 19%|█▉        | 740/3837 [1:36:57<6:44:35,  7.84s/it]                                                      {'loss': 5.1176, 'grad_norm': 12.263815879821777, 'learning_rate': 1.864402653894715e-05, 'epoch': 0.19}
 19%|█▉        | 740/3837 [1:36:57<6:44:35,  7.84s/it] 19%|█▉        | 741/3837 [1:37:05<6:49:52,  7.94s/it] 19%|█▉        | 742/3837 [1:37:13<6:55:14,  8.05s/it] 19%|█▉        | 743/3837 [1:37:21<6:58:04,  8.11s/it] 19%|█▉        | 744/3837 [1:37:30<6:59:58,  8.15s/it] 19%|█▉        | 745/3837 [1:37:37<6:41:58,  7.80s/it] 19%|█▉        | 746/3837 [1:37:45<6:48:16,  7.93s/it] 19%|█▉        | 747/3837 [1:37:53<6:52:30,  8.01s/it] 19%|█▉        | 748/3837 [1:38:01<6:55:54,  8.08s/it] 20%|█▉        | 749/3837 [1:38:08<6:38:27,  7.74s/it] 20%|█▉        | 750/3837 [1:38:16<6:45:34,  7.88s/it] 20%|█▉        | 751/3837 [1:38:25<6:49:46,  7.97s/it] 20%|█▉        | 752/3837 [1:38:30<6:14:27,  7.28s/it] 20%|█▉        | 753/3837 [1:38:38<6:28:28,  7.56s/it] 20%|█▉        | 754/3837 [1:38:47<6:38:19,  7.75s/it] 20%|█▉        | 755/3837 [1:38:56<7:05:09,  8.28s/it] 20%|█▉        | 756/3837 [1:39:03<6:43:43,  7.86s/it] 20%|█▉        | 757/3837 [1:39:11<6:49:09,  7.97s/it] 20%|█▉        | 758/3837 [1:39:20<6:53:23,  8.06s/it] 20%|█▉        | 759/3837 [1:39:28<6:54:39,  8.08s/it] 20%|█▉        | 760/3837 [1:39:36<6:56:17,  8.12s/it]                                                      {'loss': 5.1152, 'grad_norm': 12.675463676452637, 'learning_rate': 1.855789671836574e-05, 'epoch': 0.2}
 20%|█▉        | 760/3837 [1:39:36<6:56:17,  8.12s/it] 20%|█▉        | 761/3837 [1:39:44<6:57:52,  8.15s/it] 20%|█▉        | 762/3837 [1:39:52<7:00:27,  8.20s/it] 20%|█▉        | 763/3837 [1:39:59<6:39:46,  7.80s/it] 20%|█▉        | 764/3837 [1:40:06<6:26:31,  7.55s/it] 20%|█▉        | 765/3837 [1:40:13<6:16:05,  7.35s/it] 20%|█▉        | 766/3837 [1:40:21<6:29:18,  7.61s/it] 20%|█▉        | 767/3837 [1:40:30<6:38:30,  7.79s/it] 20%|██        | 768/3837 [1:40:38<6:44:43,  7.91s/it] 20%|██        | 769/3837 [1:40:45<6:29:57,  7.63s/it] 20%|██        | 770/3837 [1:40:53<6:39:26,  7.81s/it] 20%|██        | 771/3837 [1:41:01<6:46:31,  7.96s/it] 20%|██        | 772/3837 [1:41:09<6:50:24,  8.03s/it] 20%|██        | 773/3837 [1:41:18<6:53:16,  8.09s/it] 20%|██        | 774/3837 [1:41:25<6:36:58,  7.78s/it] 20%|██        | 775/3837 [1:41:33<6:43:21,  7.90s/it] 20%|██        | 776/3837 [1:41:41<6:48:19,  8.00s/it] 20%|██        | 777/3837 [1:41:49<6:52:20,  8.09s/it] 20%|██        | 778/3837 [1:41:58<6:54:39,  8.13s/it] 20%|██        | 779/3837 [1:42:06<6:56:23,  8.17s/it] 20%|██        | 780/3837 [1:42:14<6:58:00,  8.20s/it]                                                      {'loss': 4.9855, 'grad_norm': 11.61548900604248, 'learning_rate': 1.8469326856815087e-05, 'epoch': 0.2}
 20%|██        | 780/3837 [1:42:14<6:58:00,  8.20s/it] 20%|██        | 781/3837 [1:42:23<6:59:24,  8.23s/it] 20%|██        | 782/3837 [1:42:32<7:18:21,  8.61s/it] 20%|██        | 783/3837 [1:42:40<7:12:47,  8.50s/it] 20%|██        | 784/3837 [1:42:48<7:07:59,  8.41s/it] 20%|██        | 785/3837 [1:42:57<7:04:34,  8.35s/it] 20%|██        | 786/3837 [1:43:04<6:42:42,  7.92s/it] 21%|██        | 787/3837 [1:43:13<7:06:25,  8.39s/it] 21%|██        | 788/3837 [1:43:20<6:43:43,  7.94s/it] 21%|██        | 789/3837 [1:43:28<6:47:34,  8.02s/it] 21%|██        | 790/3837 [1:43:35<6:30:26,  7.69s/it] 21%|██        | 791/3837 [1:43:42<6:19:12,  7.47s/it] 21%|██        | 792/3837 [1:43:50<6:29:21,  7.67s/it] 21%|██        | 793/3837 [1:43:58<6:37:15,  7.83s/it] 21%|██        | 794/3837 [1:44:07<6:42:37,  7.94s/it] 21%|██        | 795/3837 [1:44:15<6:48:39,  8.06s/it] 21%|██        | 796/3837 [1:44:22<6:30:59,  7.71s/it] 21%|██        | 797/3837 [1:44:30<6:39:30,  7.88s/it] 21%|██        | 798/3837 [1:44:40<7:03:07,  8.35s/it] 21%|██        | 799/3837 [1:44:47<6:42:10,  7.94s/it] 21%|██        | 800/3837 [1:44:55<6:45:34,  8.01s/it]                                                      {'loss': 5.1057, 'grad_norm': 12.326163291931152, 'learning_rate': 1.8378342207473407e-05, 'epoch': 0.21}
 21%|██        | 800/3837 [1:44:55<6:45:34,  8.01s/it] 21%|██        | 801/3837 [1:45:02<6:29:47,  7.70s/it] 21%|██        | 802/3837 [1:45:10<6:36:45,  7.84s/it] 21%|██        | 803/3837 [1:45:17<6:24:12,  7.60s/it] 21%|██        | 804/3837 [1:45:25<6:34:08,  7.80s/it] 21%|██        | 805/3837 [1:45:33<6:40:59,  7.94s/it] 21%|██        | 806/3837 [1:45:42<6:45:06,  8.02s/it] 21%|██        | 807/3837 [1:45:49<6:28:09,  7.69s/it] 21%|██        | 808/3837 [1:45:57<6:35:44,  7.84s/it] 21%|██        | 809/3837 [1:46:05<6:41:10,  7.95s/it] 21%|██        | 810/3837 [1:46:12<6:27:24,  7.68s/it] 21%|██        | 811/3837 [1:46:20<6:34:49,  7.83s/it] 21%|██        | 812/3837 [1:46:28<6:40:49,  7.95s/it] 21%|██        | 813/3837 [1:46:37<6:43:48,  8.01s/it] 21%|██        | 814/3837 [1:46:45<6:46:02,  8.06s/it] 21%|██        | 815/3837 [1:46:52<6:29:26,  7.73s/it] 21%|██▏       | 816/3837 [1:47:00<6:36:20,  7.87s/it] 21%|██▏       | 817/3837 [1:47:08<6:41:10,  7.97s/it] 21%|██▏       | 818/3837 [1:47:16<6:44:09,  8.03s/it] 21%|██▏       | 819/3837 [1:47:23<6:27:50,  7.71s/it] 21%|██▏       | 820/3837 [1:47:30<6:15:43,  7.47s/it]                                                      {'loss': 5.0128, 'grad_norm': 8.327361106872559, 'learning_rate': 1.8284968712026972e-05, 'epoch': 0.21}
 21%|██▏       | 820/3837 [1:47:30<6:15:43,  7.47s/it] 21%|██▏       | 821/3837 [1:47:38<6:28:03,  7.72s/it] 21%|██▏       | 822/3837 [1:47:48<6:54:07,  8.24s/it] 21%|██▏       | 823/3837 [1:47:56<6:54:09,  8.24s/it] 21%|██▏       | 824/3837 [1:48:03<6:34:37,  7.86s/it] 22%|██▏       | 825/3837 [1:48:11<6:39:23,  7.96s/it] 22%|██▏       | 826/3837 [1:48:19<6:42:50,  8.03s/it] 22%|██▏       | 827/3837 [1:48:28<6:46:08,  8.10s/it] 22%|██▏       | 828/3837 [1:48:36<6:47:48,  8.13s/it] 22%|██▏       | 829/3837 [1:48:44<6:49:48,  8.17s/it] 22%|██▏       | 830/3837 [1:48:52<6:49:58,  8.18s/it] 22%|██▏       | 831/3837 [1:49:01<6:51:45,  8.22s/it] 22%|██▏       | 832/3837 [1:49:08<6:32:48,  7.84s/it] 22%|██▏       | 833/3837 [1:49:15<6:20:19,  7.60s/it] 22%|██▏       | 834/3837 [1:49:23<6:28:31,  7.76s/it] 22%|██▏       | 835/3837 [1:49:31<6:34:25,  7.88s/it] 22%|██▏       | 836/3837 [1:49:39<6:39:34,  7.99s/it] 22%|██▏       | 837/3837 [1:49:48<6:43:08,  8.06s/it] 22%|██▏       | 838/3837 [1:49:54<6:26:06,  7.72s/it] 22%|██▏       | 839/3837 [1:50:03<6:33:12,  7.87s/it] 22%|██▏       | 840/3837 [1:50:11<6:38:01,  7.97s/it]                                                      {'loss': 5.0377, 'grad_norm': 13.776602745056152, 'learning_rate': 1.818923299327364e-05, 'epoch': 0.22}
 22%|██▏       | 840/3837 [1:50:11<6:38:01,  7.97s/it] 22%|██▏       | 841/3837 [1:50:18<6:23:14,  7.68s/it] 22%|██▏       | 842/3837 [1:50:26<6:31:07,  7.84s/it] 22%|██▏       | 843/3837 [1:50:33<6:18:17,  7.58s/it] 22%|██▏       | 844/3837 [1:50:40<6:09:08,  7.40s/it] 22%|██▏       | 845/3837 [1:50:48<6:21:07,  7.64s/it] 22%|██▏       | 846/3837 [1:50:58<6:48:19,  8.19s/it] 22%|██▏       | 847/3837 [1:51:06<6:48:26,  8.20s/it] 22%|██▏       | 848/3837 [1:51:14<6:48:04,  8.19s/it] 22%|██▏       | 849/3837 [1:51:22<6:47:32,  8.18s/it] 22%|██▏       | 850/3837 [1:51:30<6:48:17,  8.20s/it] 22%|██▏       | 851/3837 [1:51:40<7:07:26,  8.59s/it] 22%|██▏       | 852/3837 [1:51:48<7:01:47,  8.48s/it] 22%|██▏       | 853/3837 [1:51:58<7:17:10,  8.79s/it] 22%|██▏       | 854/3837 [1:52:06<7:09:34,  8.64s/it] 22%|██▏       | 855/3837 [1:52:13<6:44:01,  8.13s/it] 22%|██▏       | 856/3837 [1:52:20<6:26:17,  7.77s/it] 22%|██▏       | 857/3837 [1:52:28<6:32:39,  7.91s/it] 22%|██▏       | 858/3837 [1:52:38<6:56:11,  8.38s/it] 22%|██▏       | 859/3837 [1:52:46<6:53:32,  8.33s/it] 22%|██▏       | 860/3837 [1:52:53<6:32:22,  7.91s/it]                                                      {'loss': 4.9963, 'grad_norm': 10.770243644714355, 'learning_rate': 1.8091162347532075e-05, 'epoch': 0.22}
 22%|██▏       | 860/3837 [1:52:53<6:32:22,  7.91s/it] 22%|██▏       | 861/3837 [1:53:01<6:35:57,  7.98s/it] 22%|██▏       | 862/3837 [1:53:09<6:40:35,  8.08s/it] 22%|██▏       | 863/3837 [1:53:17<6:42:00,  8.11s/it] 23%|██▎       | 864/3837 [1:53:26<6:42:48,  8.13s/it] 23%|██▎       | 865/3837 [1:53:33<6:25:25,  7.78s/it] 23%|██▎       | 866/3837 [1:53:41<6:31:41,  7.91s/it] 23%|██▎       | 867/3837 [1:53:48<6:17:29,  7.63s/it] 23%|██▎       | 868/3837 [1:53:55<6:07:59,  7.44s/it] 23%|██▎       | 869/3837 [1:54:03<6:20:28,  7.69s/it] 23%|██▎       | 870/3837 [1:54:11<6:27:51,  7.84s/it] 23%|██▎       | 871/3837 [1:54:19<6:33:46,  7.97s/it] 23%|██▎       | 872/3837 [1:54:28<6:37:35,  8.05s/it] 23%|██▎       | 873/3837 [1:54:36<6:39:40,  8.09s/it] 23%|██▎       | 874/3837 [1:54:45<7:00:28,  8.51s/it] 23%|██▎       | 875/3837 [1:54:54<6:56:00,  8.43s/it] 23%|██▎       | 876/3837 [1:55:02<6:52:53,  8.37s/it] 23%|██▎       | 877/3837 [1:55:10<6:49:54,  8.31s/it] 23%|██▎       | 878/3837 [1:55:18<6:47:58,  8.27s/it] 23%|██▎       | 879/3837 [1:55:25<6:29:52,  7.91s/it] 23%|██▎       | 880/3837 [1:55:35<6:52:59,  8.38s/it]                                                      {'loss': 4.9776, 'grad_norm': 14.183053016662598, 'learning_rate': 1.7990784736859006e-05, 'epoch': 0.23}
 23%|██▎       | 880/3837 [1:55:35<6:52:59,  8.38s/it] 23%|██▎       | 881/3837 [1:55:43<6:50:10,  8.33s/it] 23%|██▎       | 882/3837 [1:55:51<6:46:56,  8.26s/it] 23%|██▎       | 883/3837 [1:55:58<6:29:14,  7.91s/it] 23%|██▎       | 884/3837 [1:56:05<6:14:33,  7.61s/it] 23%|██▎       | 885/3837 [1:56:12<6:05:33,  7.43s/it] 23%|██▎       | 886/3837 [1:56:20<6:17:31,  7.68s/it] 23%|██▎       | 887/3837 [1:56:29<6:25:51,  7.85s/it] 23%|██▎       | 888/3837 [1:56:37<6:31:10,  7.96s/it] 23%|██▎       | 889/3837 [1:56:44<6:15:18,  7.64s/it] 23%|██▎       | 890/3837 [1:56:52<6:24:05,  7.82s/it] 23%|██▎       | 891/3837 [1:57:00<6:29:20,  7.93s/it] 23%|██▎       | 892/3837 [1:57:08<6:34:43,  8.04s/it] 23%|██▎       | 893/3837 [1:57:17<6:37:56,  8.11s/it] 23%|██▎       | 894/3837 [1:57:26<6:59:12,  8.55s/it] 23%|██▎       | 895/3837 [1:57:33<6:36:09,  8.08s/it] 23%|██▎       | 896/3837 [1:57:41<6:38:46,  8.14s/it] 23%|██▎       | 897/3837 [1:57:50<6:39:57,  8.16s/it] 23%|██▎       | 898/3837 [1:57:58<6:40:29,  8.18s/it] 23%|██▎       | 899/3837 [1:58:06<6:41:48,  8.21s/it] 23%|██▎       | 900/3837 [1:58:13<6:22:52,  7.82s/it]                                                      {'loss': 4.9451, 'grad_norm': 10.870338439941406, 'learning_rate': 1.788812878107663e-05, 'epoch': 0.23}
 23%|██▎       | 900/3837 [1:58:13<6:22:52,  7.82s/it] 23%|██▎       | 901/3837 [1:58:21<6:29:21,  7.96s/it] 24%|██▎       | 902/3837 [1:58:28<6:13:59,  7.65s/it] 24%|██▎       | 903/3837 [1:58:35<6:05:34,  7.48s/it] 24%|██▎       | 904/3837 [1:58:44<6:16:36,  7.70s/it] 24%|██▎       | 905/3837 [1:58:53<6:42:58,  8.25s/it] 24%|██▎       | 906/3837 [1:59:01<6:43:00,  8.25s/it] 24%|██▎       | 907/3837 [1:59:10<6:41:25,  8.22s/it] 24%|██▎       | 908/3837 [1:59:18<6:41:04,  8.22s/it] 24%|██▎       | 909/3837 [1:59:25<6:21:38,  7.82s/it] 24%|██▎       | 910/3837 [1:59:33<6:28:22,  7.96s/it] 24%|██▎       | 911/3837 [1:59:41<6:31:34,  8.03s/it] 24%|██▍       | 912/3837 [1:59:49<6:33:58,  8.08s/it] 24%|██▍       | 913/3837 [1:59:59<6:55:10,  8.52s/it] 24%|██▍       | 914/3837 [2:00:07<6:50:35,  8.43s/it] 24%|██▍       | 915/3837 [2:00:15<6:46:43,  8.35s/it] 24%|██▍       | 916/3837 [2:00:22<6:26:23,  7.94s/it] 24%|██▍       | 917/3837 [2:00:30<6:29:50,  8.01s/it] 24%|██▍       | 918/3837 [2:00:37<6:13:20,  7.67s/it] 24%|██▍       | 919/3837 [2:00:45<6:21:05,  7.84s/it] 24%|██▍       | 920/3837 [2:00:55<6:45:12,  8.33s/it]                                                      {'loss': 4.9124, 'grad_norm': 13.615042686462402, 'learning_rate': 1.778322374961247e-05, 'epoch': 0.24}
 24%|██▍       | 920/3837 [2:00:55<6:45:12,  8.33s/it] 24%|██▍       | 921/3837 [2:01:03<6:44:25,  8.32s/it] 24%|██▍       | 922/3837 [2:01:12<6:42:51,  8.29s/it] 24%|██▍       | 923/3837 [2:01:20<6:42:01,  8.28s/it] 24%|██▍       | 924/3837 [2:01:28<6:41:01,  8.26s/it] 24%|██▍       | 925/3837 [2:01:36<6:40:06,  8.24s/it] 24%|██▍       | 926/3837 [2:01:45<6:41:39,  8.28s/it] 24%|██▍       | 927/3837 [2:01:52<6:22:32,  7.89s/it] 24%|██▍       | 928/3837 [2:02:01<6:45:51,  8.37s/it] 24%|██▍       | 929/3837 [2:02:09<6:43:31,  8.33s/it] 24%|██▍       | 930/3837 [2:02:16<6:23:58,  7.93s/it] 24%|██▍       | 931/3837 [2:02:23<6:09:59,  7.64s/it] 24%|██▍       | 932/3837 [2:02:30<5:59:24,  7.42s/it] 24%|██▍       | 933/3837 [2:02:37<5:51:32,  7.26s/it] 24%|██▍       | 934/3837 [2:02:47<6:24:04,  7.94s/it] 24%|██▍       | 935/3837 [2:02:55<6:28:14,  8.03s/it] 24%|██▍       | 936/3837 [2:03:03<6:30:20,  8.07s/it] 24%|██▍       | 937/3837 [2:03:10<6:13:39,  7.73s/it] 24%|██▍       | 938/3837 [2:03:18<6:21:13,  7.89s/it] 24%|██▍       | 939/3837 [2:03:26<6:25:42,  7.99s/it] 24%|██▍       | 940/3837 [2:03:35<6:29:17,  8.06s/it]                                                      {'loss': 4.8923, 'grad_norm': 10.545595169067383, 'learning_rate': 1.7676099553154072e-05, 'epoch': 0.24}
 24%|██▍       | 940/3837 [2:03:35<6:29:17,  8.06s/it] 25%|██▍       | 941/3837 [2:03:42<6:14:05,  7.75s/it] 25%|██▍       | 942/3837 [2:03:50<6:20:40,  7.89s/it] 25%|██▍       | 943/3837 [2:03:58<6:24:49,  7.98s/it] 25%|██▍       | 944/3837 [2:04:04<5:51:37,  7.29s/it] 25%|██▍       | 945/3837 [2:04:12<6:04:54,  7.57s/it] 25%|██▍       | 946/3837 [2:04:19<5:55:11,  7.37s/it] 25%|██▍       | 947/3837 [2:04:26<5:49:59,  7.27s/it] 25%|██▍       | 948/3837 [2:04:34<6:02:51,  7.54s/it] 25%|██▍       | 949/3837 [2:04:41<5:55:03,  7.38s/it] 25%|██▍       | 950/3837 [2:04:49<6:07:05,  7.63s/it] 25%|██▍       | 951/3837 [2:04:56<5:57:56,  7.44s/it] 25%|██▍       | 952/3837 [2:05:04<6:08:01,  7.65s/it] 25%|██▍       | 953/3837 [2:05:11<5:57:33,  7.44s/it] 25%|██▍       | 954/3837 [2:05:20<6:09:04,  7.68s/it] 25%|██▍       | 955/3837 [2:05:28<6:16:32,  7.84s/it] 25%|██▍       | 956/3837 [2:05:36<6:21:29,  7.94s/it] 25%|██▍       | 957/3837 [2:05:44<6:25:29,  8.03s/it] 25%|██▍       | 958/3837 [2:05:51<6:10:03,  7.71s/it] 25%|██▍       | 959/3837 [2:05:59<6:16:55,  7.86s/it] 25%|██▌       | 960/3837 [2:06:08<6:21:55,  7.97s/it]                                                      {'loss': 4.7849, 'grad_norm': 10.834299087524414, 'learning_rate': 1.7566786735120763e-05, 'epoch': 0.25}
 25%|██▌       | 960/3837 [2:06:08<6:21:55,  7.97s/it] 25%|██▌       | 961/3837 [2:06:15<6:07:01,  7.66s/it] 25%|██▌       | 962/3837 [2:06:24<6:33:12,  8.21s/it] 25%|██▌       | 963/3837 [2:06:32<6:33:32,  8.22s/it] 25%|██▌       | 964/3837 [2:06:42<6:51:43,  8.60s/it] 25%|██▌       | 965/3837 [2:06:49<6:27:59,  8.11s/it] 25%|██▌       | 966/3837 [2:06:56<6:11:47,  7.77s/it] 25%|██▌       | 967/3837 [2:07:04<6:18:01,  7.90s/it] 25%|██▌       | 968/3837 [2:07:13<6:42:17,  8.41s/it] 25%|██▌       | 969/3837 [2:07:22<6:40:19,  8.38s/it] 25%|██▌       | 970/3837 [2:07:31<6:56:21,  8.71s/it] 25%|██▌       | 971/3837 [2:07:38<6:30:23,  8.17s/it] 25%|██▌       | 972/3837 [2:07:45<6:13:33,  7.82s/it] 25%|██▌       | 973/3837 [2:07:53<6:18:55,  7.94s/it] 25%|██▌       | 974/3837 [2:08:03<6:40:56,  8.40s/it] 25%|██▌       | 975/3837 [2:08:10<6:20:00,  7.97s/it] 25%|██▌       | 976/3837 [2:08:17<6:05:25,  7.66s/it] 25%|██▌       | 977/3837 [2:08:25<6:15:02,  7.87s/it] 25%|██▌       | 978/3837 [2:08:33<6:20:12,  7.98s/it] 26%|██▌       | 979/3837 [2:08:42<6:23:20,  8.05s/it] 26%|██▌       | 980/3837 [2:08:49<6:09:10,  7.75s/it]                                                      {'loss': 4.8348, 'grad_norm': 11.027567863464355, 'learning_rate': 1.745531646295512e-05, 'epoch': 0.26}
 26%|██▌       | 980/3837 [2:08:49<6:09:10,  7.75s/it] 26%|██▌       | 981/3837 [2:08:57<6:16:42,  7.91s/it] 26%|██▌       | 982/3837 [2:09:06<6:28:23,  8.16s/it] 26%|██▌       | 983/3837 [2:09:14<6:30:08,  8.20s/it] 26%|██▌       | 984/3837 [2:09:22<6:30:05,  8.20s/it] 26%|██▌       | 985/3837 [2:09:30<6:30:22,  8.21s/it] 26%|██▌       | 986/3837 [2:09:39<6:30:16,  8.21s/it] 26%|██▌       | 987/3837 [2:09:46<6:12:19,  7.84s/it] 26%|██▌       | 988/3837 [2:09:54<6:18:41,  7.98s/it] 26%|██▌       | 989/3837 [2:10:02<6:21:37,  8.04s/it] 26%|██▌       | 990/3837 [2:10:10<6:24:02,  8.09s/it] 26%|██▌       | 991/3837 [2:10:19<6:26:39,  8.15s/it] 26%|██▌       | 992/3837 [2:10:27<6:26:28,  8.15s/it] 26%|██▌       | 993/3837 [2:10:34<6:09:14,  7.79s/it] 26%|██▌       | 994/3837 [2:10:42<6:14:40,  7.91s/it] 26%|██▌       | 995/3837 [2:10:50<6:19:04,  8.00s/it] 26%|██▌       | 996/3837 [2:10:57<6:04:09,  7.69s/it] 26%|██▌       | 997/3837 [2:11:04<5:52:30,  7.45s/it] 26%|██▌       | 998/3837 [2:11:12<6:03:30,  7.68s/it] 26%|██▌       | 999/3837 [2:11:20<6:10:22,  7.83s/it] 26%|██▌       | 1000/3837 [2:11:29<6:15:43,  7.95s/it]                                                       {'loss': 4.8237, 'grad_norm': 9.28471851348877, 'learning_rate': 1.7341720519236416e-05, 'epoch': 0.26}
 26%|██▌       | 1000/3837 [2:11:29<6:15:43,  7.95s/it]/home/zhengduo/miniconda3/envs/vgllm2/lib/python3.10/site-packages/torch/utils/checkpoint.py:87: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
  warnings.warn(
/home/zhengduo/workspace/vgllm/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:42: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(dtype=dtype):
 26%|██▌       | 1001/3837 [2:12:12<14:32:18, 18.45s/it] 26%|██▌       | 1002/3837 [2:12:19<11:49:39, 15.02s/it] 26%|██▌       | 1003/3837 [2:12:27<10:13:18, 12.98s/it] 26%|██▌       | 1004/3837 [2:12:35<9:05:53, 11.56s/it]  26%|██▌       | 1005/3837 [2:12:43<8:18:21, 10.56s/it] 26%|██▌       | 1006/3837 [2:12:51<7:45:42,  9.87s/it] 26%|██▌       | 1007/3837 [2:13:00<7:22:48,  9.39s/it] 26%|██▋       | 1008/3837 [2:13:08<7:06:00,  9.04s/it] 26%|██▋       | 1009/3837 [2:13:16<6:54:20,  8.79s/it] 26%|██▋       | 1010/3837 [2:13:24<6:47:22,  8.65s/it] 26%|██▋       | 1011/3837 [2:13:33<6:40:40,  8.51s/it] 26%|██▋       | 1012/3837 [2:13:40<6:18:21,  8.04s/it] 26%|██▋       | 1013/3837 [2:13:47<6:02:35,  7.70s/it] 26%|██▋       | 1014/3837 [2:13:54<5:52:09,  7.48s/it] 26%|██▋       | 1015/3837 [2:14:02<6:02:31,  7.71s/it] 26%|██▋       | 1016/3837 [2:14:09<5:51:45,  7.48s/it] 27%|██▋       | 1017/3837 [2:14:17<6:02:48,  7.72s/it] 27%|██▋       | 1018/3837 [2:14:24<5:51:27,  7.48s/it] 27%|██▋       | 1019/3837 [2:14:32<6:01:17,  7.69s/it] 27%|██▋       | 1020/3837 [2:14:40<6:09:03,  7.86s/it]                                                       {'loss': 4.7666, 'grad_norm': 11.153389930725098, 'learning_rate': 1.722603129261876e-05, 'epoch': 0.27}
 27%|██▋       | 1020/3837 [2:14:40<6:09:03,  7.86s/it] 27%|██▋       | 1021/3837 [2:14:47<5:56:04,  7.59s/it] 27%|██▋       | 1022/3837 [2:14:56<6:06:11,  7.81s/it] 27%|██▋       | 1023/3837 [2:15:03<5:55:22,  7.58s/it] 27%|██▋       | 1024/3837 [2:15:10<5:45:52,  7.38s/it] 27%|██▋       | 1025/3837 [2:15:18<5:57:46,  7.63s/it] 27%|██▋       | 1026/3837 [2:15:25<5:47:29,  7.42s/it] 27%|██▋       | 1027/3837 [2:15:32<5:41:40,  7.30s/it] 27%|██▋       | 1028/3837 [2:15:39<5:36:19,  7.18s/it] 27%|██▋       | 1029/3837 [2:15:46<5:33:43,  7.13s/it] 27%|██▋       | 1030/3837 [2:15:54<5:47:57,  7.44s/it] 27%|██▋       | 1031/3837 [2:16:03<6:16:44,  8.06s/it] 27%|██▋       | 1032/3837 [2:16:11<6:18:07,  8.09s/it] 27%|██▋       | 1033/3837 [2:16:20<6:19:21,  8.12s/it] 27%|██▋       | 1034/3837 [2:16:28<6:21:49,  8.17s/it] 27%|██▋       | 1035/3837 [2:16:36<6:22:39,  8.19s/it] 27%|██▋       | 1036/3837 [2:16:44<6:22:02,  8.18s/it] 27%|██▋       | 1037/3837 [2:16:51<6:04:09,  7.80s/it] 27%|██▋       | 1038/3837 [2:16:59<6:09:50,  7.93s/it] 27%|██▋       | 1039/3837 [2:17:08<6:14:39,  8.03s/it] 27%|██▋       | 1040/3837 [2:17:16<6:16:30,  8.08s/it]                                                       {'loss': 4.6997, 'grad_norm': 10.627456665039062, 'learning_rate': 1.710828176859635e-05, 'epoch': 0.27}
 27%|██▋       | 1040/3837 [2:17:16<6:16:30,  8.08s/it] 27%|██▋       | 1041/3837 [2:17:24<6:18:17,  8.12s/it] 27%|██▋       | 1042/3837 [2:17:32<6:20:10,  8.16s/it] 27%|██▋       | 1043/3837 [2:17:41<6:20:53,  8.18s/it] 27%|██▋       | 1044/3837 [2:17:50<6:38:15,  8.56s/it] 27%|██▋       | 1045/3837 [2:17:58<6:33:25,  8.45s/it] 27%|██▋       | 1046/3837 [2:18:05<6:12:31,  8.01s/it] 27%|██▋       | 1047/3837 [2:18:13<6:15:25,  8.07s/it] 27%|██▋       | 1048/3837 [2:18:22<6:16:22,  8.10s/it] 27%|██▋       | 1049/3837 [2:18:29<6:01:46,  7.79s/it] 27%|██▋       | 1050/3837 [2:18:36<5:51:00,  7.56s/it] 27%|██▋       | 1051/3837 [2:18:44<6:00:36,  7.77s/it] 27%|██▋       | 1052/3837 [2:18:51<5:48:42,  7.51s/it] 27%|██▋       | 1053/3837 [2:18:58<5:40:04,  7.33s/it] 27%|██▋       | 1054/3837 [2:19:05<5:34:50,  7.22s/it] 27%|██▋       | 1055/3837 [2:19:13<5:49:11,  7.53s/it] 28%|██▊       | 1056/3837 [2:19:21<5:59:03,  7.75s/it] 28%|██▊       | 1057/3837 [2:19:29<6:05:08,  7.88s/it] 28%|██▊       | 1058/3837 [2:19:36<5:52:07,  7.60s/it] 28%|██▊       | 1059/3837 [2:19:45<6:00:16,  7.78s/it] 28%|██▊       | 1060/3837 [2:19:53<6:05:49,  7.90s/it]                                                       {'loss': 4.8101, 'grad_norm': 11.7500581741333, 'learning_rate': 1.6988505520098635e-05, 'epoch': 0.28}
 28%|██▊       | 1060/3837 [2:19:53<6:05:49,  7.90s/it] 28%|██▊       | 1061/3837 [2:20:01<6:10:46,  8.01s/it] 28%|██▊       | 1062/3837 [2:20:08<5:55:55,  7.70s/it] 28%|██▊       | 1063/3837 [2:20:16<6:02:48,  7.85s/it] 28%|██▊       | 1064/3837 [2:20:25<6:09:00,  7.98s/it] 28%|██▊       | 1065/3837 [2:20:33<6:12:12,  8.06s/it] 28%|██▊       | 1066/3837 [2:20:41<6:14:34,  8.11s/it] 28%|██▊       | 1067/3837 [2:20:49<6:15:40,  8.14s/it] 28%|██▊       | 1068/3837 [2:20:57<6:16:03,  8.15s/it] 28%|██▊       | 1069/3837 [2:21:06<6:16:23,  8.16s/it] 28%|██▊       | 1070/3837 [2:21:13<5:59:48,  7.80s/it] 28%|██▊       | 1071/3837 [2:21:21<6:05:32,  7.93s/it] 28%|██▊       | 1072/3837 [2:21:29<6:10:01,  8.03s/it] 28%|██▊       | 1073/3837 [2:21:37<6:12:14,  8.08s/it] 28%|██▊       | 1074/3837 [2:21:45<6:14:02,  8.12s/it] 28%|██▊       | 1075/3837 [2:21:52<5:57:59,  7.78s/it] 28%|██▊       | 1076/3837 [2:22:01<6:04:29,  7.92s/it] 28%|██▊       | 1077/3837 [2:22:08<5:50:22,  7.62s/it] 28%|██▊       | 1078/3837 [2:22:17<6:15:29,  8.17s/it] 28%|██▊       | 1079/3837 [2:22:25<6:16:03,  8.18s/it] 28%|██▊       | 1080/3837 [2:22:32<5:58:15,  7.80s/it]                                                       {'loss': 4.8117, 'grad_norm': 11.569954872131348, 'learning_rate': 1.686673669791793e-05, 'epoch': 0.28}
 28%|██▊       | 1080/3837 [2:22:32<5:58:15,  7.80s/it] 28%|██▊       | 1081/3837 [2:22:40<6:03:27,  7.91s/it] 28%|██▊       | 1082/3837 [2:22:47<5:49:34,  7.61s/it] 28%|██▊       | 1083/3837 [2:22:54<5:39:32,  7.40s/it] 28%|██▊       | 1084/3837 [2:23:01<5:33:47,  7.27s/it] 28%|██▊       | 1085/3837 [2:23:08<5:28:59,  7.17s/it] 28%|██▊       | 1086/3837 [2:23:16<5:44:07,  7.51s/it] 28%|██▊       | 1087/3837 [2:23:25<5:53:22,  7.71s/it] 28%|██▊       | 1088/3837 [2:23:33<6:00:31,  7.87s/it] 28%|██▊       | 1089/3837 [2:23:40<5:47:32,  7.59s/it] 28%|██▊       | 1090/3837 [2:23:48<5:56:34,  7.79s/it] 28%|██▊       | 1091/3837 [2:23:55<5:45:14,  7.54s/it] 28%|██▊       | 1092/3837 [2:24:03<5:54:24,  7.75s/it] 28%|██▊       | 1093/3837 [2:24:11<6:00:51,  7.89s/it] 29%|██▊       | 1094/3837 [2:24:18<5:49:22,  7.64s/it] 29%|██▊       | 1095/3837 [2:24:27<5:57:26,  7.82s/it] 29%|██▊       | 1096/3837 [2:24:35<6:02:47,  7.94s/it] 29%|██▊       | 1097/3837 [2:24:43<6:06:01,  8.02s/it] 29%|██▊       | 1098/3837 [2:24:51<6:08:33,  8.07s/it] 29%|██▊       | 1099/3837 [2:24:59<6:10:12,  8.11s/it] 29%|██▊       | 1100/3837 [2:25:08<6:12:25,  8.16s/it]                                                       {'loss': 4.6557, 'grad_norm': 12.270000457763672, 'learning_rate': 1.6743010020972295e-05, 'epoch': 0.29}
 29%|██▊       | 1100/3837 [2:25:08<6:12:25,  8.16s/it] 29%|██▊       | 1101/3837 [2:25:15<5:56:19,  7.81s/it] 29%|██▊       | 1102/3837 [2:25:23<6:01:34,  7.93s/it] 29%|██▊       | 1103/3837 [2:25:30<5:47:44,  7.63s/it] 29%|██▉       | 1104/3837 [2:25:38<5:55:39,  7.81s/it] 29%|██▉       | 1105/3837 [2:25:45<5:44:14,  7.56s/it] 29%|██▉       | 1106/3837 [2:25:53<5:52:10,  7.74s/it] 29%|██▉       | 1107/3837 [2:26:00<5:41:02,  7.50s/it] 29%|██▉       | 1108/3837 [2:26:08<5:50:04,  7.70s/it] 29%|██▉       | 1109/3837 [2:26:15<5:38:42,  7.45s/it] 29%|██▉       | 1110/3837 [2:26:23<5:49:19,  7.69s/it] 29%|██▉       | 1111/3837 [2:26:32<5:55:33,  7.83s/it] 29%|██▉       | 1112/3837 [2:26:39<5:42:52,  7.55s/it] 29%|██▉       | 1113/3837 [2:26:47<5:51:46,  7.75s/it] 29%|██▉       | 1114/3837 [2:26:55<5:58:16,  7.89s/it] 29%|██▉       | 1115/3837 [2:27:02<5:44:25,  7.59s/it] 29%|██▉       | 1116/3837 [2:27:10<5:52:24,  7.77s/it] 29%|██▉       | 1117/3837 [2:27:18<5:58:19,  7.90s/it] 29%|██▉       | 1118/3837 [2:27:27<6:03:03,  8.01s/it] 29%|██▉       | 1119/3837 [2:27:33<5:47:56,  7.68s/it] 29%|██▉       | 1120/3837 [2:27:42<5:55:20,  7.85s/it]                                                       {'loss': 4.6892, 'grad_norm': 10.446915626525879, 'learning_rate': 1.6617360766406404e-05, 'epoch': 0.29}
 29%|██▉       | 1120/3837 [2:27:42<5:55:20,  7.85s/it] 29%|██▉       | 1121/3837 [2:27:49<5:42:34,  7.57s/it] 29%|██▉       | 1122/3837 [2:27:57<5:50:41,  7.75s/it] 29%|██▉       | 1123/3837 [2:28:05<5:56:59,  7.89s/it] 29%|██▉       | 1124/3837 [2:28:12<5:43:31,  7.60s/it] 29%|██▉       | 1125/3837 [2:28:18<5:17:53,  7.03s/it] 29%|██▉       | 1126/3837 [2:28:25<5:16:28,  7.00s/it] 29%|██▉       | 1127/3837 [2:28:32<5:16:27,  7.01s/it] 29%|██▉       | 1128/3837 [2:28:41<5:49:44,  7.75s/it] 29%|██▉       | 1129/3837 [2:28:51<6:13:01,  8.26s/it] 29%|██▉       | 1130/3837 [2:28:59<6:13:15,  8.27s/it] 29%|██▉       | 1131/3837 [2:29:07<6:11:52,  8.25s/it] 30%|██▉       | 1132/3837 [2:29:15<6:11:21,  8.24s/it] 30%|██▉       | 1133/3837 [2:29:23<6:11:05,  8.23s/it] 30%|██▉       | 1134/3837 [2:29:32<6:10:56,  8.23s/it] 30%|██▉       | 1135/3837 [2:29:39<5:53:22,  7.85s/it] 30%|██▉       | 1136/3837 [2:29:47<5:57:33,  7.94s/it] 30%|██▉       | 1137/3837 [2:29:55<6:00:24,  8.01s/it] 30%|██▉       | 1138/3837 [2:30:03<6:02:53,  8.07s/it] 30%|██▉       | 1139/3837 [2:30:11<6:04:43,  8.11s/it] 30%|██▉       | 1140/3837 [2:30:20<6:05:49,  8.14s/it]                                                       {'loss': 4.6607, 'grad_norm': 12.821693420410156, 'learning_rate': 1.6489824759533307e-05, 'epoch': 0.3}
 30%|██▉       | 1140/3837 [2:30:20<6:05:49,  8.14s/it] 30%|██▉       | 1141/3837 [2:30:28<6:06:23,  8.15s/it] 30%|██▉       | 1142/3837 [2:30:35<5:49:44,  7.79s/it] 30%|██▉       | 1143/3837 [2:30:43<5:55:54,  7.93s/it] 30%|██▉       | 1144/3837 [2:30:51<5:59:34,  8.01s/it] 30%|██▉       | 1145/3837 [2:30:59<6:01:34,  8.06s/it] 30%|██▉       | 1146/3837 [2:31:08<6:04:22,  8.12s/it] 30%|██▉       | 1147/3837 [2:31:14<5:47:57,  7.76s/it] 30%|██▉       | 1148/3837 [2:31:23<5:54:38,  7.91s/it] 30%|██▉       | 1149/3837 [2:31:31<5:58:57,  8.01s/it] 30%|██▉       | 1150/3837 [2:31:39<6:01:46,  8.08s/it] 30%|██▉       | 1151/3837 [2:31:46<5:46:01,  7.73s/it] 30%|███       | 1152/3837 [2:31:53<5:35:03,  7.49s/it] 30%|███       | 1153/3837 [2:32:01<5:44:43,  7.71s/it] 30%|███       | 1154/3837 [2:32:08<5:33:45,  7.46s/it] 30%|███       | 1155/3837 [2:32:15<5:27:53,  7.34s/it] 30%|███       | 1156/3837 [2:32:22<5:22:28,  7.22s/it] 30%|███       | 1157/3837 [2:32:30<5:35:00,  7.50s/it] 30%|███       | 1158/3837 [2:32:39<5:43:55,  7.70s/it] 30%|███       | 1159/3837 [2:32:45<5:33:46,  7.48s/it] 30%|███       | 1160/3837 [2:32:54<5:43:18,  7.69s/it]                                                       {'loss': 4.645, 'grad_norm': 9.692106246948242, 'learning_rate': 1.6360438363619824e-05, 'epoch': 0.3}
 30%|███       | 1160/3837 [2:32:54<5:43:18,  7.69s/it] 30%|███       | 1161/3837 [2:33:02<5:49:57,  7.85s/it] 30%|███       | 1162/3837 [2:33:10<5:54:16,  7.95s/it] 30%|███       | 1163/3837 [2:33:18<5:57:20,  8.02s/it] 30%|███       | 1164/3837 [2:33:26<5:59:43,  8.07s/it] 30%|███       | 1165/3837 [2:33:35<6:00:37,  8.10s/it] 30%|███       | 1166/3837 [2:33:42<5:45:14,  7.76s/it] 30%|███       | 1167/3837 [2:33:50<5:51:15,  7.89s/it] 30%|███       | 1168/3837 [2:33:58<5:55:14,  7.99s/it] 30%|███       | 1169/3837 [2:34:06<5:57:44,  8.05s/it] 30%|███       | 1170/3837 [2:34:13<5:42:44,  7.71s/it] 31%|███       | 1171/3837 [2:34:21<5:48:48,  7.85s/it] 31%|███       | 1172/3837 [2:34:29<5:52:57,  7.95s/it] 31%|███       | 1173/3837 [2:34:38<5:55:50,  8.01s/it] 31%|███       | 1174/3837 [2:34:46<5:57:49,  8.06s/it] 31%|███       | 1175/3837 [2:34:53<5:42:42,  7.72s/it] 31%|███       | 1176/3837 [2:35:02<5:59:28,  8.11s/it] 31%|███       | 1177/3837 [2:35:10<6:00:56,  8.14s/it] 31%|███       | 1178/3837 [2:35:17<5:44:48,  7.78s/it] 31%|███       | 1179/3837 [2:35:25<5:50:39,  7.92s/it] 31%|███       | 1180/3837 [2:35:33<5:54:55,  8.01s/it]                                                       {'loss': 4.8032, 'grad_norm': 13.20254898071289, 'learning_rate': 1.6229238469518614e-05, 'epoch': 0.31}
 31%|███       | 1180/3837 [2:35:33<5:54:55,  8.01s/it] 31%|███       | 1181/3837 [2:35:40<5:40:57,  7.70s/it] 31%|███       | 1182/3837 [2:35:47<5:31:19,  7.49s/it] 31%|███       | 1183/3837 [2:35:54<5:25:36,  7.36s/it] 31%|███       | 1184/3837 [2:36:03<5:37:30,  7.63s/it] 31%|███       | 1185/3837 [2:36:11<5:44:56,  7.80s/it] 31%|███       | 1186/3837 [2:36:19<5:50:32,  7.93s/it] 31%|███       | 1187/3837 [2:36:27<5:54:21,  8.02s/it] 31%|███       | 1188/3837 [2:36:36<5:57:35,  8.10s/it] 31%|███       | 1189/3837 [2:36:44<5:59:32,  8.15s/it] 31%|███       | 1190/3837 [2:36:53<6:17:19,  8.55s/it] 31%|███       | 1191/3837 [2:37:02<6:12:24,  8.44s/it] 31%|███       | 1192/3837 [2:37:08<5:52:50,  8.00s/it] 31%|███       | 1193/3837 [2:37:17<5:55:20,  8.06s/it] 31%|███       | 1194/3837 [2:37:24<5:41:00,  7.74s/it] 31%|███       | 1195/3837 [2:37:32<5:46:55,  7.88s/it] 31%|███       | 1196/3837 [2:37:40<5:51:07,  7.98s/it] 31%|███       | 1197/3837 [2:37:48<5:53:48,  8.04s/it] 31%|███       | 1198/3837 [2:37:57<5:57:19,  8.12s/it] 31%|███       | 1199/3837 [2:38:06<6:14:48,  8.52s/it] 31%|███▏      | 1200/3837 [2:38:13<5:54:27,  8.07s/it]                                                       {'loss': 4.7065, 'grad_norm': 10.343523025512695, 'learning_rate': 1.6096262485149782e-05, 'epoch': 0.31}
 31%|███▏      | 1200/3837 [2:38:13<5:54:27,  8.07s/it] 31%|███▏      | 1201/3837 [2:38:20<5:39:26,  7.73s/it] 31%|███▏      | 1202/3837 [2:38:27<5:28:53,  7.49s/it] 31%|███▏      | 1203/3837 [2:38:34<5:21:50,  7.33s/it] 31%|███▏      | 1204/3837 [2:38:42<5:33:18,  7.60s/it] 31%|███▏      | 1205/3837 [2:38:50<5:41:41,  7.79s/it] 31%|███▏      | 1206/3837 [2:38:59<5:46:58,  7.91s/it] 31%|███▏      | 1207/3837 [2:39:06<5:34:20,  7.63s/it] 31%|███▏      | 1208/3837 [2:39:13<5:35:47,  7.66s/it] 32%|███▏      | 1209/3837 [2:39:21<5:43:14,  7.84s/it] 32%|███▏      | 1210/3837 [2:39:30<5:47:53,  7.95s/it] 32%|███▏      | 1211/3837 [2:39:39<6:08:56,  8.43s/it] 32%|███▏      | 1212/3837 [2:39:47<6:06:08,  8.37s/it] 32%|███▏      | 1213/3837 [2:39:56<6:04:12,  8.33s/it] 32%|███▏      | 1214/3837 [2:40:03<5:52:34,  8.07s/it] 32%|███▏      | 1215/3837 [2:40:11<5:53:44,  8.09s/it] 32%|███▏      | 1216/3837 [2:40:19<5:54:20,  8.11s/it] 32%|███▏      | 1217/3837 [2:40:28<5:55:33,  8.14s/it] 32%|███▏      | 1218/3837 [2:40:35<5:40:12,  7.79s/it] 32%|███▏      | 1219/3837 [2:40:43<5:45:34,  7.92s/it] 32%|███▏      | 1220/3837 [2:40:51<5:49:20,  8.01s/it]                                                       {'loss': 4.731, 'grad_norm': 8.976643562316895, 'learning_rate': 1.59615483248351e-05, 'epoch': 0.32}
 32%|███▏      | 1220/3837 [2:40:51<5:49:20,  8.01s/it] 32%|███▏      | 1221/3837 [2:40:59<5:51:21,  8.06s/it] 32%|███▏      | 1222/3837 [2:41:07<5:53:14,  8.10s/it] 32%|███▏      | 1223/3837 [2:41:16<5:53:50,  8.12s/it] 32%|███▏      | 1224/3837 [2:41:24<5:55:25,  8.16s/it] 32%|███▏      | 1225/3837 [2:41:32<5:55:29,  8.17s/it] 32%|███▏      | 1226/3837 [2:41:39<5:39:53,  7.81s/it] 32%|███▏      | 1227/3837 [2:41:45<5:11:41,  7.17s/it] 32%|███▏      | 1228/3837 [2:41:53<5:25:14,  7.48s/it] 32%|███▏      | 1229/3837 [2:42:01<5:34:40,  7.70s/it] 32%|███▏      | 1230/3837 [2:42:09<5:40:36,  7.84s/it] 32%|███▏      | 1231/3837 [2:42:18<5:45:31,  7.96s/it] 32%|███▏      | 1232/3837 [2:42:26<5:48:43,  8.03s/it] 32%|███▏      | 1233/3837 [2:42:34<5:51:11,  8.09s/it] 32%|███▏      | 1234/3837 [2:42:41<5:36:20,  7.75s/it] 32%|███▏      | 1235/3837 [2:42:48<5:26:20,  7.53s/it] 32%|███▏      | 1236/3837 [2:42:56<5:34:33,  7.72s/it] 32%|███▏      | 1237/3837 [2:43:04<5:41:11,  7.87s/it] 32%|███▏      | 1238/3837 [2:43:13<5:45:24,  7.97s/it] 32%|███▏      | 1239/3837 [2:43:20<5:32:19,  7.67s/it] 32%|███▏      | 1240/3837 [2:43:28<5:38:45,  7.83s/it]                                                       {'loss': 4.6483, 'grad_norm': 11.200462341308594, 'learning_rate': 1.582513439848778e-05, 'epoch': 0.32}
 32%|███▏      | 1240/3837 [2:43:28<5:38:45,  7.83s/it] 32%|███▏      | 1241/3837 [2:43:36<5:43:37,  7.94s/it] 32%|███▏      | 1242/3837 [2:43:44<5:46:49,  8.02s/it] 32%|███▏      | 1243/3837 [2:43:52<5:49:22,  8.08s/it] 32%|███▏      | 1244/3837 [2:43:59<5:34:24,  7.74s/it] 32%|███▏      | 1245/3837 [2:44:08<5:41:13,  7.90s/it] 32%|███▏      | 1246/3837 [2:44:15<5:29:37,  7.63s/it] 32%|███▏      | 1247/3837 [2:44:23<5:36:58,  7.81s/it] 33%|███▎      | 1248/3837 [2:44:31<5:42:19,  7.93s/it] 33%|███▎      | 1249/3837 [2:44:39<5:46:38,  8.04s/it] 33%|███▎      | 1250/3837 [2:44:47<5:48:40,  8.09s/it] 33%|███▎      | 1251/3837 [2:44:57<6:06:47,  8.51s/it] 33%|███▎      | 1252/3837 [2:45:04<5:46:03,  8.03s/it] 33%|███▎      | 1253/3837 [2:45:11<5:31:48,  7.70s/it] 33%|███▎      | 1254/3837 [2:45:19<5:38:15,  7.86s/it] 33%|███▎      | 1255/3837 [2:45:26<5:25:44,  7.57s/it] 33%|███▎      | 1256/3837 [2:45:33<5:18:15,  7.40s/it] 33%|███▎      | 1257/3837 [2:45:41<5:27:43,  7.62s/it] 33%|███▎      | 1258/3837 [2:45:49<5:36:04,  7.82s/it] 33%|███▎      | 1259/3837 [2:45:58<5:41:36,  7.95s/it] 33%|███▎      | 1260/3837 [2:46:05<5:28:39,  7.65s/it]                                                       {'loss': 4.5154, 'grad_norm': 6.709898948669434, 'learning_rate': 1.5687059600661013e-05, 'epoch': 0.33}
 33%|███▎      | 1260/3837 [2:46:05<5:28:39,  7.65s/it] 33%|███▎      | 1261/3837 [2:46:13<5:35:51,  7.82s/it] 33%|███▎      | 1262/3837 [2:46:21<5:40:27,  7.93s/it] 33%|███▎      | 1263/3837 [2:46:29<5:45:29,  8.05s/it] 33%|███▎      | 1264/3837 [2:46:38<5:47:16,  8.10s/it] 33%|███▎      | 1265/3837 [2:46:46<5:48:34,  8.13s/it] 33%|███▎      | 1266/3837 [2:46:54<5:49:41,  8.16s/it] 33%|███▎      | 1267/3837 [2:47:02<5:49:24,  8.16s/it] 33%|███▎      | 1268/3837 [2:47:09<5:33:31,  7.79s/it] 33%|███▎      | 1269/3837 [2:47:16<5:22:52,  7.54s/it] 33%|███▎      | 1270/3837 [2:47:24<5:31:28,  7.75s/it] 33%|███▎      | 1271/3837 [2:47:31<5:21:11,  7.51s/it] 33%|███▎      | 1272/3837 [2:47:39<5:29:50,  7.72s/it] 33%|███▎      | 1273/3837 [2:47:48<5:35:59,  7.86s/it] 33%|███▎      | 1274/3837 [2:47:55<5:23:40,  7.58s/it] 33%|███▎      | 1275/3837 [2:48:02<5:16:57,  7.42s/it] 33%|███▎      | 1276/3837 [2:48:09<5:11:01,  7.29s/it] 33%|███▎      | 1277/3837 [2:48:17<5:22:40,  7.56s/it] 33%|███▎      | 1278/3837 [2:48:25<5:31:08,  7.76s/it] 33%|███▎      | 1279/3837 [2:48:33<5:36:21,  7.89s/it] 33%|███▎      | 1280/3837 [2:48:41<5:41:17,  8.01s/it]                                                       {'loss': 4.6797, 'grad_norm': 11.119974136352539, 'learning_rate': 1.5547363299458268e-05, 'epoch': 0.33}
 33%|███▎      | 1280/3837 [2:48:41<5:41:17,  8.01s/it] 33%|███▎      | 1281/3837 [2:48:48<5:28:23,  7.71s/it] 33%|███▎      | 1282/3837 [2:48:55<5:18:37,  7.48s/it] 33%|███▎      | 1283/3837 [2:49:02<5:12:10,  7.33s/it] 33%|███▎      | 1284/3837 [2:49:11<5:24:05,  7.62s/it] 33%|███▎      | 1285/3837 [2:49:18<5:15:56,  7.43s/it] 34%|███▎      | 1286/3837 [2:49:25<5:09:41,  7.28s/it] 34%|███▎      | 1287/3837 [2:49:33<5:20:45,  7.55s/it] 34%|███▎      | 1288/3837 [2:49:40<5:13:50,  7.39s/it] 34%|███▎      | 1289/3837 [2:49:47<5:07:46,  7.25s/it] 34%|███▎      | 1290/3837 [2:49:55<5:19:58,  7.54s/it] 34%|███▎      | 1291/3837 [2:50:03<5:27:50,  7.73s/it] 34%|███▎      | 1292/3837 [2:50:11<5:33:49,  7.87s/it] 34%|███▎      | 1293/3837 [2:50:20<5:38:12,  7.98s/it] 34%|███▎      | 1294/3837 [2:50:28<5:42:03,  8.07s/it] 34%|███▍      | 1295/3837 [2:50:35<5:27:59,  7.74s/it] 34%|███▍      | 1296/3837 [2:50:43<5:33:59,  7.89s/it] 34%|███▍      | 1297/3837 [2:50:53<5:54:29,  8.37s/it] 34%|███▍      | 1298/3837 [2:51:01<5:52:11,  8.32s/it] 34%|███▍      | 1299/3837 [2:51:09<5:50:40,  8.29s/it] 34%|███▍      | 1300/3837 [2:51:17<5:49:01,  8.25s/it]                                                       {'loss': 4.5969, 'grad_norm': 11.923408508300781, 'learning_rate': 1.540608532530861e-05, 'epoch': 0.34}
 34%|███▍      | 1300/3837 [2:51:17<5:49:01,  8.25s/it] 34%|███▍      | 1301/3837 [2:51:25<5:48:24,  8.24s/it] 34%|███▍      | 1302/3837 [2:51:32<5:31:54,  7.86s/it] 34%|███▍      | 1303/3837 [2:51:39<5:21:49,  7.62s/it] 34%|███▍      | 1304/3837 [2:51:48<5:29:38,  7.81s/it] 34%|███▍      | 1305/3837 [2:51:56<5:35:20,  7.95s/it] 34%|███▍      | 1306/3837 [2:52:04<5:39:10,  8.04s/it] 34%|███▍      | 1307/3837 [2:52:12<5:41:52,  8.11s/it] 34%|███▍      | 1308/3837 [2:52:21<5:42:50,  8.13s/it] 34%|███▍      | 1309/3837 [2:52:29<5:43:38,  8.16s/it] 34%|███▍      | 1310/3837 [2:52:36<5:28:37,  7.80s/it] 34%|███▍      | 1311/3837 [2:52:44<5:33:24,  7.92s/it] 34%|███▍      | 1312/3837 [2:52:52<5:36:52,  8.00s/it] 34%|███▍      | 1313/3837 [2:52:59<5:23:29,  7.69s/it] 34%|███▍      | 1314/3837 [2:53:07<5:29:28,  7.84s/it] 34%|███▍      | 1315/3837 [2:53:14<5:18:17,  7.57s/it] 34%|███▍      | 1316/3837 [2:53:22<5:25:47,  7.75s/it] 34%|███▍      | 1317/3837 [2:53:29<5:15:49,  7.52s/it] 34%|███▍      | 1318/3837 [2:53:36<5:07:40,  7.33s/it] 34%|███▍      | 1319/3837 [2:53:43<5:02:53,  7.22s/it] 34%|███▍      | 1320/3837 [2:53:51<5:15:33,  7.52s/it]                                                       {'loss': 4.5394, 'grad_norm': 10.654644012451172, 'learning_rate': 1.5263265959610183e-05, 'epoch': 0.34}
 34%|███▍      | 1320/3837 [2:53:52<5:15:33,  7.52s/it] 34%|███▍      | 1321/3837 [2:54:00<5:25:31,  7.76s/it] 34%|███▍      | 1322/3837 [2:54:08<5:30:16,  7.88s/it] 34%|███▍      | 1323/3837 [2:54:16<5:33:51,  7.97s/it] 35%|███▍      | 1324/3837 [2:54:24<5:36:38,  8.04s/it] 35%|███▍      | 1325/3837 [2:54:33<5:39:12,  8.10s/it] 35%|███▍      | 1326/3837 [2:54:40<5:24:28,  7.75s/it] 35%|███▍      | 1327/3837 [2:54:48<5:30:45,  7.91s/it] 35%|███▍      | 1328/3837 [2:54:55<5:18:27,  7.62s/it] 35%|███▍      | 1329/3837 [2:55:03<5:25:28,  7.79s/it] 35%|███▍      | 1330/3837 [2:55:12<5:46:36,  8.30s/it] 35%|███▍      | 1331/3837 [2:55:21<5:45:30,  8.27s/it] 35%|███▍      | 1332/3837 [2:55:30<6:00:45,  8.64s/it] 35%|███▍      | 1333/3837 [2:55:37<5:39:21,  8.13s/it] 35%|███▍      | 1334/3837 [2:55:44<5:25:06,  7.79s/it] 35%|███▍      | 1335/3837 [2:55:51<5:14:11,  7.53s/it] 35%|███▍      | 1336/3837 [2:55:58<5:06:56,  7.36s/it] 35%|███▍      | 1337/3837 [2:56:06<5:17:50,  7.63s/it] 35%|███▍      | 1338/3837 [2:56:13<5:09:31,  7.43s/it] 35%|███▍      | 1339/3837 [2:56:23<5:34:27,  8.03s/it] 35%|███▍      | 1340/3837 [2:56:31<5:36:51,  8.09s/it]                                                       {'loss': 4.5829, 'grad_norm': 11.394500732421875, 'learning_rate': 1.5118945923245113e-05, 'epoch': 0.35}
 35%|███▍      | 1340/3837 [2:56:31<5:36:51,  8.09s/it] 35%|███▍      | 1341/3837 [2:56:38<5:22:10,  7.74s/it] 35%|███▍      | 1342/3837 [2:56:46<5:27:38,  7.88s/it] 35%|███▌      | 1343/3837 [2:56:54<5:31:24,  7.97s/it] 35%|███▌      | 1344/3837 [2:57:01<5:18:35,  7.67s/it] 35%|███▌      | 1345/3837 [2:57:09<5:25:26,  7.84s/it] 35%|███▌      | 1346/3837 [2:57:18<5:29:31,  7.94s/it] 35%|███▌      | 1347/3837 [2:57:26<5:33:16,  8.03s/it] 35%|███▌      | 1348/3837 [2:57:33<5:20:31,  7.73s/it] 35%|███▌      | 1349/3837 [2:57:41<5:26:11,  7.87s/it] 35%|███▌      | 1350/3837 [2:57:49<5:30:30,  7.97s/it] 35%|███▌      | 1351/3837 [2:57:59<5:49:02,  8.42s/it] 35%|███▌      | 1352/3837 [2:58:08<6:01:48,  8.74s/it] 35%|███▌      | 1353/3837 [2:58:16<5:54:27,  8.56s/it] 35%|███▌      | 1354/3837 [2:58:23<5:34:26,  8.08s/it] 35%|███▌      | 1355/3837 [2:58:31<5:35:11,  8.10s/it] 35%|███▌      | 1356/3837 [2:58:38<5:20:57,  7.76s/it] 35%|███▌      | 1357/3837 [2:58:47<5:25:58,  7.89s/it] 35%|███▌      | 1358/3837 [2:58:55<5:31:16,  8.02s/it] 35%|███▌      | 1359/3837 [2:59:04<5:49:29,  8.46s/it] 35%|███▌      | 1360/3837 [2:59:11<5:31:32,  8.03s/it]                                                       {'loss': 4.5676, 'grad_norm': 6.991122722625732, 'learning_rate': 1.4973166364969098e-05, 'epoch': 0.35}
 35%|███▌      | 1360/3837 [2:59:11<5:31:32,  8.03s/it] 35%|███▌      | 1361/3837 [2:59:18<5:18:38,  7.72s/it] 35%|███▌      | 1362/3837 [2:59:25<5:08:52,  7.49s/it] 36%|███▌      | 1363/3837 [2:59:34<5:18:07,  7.72s/it] 36%|███▌      | 1364/3837 [2:59:42<5:23:37,  7.85s/it] 36%|███▌      | 1365/3837 [2:59:49<5:12:21,  7.58s/it] 36%|███▌      | 1366/3837 [2:59:57<5:21:53,  7.82s/it] 36%|███▌      | 1367/3837 [3:00:04<5:12:09,  7.58s/it] 36%|███▌      | 1368/3837 [3:00:11<5:04:25,  7.40s/it] 36%|███▌      | 1369/3837 [3:00:19<5:14:00,  7.63s/it] 36%|███▌      | 1370/3837 [3:00:29<5:36:29,  8.18s/it] 36%|███▌      | 1371/3837 [3:00:36<5:20:21,  7.79s/it] 36%|███▌      | 1372/3837 [3:00:44<5:24:36,  7.90s/it] 36%|███▌      | 1373/3837 [3:00:52<5:28:43,  8.00s/it] 36%|███▌      | 1374/3837 [3:01:00<5:31:22,  8.07s/it] 36%|███▌      | 1375/3837 [3:01:08<5:33:02,  8.12s/it] 36%|███▌      | 1376/3837 [3:01:15<5:19:14,  7.78s/it] 36%|███▌      | 1377/3837 [3:01:22<5:08:55,  7.53s/it] 36%|███▌      | 1378/3837 [3:01:31<5:16:56,  7.73s/it] 36%|███▌      | 1379/3837 [3:01:39<5:22:19,  7.87s/it] 36%|███▌      | 1380/3837 [3:01:46<5:10:19,  7.58s/it]                                                       {'loss': 4.4946, 'grad_norm': 11.425314903259277, 'learning_rate': 1.4825968849679033e-05, 'epoch': 0.36}
 36%|███▌      | 1380/3837 [3:01:46<5:10:19,  7.58s/it] 36%|███▌      | 1381/3837 [3:01:54<5:18:02,  7.77s/it] 36%|███▌      | 1382/3837 [3:02:02<5:23:19,  7.90s/it] 36%|███▌      | 1383/3837 [3:02:10<5:27:21,  8.00s/it] 36%|███▌      | 1384/3837 [3:02:19<5:30:21,  8.08s/it] 36%|███▌      | 1385/3837 [3:02:26<5:16:29,  7.74s/it] 36%|███▌      | 1386/3837 [3:02:33<5:06:55,  7.51s/it] 36%|███▌      | 1387/3837 [3:02:41<5:15:23,  7.72s/it] 36%|███▌      | 1388/3837 [3:02:49<5:22:12,  7.89s/it] 36%|███▌      | 1389/3837 [3:02:57<5:26:07,  7.99s/it] 36%|███▌      | 1390/3837 [3:03:07<5:44:18,  8.44s/it] 36%|███▋      | 1391/3837 [3:03:15<5:41:12,  8.37s/it] 36%|███▋      | 1392/3837 [3:03:23<5:38:51,  8.32s/it] 36%|███▋      | 1393/3837 [3:03:30<5:21:44,  7.90s/it] 36%|███▋      | 1394/3837 [3:03:37<5:09:37,  7.60s/it] 36%|███▋      | 1395/3837 [3:03:43<4:47:09,  7.06s/it] 36%|███▋      | 1396/3837 [3:03:51<5:02:13,  7.43s/it] 36%|███▋      | 1397/3837 [3:03:58<4:56:35,  7.29s/it] 36%|███▋      | 1398/3837 [3:04:06<5:07:40,  7.57s/it] 36%|███▋      | 1399/3837 [3:04:13<5:00:14,  7.39s/it] 36%|███▋      | 1400/3837 [3:04:22<5:10:55,  7.66s/it]                                                       {'loss': 4.44, 'grad_norm': 9.472877502441406, 'learning_rate': 1.467739534656194e-05, 'epoch': 0.36}
 36%|███▋      | 1400/3837 [3:04:22<5:10:55,  7.66s/it] 37%|███▋      | 1401/3837 [3:04:30<5:17:09,  7.81s/it] 37%|███▋      | 1402/3837 [3:04:38<5:21:40,  7.93s/it] 37%|███▋      | 1403/3837 [3:04:45<5:09:02,  7.62s/it] 37%|███▋      | 1404/3837 [3:04:54<5:31:00,  8.16s/it] 37%|███▋      | 1405/3837 [3:05:01<5:16:29,  7.81s/it] 37%|███▋      | 1406/3837 [3:05:11<5:37:16,  8.32s/it] 37%|███▋      | 1407/3837 [3:05:19<5:36:46,  8.32s/it] 37%|███▋      | 1408/3837 [3:05:27<5:35:58,  8.30s/it] 37%|███▋      | 1409/3837 [3:05:36<5:35:08,  8.28s/it] 37%|███▋      | 1410/3837 [3:05:44<5:34:20,  8.27s/it] 37%|███▋      | 1411/3837 [3:05:52<5:34:21,  8.27s/it] 37%|███▋      | 1412/3837 [3:05:59<5:18:25,  7.88s/it] 37%|███▋      | 1413/3837 [3:06:07<5:22:45,  7.99s/it] 37%|███▋      | 1414/3837 [3:06:15<5:25:11,  8.05s/it] 37%|███▋      | 1415/3837 [3:06:22<5:12:06,  7.73s/it] 37%|███▋      | 1416/3837 [3:06:31<5:19:32,  7.92s/it] 37%|███▋      | 1417/3837 [3:06:38<5:07:36,  7.63s/it] 37%|███▋      | 1418/3837 [3:06:45<4:59:06,  7.42s/it] 37%|███▋      | 1419/3837 [3:06:52<4:53:45,  7.29s/it] 37%|███▋      | 1420/3837 [3:07:00<5:04:51,  7.57s/it]                                                       {'loss': 4.4722, 'grad_norm': 9.878904342651367, 'learning_rate': 1.4527488217128644e-05, 'epoch': 0.37}
 37%|███▋      | 1420/3837 [3:07:00<5:04:51,  7.57s/it] 37%|███▋      | 1421/3837 [3:07:08<5:12:21,  7.76s/it] 37%|███▋      | 1422/3837 [3:07:15<5:02:55,  7.53s/it] 37%|███▋      | 1423/3837 [3:07:23<5:11:29,  7.74s/it] 37%|███▋      | 1424/3837 [3:07:32<5:17:03,  7.88s/it] 37%|███▋      | 1425/3837 [3:07:40<5:20:43,  7.98s/it] 37%|███▋      | 1426/3837 [3:07:47<5:08:22,  7.67s/it] 37%|███▋      | 1427/3837 [3:07:55<5:14:40,  7.83s/it] 37%|███▋      | 1428/3837 [3:08:03<5:18:49,  7.94s/it] 37%|███▋      | 1429/3837 [3:08:11<5:21:54,  8.02s/it] 37%|███▋      | 1430/3837 [3:08:18<5:08:16,  7.68s/it] 37%|███▋      | 1431/3837 [3:08:25<5:00:17,  7.49s/it] 37%|███▋      | 1432/3837 [3:08:33<5:09:16,  7.72s/it] 37%|███▋      | 1433/3837 [3:08:40<4:59:58,  7.49s/it] 37%|███▋      | 1434/3837 [3:08:47<4:53:34,  7.33s/it] 37%|███▋      | 1435/3837 [3:08:56<5:03:56,  7.59s/it] 37%|███▋      | 1436/3837 [3:09:04<5:10:54,  7.77s/it] 37%|███▋      | 1437/3837 [3:09:12<5:16:31,  7.91s/it] 37%|███▋      | 1438/3837 [3:09:22<5:35:24,  8.39s/it] 38%|███▊      | 1439/3837 [3:09:30<5:32:41,  8.32s/it] 38%|███▊      | 1440/3837 [3:09:37<5:15:23,  7.89s/it]                                                       {'loss': 4.5068, 'grad_norm': 10.297679901123047, 'learning_rate': 1.4376290203135617e-05, 'epoch': 0.38}
 38%|███▊      | 1440/3837 [3:09:37<5:15:23,  7.89s/it] 38%|███▊      | 1441/3837 [3:09:45<5:18:41,  7.98s/it] 38%|███▊      | 1442/3837 [3:09:52<5:06:31,  7.68s/it] 38%|███▊      | 1443/3837 [3:09:59<4:58:08,  7.47s/it] 38%|███▊      | 1444/3837 [3:10:07<5:06:36,  7.69s/it] 38%|███▊      | 1445/3837 [3:10:15<5:12:05,  7.83s/it] 38%|███▊      | 1446/3837 [3:10:22<5:02:10,  7.58s/it] 38%|███▊      | 1447/3837 [3:10:30<5:09:25,  7.77s/it] 38%|███▊      | 1448/3837 [3:10:39<5:14:29,  7.90s/it] 38%|███▊      | 1449/3837 [3:10:47<5:18:51,  8.01s/it] 38%|███▊      | 1450/3837 [3:10:54<5:07:37,  7.73s/it] 38%|███▊      | 1451/3837 [3:11:02<5:13:28,  7.88s/it] 38%|███▊      | 1452/3837 [3:11:10<5:17:25,  7.99s/it] 38%|███▊      | 1453/3837 [3:11:19<5:19:50,  8.05s/it] 38%|███▊      | 1454/3837 [3:11:26<5:06:56,  7.73s/it] 38%|███▊      | 1455/3837 [3:11:35<5:28:05,  8.26s/it] 38%|███▊      | 1456/3837 [3:11:43<5:27:23,  8.25s/it] 38%|███▊      | 1457/3837 [3:11:50<5:11:24,  7.85s/it] 38%|███▊      | 1458/3837 [3:11:57<5:00:36,  7.58s/it] 38%|███▊      | 1459/3837 [3:12:04<4:53:05,  7.40s/it] 38%|███▊      | 1460/3837 [3:12:12<5:02:09,  7.63s/it]                                                       {'loss': 4.5366, 'grad_norm': 10.653327941894531, 'learning_rate': 1.4223844414398358e-05, 'epoch': 0.38}
 38%|███▊      | 1460/3837 [3:12:12<5:02:09,  7.63s/it] 38%|███▊      | 1461/3837 [3:12:20<5:08:50,  7.80s/it] 38%|███▊      | 1462/3837 [3:12:30<5:28:57,  8.31s/it] 38%|███▊      | 1463/3837 [3:12:39<5:43:10,  8.67s/it] 38%|███▊      | 1464/3837 [3:12:48<5:38:04,  8.55s/it] 38%|███▊      | 1465/3837 [3:12:56<5:34:12,  8.45s/it] 38%|███▊      | 1466/3837 [3:13:04<5:31:28,  8.39s/it] 38%|███▊      | 1467/3837 [3:13:12<5:29:11,  8.33s/it] 38%|███▊      | 1468/3837 [3:13:19<5:13:37,  7.94s/it] 38%|███▊      | 1469/3837 [3:13:28<5:17:46,  8.05s/it] 38%|███▊      | 1470/3837 [3:13:37<5:35:12,  8.50s/it] 38%|███▊      | 1471/3837 [3:13:44<5:17:10,  8.04s/it] 38%|███▊      | 1472/3837 [3:13:53<5:19:39,  8.11s/it] 38%|███▊      | 1473/3837 [3:14:01<5:21:52,  8.17s/it] 38%|███▊      | 1474/3837 [3:14:09<5:25:47,  8.27s/it] 38%|███▊      | 1475/3837 [3:14:18<5:25:04,  8.26s/it] 38%|███▊      | 1476/3837 [3:14:25<5:09:43,  7.87s/it] 38%|███▊      | 1477/3837 [3:14:33<5:13:39,  7.97s/it] 39%|███▊      | 1478/3837 [3:14:41<5:16:24,  8.05s/it] 39%|███▊      | 1479/3837 [3:14:49<5:19:01,  8.12s/it] 39%|███▊      | 1480/3837 [3:14:57<5:20:09,  8.15s/it]                                                       {'loss': 4.5074, 'grad_norm': 10.97577953338623, 'learning_rate': 1.4070194316499866e-05, 'epoch': 0.39}
 39%|███▊      | 1480/3837 [3:14:57<5:20:09,  8.15s/it] 39%|███▊      | 1481/3837 [3:15:06<5:21:55,  8.20s/it] 39%|███▊      | 1482/3837 [3:15:13<5:06:31,  7.81s/it] 39%|███▊      | 1483/3837 [3:15:21<5:11:57,  7.95s/it] 39%|███▊      | 1484/3837 [3:15:29<5:15:12,  8.04s/it] 39%|███▊      | 1485/3837 [3:15:37<5:17:19,  8.10s/it] 39%|███▊      | 1486/3837 [3:15:44<5:03:25,  7.74s/it] 39%|███▉      | 1487/3837 [3:15:53<5:09:00,  7.89s/it] 39%|███▉      | 1488/3837 [3:16:01<5:12:44,  7.99s/it] 39%|███▉      | 1489/3837 [3:16:09<5:15:08,  8.05s/it] 39%|███▉      | 1490/3837 [3:16:16<5:02:06,  7.72s/it] 39%|███▉      | 1491/3837 [3:16:23<4:52:59,  7.49s/it] 39%|███▉      | 1492/3837 [3:16:30<4:46:49,  7.34s/it] 39%|███▉      | 1493/3837 [3:16:38<4:56:37,  7.59s/it] 39%|███▉      | 1494/3837 [3:16:45<4:48:44,  7.39s/it] 39%|███▉      | 1495/3837 [3:16:53<4:58:47,  7.65s/it] 39%|███▉      | 1496/3837 [3:17:01<5:05:05,  7.82s/it] 39%|███▉      | 1497/3837 [3:17:10<5:09:57,  7.95s/it] 39%|███▉      | 1498/3837 [3:17:18<5:12:21,  8.01s/it] 39%|███▉      | 1499/3837 [3:17:26<5:14:39,  8.07s/it] 39%|███▉      | 1500/3837 [3:17:33<5:02:17,  7.76s/it]                                                       {'loss': 4.321, 'grad_norm': 12.106425285339355, 'learning_rate': 1.3915383718397664e-05, 'epoch': 0.39}
 39%|███▉      | 1500/3837 [3:17:33<5:02:17,  7.76s/it] 39%|███▉      | 1501/3837 [3:17:40<4:52:17,  7.51s/it] 39%|███▉      | 1502/3837 [3:17:48<5:00:03,  7.71s/it] 39%|███▉      | 1503/3837 [3:17:56<5:06:00,  7.87s/it] 39%|███▉      | 1504/3837 [3:18:05<5:10:13,  7.98s/it] 39%|███▉      | 1505/3837 [3:18:12<4:58:38,  7.68s/it] 39%|███▉      | 1506/3837 [3:18:20<5:05:17,  7.86s/it] 39%|███▉      | 1507/3837 [3:18:28<5:08:53,  7.95s/it] 39%|███▉      | 1508/3837 [3:18:35<4:58:13,  7.68s/it] 39%|███▉      | 1509/3837 [3:18:42<4:49:39,  7.47s/it] 39%|███▉      | 1510/3837 [3:18:50<4:58:40,  7.70s/it] 39%|███▉      | 1511/3837 [3:18:59<5:03:49,  7.84s/it] 39%|███▉      | 1512/3837 [3:19:07<5:07:24,  7.93s/it] 39%|███▉      | 1513/3837 [3:19:14<4:55:50,  7.64s/it] 39%|███▉      | 1514/3837 [3:19:22<5:02:03,  7.80s/it] 39%|███▉      | 1515/3837 [3:19:30<5:07:17,  7.94s/it] 40%|███▉      | 1516/3837 [3:19:38<5:10:37,  8.03s/it] 40%|███▉      | 1517/3837 [3:19:45<4:58:40,  7.72s/it] 40%|███▉      | 1518/3837 [3:19:54<5:04:55,  7.89s/it] 40%|███▉      | 1519/3837 [3:20:02<5:09:33,  8.01s/it] 40%|███▉      | 1520/3837 [3:20:09<4:57:04,  7.69s/it]                                                       {'loss': 4.3908, 'grad_norm': 9.689359664916992, 'learning_rate': 1.3759456759932912e-05, 'epoch': 0.4}
 40%|███▉      | 1520/3837 [3:20:09<4:57:04,  7.69s/it] 40%|███▉      | 1521/3837 [3:20:17<5:03:17,  7.86s/it] 40%|███▉      | 1522/3837 [3:20:25<5:07:29,  7.97s/it] 40%|███▉      | 1523/3837 [3:20:34<5:09:48,  8.03s/it] 40%|███▉      | 1524/3837 [3:20:40<4:57:11,  7.71s/it] 40%|███▉      | 1525/3837 [3:20:49<5:03:00,  7.86s/it] 40%|███▉      | 1526/3837 [3:20:57<5:07:08,  7.97s/it] 40%|███▉      | 1527/3837 [3:21:05<5:09:58,  8.05s/it] 40%|███▉      | 1528/3837 [3:21:13<5:11:07,  8.08s/it] 40%|███▉      | 1529/3837 [3:21:22<5:12:48,  8.13s/it] 40%|███▉      | 1530/3837 [3:21:30<5:13:11,  8.15s/it] 40%|███▉      | 1531/3837 [3:21:38<5:13:21,  8.15s/it] 40%|███▉      | 1532/3837 [3:21:45<4:58:47,  7.78s/it] 40%|███▉      | 1533/3837 [3:21:53<5:04:10,  7.92s/it] 40%|███▉      | 1534/3837 [3:22:00<4:52:11,  7.61s/it] 40%|████      | 1535/3837 [3:22:09<5:13:43,  8.18s/it] 40%|████      | 1536/3837 [3:22:16<4:59:35,  7.81s/it] 40%|████      | 1537/3837 [3:22:25<5:04:14,  7.94s/it] 40%|████      | 1538/3837 [3:22:32<4:53:20,  7.66s/it] 40%|████      | 1539/3837 [3:22:40<4:59:39,  7.82s/it] 40%|████      | 1540/3837 [3:22:49<5:18:49,  8.33s/it]                                                       {'loss': 4.5258, 'grad_norm': 12.084403038024902, 'learning_rate': 1.3602457899245201e-05, 'epoch': 0.4}
 40%|████      | 1540/3837 [3:22:49<5:18:49,  8.33s/it] 40%|████      | 1541/3837 [3:22:56<5:03:08,  7.92s/it] 40%|████      | 1542/3837 [3:23:05<5:06:48,  8.02s/it] 40%|████      | 1543/3837 [3:23:12<4:54:18,  7.70s/it] 40%|████      | 1544/3837 [3:23:20<5:00:11,  7.86s/it] 40%|████      | 1545/3837 [3:23:28<5:03:51,  7.95s/it] 40%|████      | 1546/3837 [3:23:36<5:08:01,  8.07s/it] 40%|████      | 1547/3837 [3:23:45<5:09:45,  8.12s/it] 40%|████      | 1548/3837 [3:23:53<5:10:25,  8.14s/it] 40%|████      | 1549/3837 [3:24:01<5:11:25,  8.17s/it] 40%|████      | 1550/3837 [3:24:08<4:56:28,  7.78s/it] 40%|████      | 1551/3837 [3:24:17<5:15:51,  8.29s/it] 40%|████      | 1552/3837 [3:24:26<5:14:51,  8.27s/it] 40%|████      | 1553/3837 [3:24:34<5:14:27,  8.26s/it] 41%|████      | 1554/3837 [3:24:41<4:58:42,  7.85s/it] 41%|████      | 1555/3837 [3:24:49<5:03:20,  7.98s/it] 41%|████      | 1556/3837 [3:24:57<5:05:53,  8.05s/it] 41%|████      | 1557/3837 [3:25:05<5:07:43,  8.10s/it] 41%|████      | 1558/3837 [3:25:14<5:09:15,  8.14s/it] 41%|████      | 1559/3837 [3:25:21<4:55:18,  7.78s/it] 41%|████      | 1560/3837 [3:25:28<4:46:01,  7.54s/it]                                                       {'loss': 4.5137, 'grad_norm': 10.707210540771484, 'learning_rate': 1.3444431900096557e-05, 'epoch': 0.41}
 41%|████      | 1560/3837 [3:25:28<4:46:01,  7.54s/it] 41%|████      | 1561/3837 [3:25:34<4:38:38,  7.35s/it] 41%|████      | 1562/3837 [3:25:41<4:33:05,  7.20s/it] 41%|████      | 1563/3837 [3:25:50<4:44:35,  7.51s/it] 41%|████      | 1564/3837 [3:25:58<4:52:53,  7.73s/it] 41%|████      | 1565/3837 [3:26:06<4:58:12,  7.88s/it] 41%|████      | 1566/3837 [3:26:13<4:47:23,  7.59s/it] 41%|████      | 1567/3837 [3:26:20<4:40:26,  7.41s/it] 41%|████      | 1568/3837 [3:26:27<4:34:00,  7.25s/it] 41%|████      | 1569/3837 [3:26:35<4:45:01,  7.54s/it] 41%|████      | 1570/3837 [3:26:42<4:38:49,  7.38s/it] 41%|████      | 1571/3837 [3:26:49<4:33:55,  7.25s/it] 41%|████      | 1572/3837 [3:26:58<4:56:40,  7.86s/it] 41%|████      | 1573/3837 [3:27:06<5:00:41,  7.97s/it] 41%|████      | 1574/3837 [3:27:15<5:03:54,  8.06s/it] 41%|████      | 1575/3837 [3:27:23<5:04:46,  8.08s/it] 41%|████      | 1576/3837 [3:27:30<4:51:31,  7.74s/it] 41%|████      | 1577/3837 [3:27:38<4:57:13,  7.89s/it] 41%|████      | 1578/3837 [3:27:45<4:45:44,  7.59s/it] 41%|████      | 1579/3837 [3:27:52<4:38:54,  7.41s/it] 41%|████      | 1580/3837 [3:28:00<4:47:36,  7.65s/it]                                                       {'loss': 4.3159, 'grad_norm': 11.177115440368652, 'learning_rate': 1.3285423819108349e-05, 'epoch': 0.41}
 41%|████      | 1580/3837 [3:28:00<4:47:36,  7.65s/it] 41%|████      | 1581/3837 [3:28:07<4:39:22,  7.43s/it] 41%|████      | 1582/3837 [3:28:14<4:33:36,  7.28s/it] 41%|████▏     | 1583/3837 [3:28:21<4:29:37,  7.18s/it] 41%|████▏     | 1584/3837 [3:28:29<4:41:51,  7.51s/it] 41%|████▏     | 1585/3837 [3:28:37<4:50:17,  7.73s/it] 41%|████▏     | 1586/3837 [3:28:46<4:55:10,  7.87s/it] 41%|████▏     | 1587/3837 [3:28:54<4:58:14,  7.95s/it] 41%|████▏     | 1588/3837 [3:29:02<5:01:09,  8.03s/it] 41%|████▏     | 1589/3837 [3:29:10<5:03:20,  8.10s/it] 41%|████▏     | 1590/3837 [3:29:17<4:50:58,  7.77s/it] 41%|████▏     | 1591/3837 [3:29:25<4:55:43,  7.90s/it] 41%|████▏     | 1592/3837 [3:29:34<4:59:16,  8.00s/it] 42%|████▏     | 1593/3837 [3:29:42<5:01:09,  8.05s/it] 42%|████▏     | 1594/3837 [3:29:50<5:02:25,  8.09s/it] 42%|████▏     | 1595/3837 [3:29:57<4:50:25,  7.77s/it] 42%|████▏     | 1596/3837 [3:30:07<5:10:01,  8.30s/it] 42%|████▏     | 1597/3837 [3:30:15<5:09:04,  8.28s/it] 42%|████▏     | 1598/3837 [3:30:22<4:54:59,  7.91s/it] 42%|████▏     | 1599/3837 [3:30:30<4:58:58,  8.02s/it] 42%|████▏     | 1600/3837 [3:30:40<5:15:23,  8.46s/it]                                                       {'loss': 4.3277, 'grad_norm': 13.195289611816406, 'learning_rate': 1.3125478992914662e-05, 'epoch': 0.42}
 42%|████▏     | 1600/3837 [3:30:40<5:15:23,  8.46s/it] 42%|████▏     | 1601/3837 [3:30:48<5:12:23,  8.38s/it] 42%|████▏     | 1602/3837 [3:30:56<5:09:53,  8.32s/it] 42%|████▏     | 1603/3837 [3:31:04<5:08:59,  8.30s/it] 42%|████▏     | 1604/3837 [3:31:11<4:54:01,  7.90s/it] 42%|████▏     | 1605/3837 [3:31:19<4:57:13,  7.99s/it] 42%|████▏     | 1606/3837 [3:31:28<4:59:51,  8.06s/it] 42%|████▏     | 1607/3837 [3:31:35<4:47:26,  7.73s/it] 42%|████▏     | 1608/3837 [3:31:42<4:39:01,  7.51s/it] 42%|████▏     | 1609/3837 [3:31:50<4:47:40,  7.75s/it] 42%|████▏     | 1610/3837 [3:31:58<4:52:10,  7.87s/it] 42%|████▏     | 1611/3837 [3:32:06<4:55:24,  7.96s/it] 42%|████▏     | 1612/3837 [3:32:15<4:58:44,  8.06s/it] 42%|████▏     | 1613/3837 [3:32:23<5:00:42,  8.11s/it] 42%|████▏     | 1614/3837 [3:32:31<5:01:40,  8.14s/it] 42%|████▏     | 1615/3837 [3:32:38<4:48:47,  7.80s/it] 42%|████▏     | 1616/3837 [3:32:46<4:54:06,  7.95s/it] 42%|████▏     | 1617/3837 [3:32:56<5:11:13,  8.41s/it] 42%|████▏     | 1618/3837 [3:33:04<5:09:09,  8.36s/it] 42%|████▏     | 1619/3837 [3:33:13<5:21:36,  8.70s/it] 42%|████▏     | 1620/3837 [3:33:22<5:15:52,  8.55s/it]                                                       {'loss': 4.5388, 'grad_norm': 12.72652530670166, 'learning_rate': 1.2964643025235843e-05, 'epoch': 0.42}
 42%|████▏     | 1620/3837 [3:33:22<5:15:52,  8.55s/it] 42%|████▏     | 1621/3837 [3:33:30<5:12:03,  8.45s/it] 42%|████▏     | 1622/3837 [3:33:38<5:09:52,  8.39s/it] 42%|████▏     | 1623/3837 [3:33:46<5:08:10,  8.35s/it] 42%|████▏     | 1624/3837 [3:33:55<5:07:23,  8.33s/it] 42%|████▏     | 1625/3837 [3:34:02<4:51:53,  7.92s/it] 42%|████▏     | 1626/3837 [3:34:10<4:55:10,  8.01s/it] 42%|████▏     | 1627/3837 [3:34:17<4:44:24,  7.72s/it] 42%|████▏     | 1628/3837 [3:34:25<4:50:33,  7.89s/it] 42%|████▏     | 1629/3837 [3:34:34<4:54:48,  8.01s/it] 42%|████▏     | 1630/3837 [3:34:42<4:56:30,  8.06s/it] 43%|████▎     | 1631/3837 [3:34:49<4:43:34,  7.71s/it] 43%|████▎     | 1632/3837 [3:34:57<4:49:20,  7.87s/it] 43%|████▎     | 1633/3837 [3:35:05<4:53:03,  7.98s/it] 43%|████▎     | 1634/3837 [3:35:13<4:55:12,  8.04s/it] 43%|████▎     | 1635/3837 [3:35:21<4:57:20,  8.10s/it] 43%|████▎     | 1636/3837 [3:35:30<4:59:12,  8.16s/it] 43%|████▎     | 1637/3837 [3:35:38<5:00:07,  8.19s/it] 43%|████▎     | 1638/3837 [3:35:46<4:59:55,  8.18s/it] 43%|████▎     | 1639/3837 [3:35:53<4:46:13,  7.81s/it] 43%|████▎     | 1640/3837 [3:36:01<4:50:26,  7.93s/it]                                                       {'loss': 4.2879, 'grad_norm': 11.687650680541992, 'learning_rate': 1.2802961773875907e-05, 'epoch': 0.43}
 43%|████▎     | 1640/3837 [3:36:01<4:50:26,  7.93s/it] 43%|████▎     | 1641/3837 [3:36:08<4:40:16,  7.66s/it] 43%|████▎     | 1642/3837 [3:36:18<5:00:43,  8.22s/it] 43%|████▎     | 1643/3837 [3:36:26<5:01:05,  8.23s/it] 43%|████▎     | 1644/3837 [3:36:34<5:01:06,  8.24s/it] 43%|████▎     | 1645/3837 [3:36:43<5:02:26,  8.28s/it] 43%|████▎     | 1646/3837 [3:36:51<5:01:34,  8.26s/it] 43%|████▎     | 1647/3837 [3:36:58<4:47:33,  7.88s/it] 43%|████▎     | 1648/3837 [3:37:05<4:37:51,  7.62s/it] 43%|████▎     | 1649/3837 [3:37:13<4:44:29,  7.80s/it] 43%|████▎     | 1650/3837 [3:37:19<4:23:49,  7.24s/it] 43%|████▎     | 1651/3837 [3:37:27<4:34:42,  7.54s/it] 43%|████▎     | 1652/3837 [3:37:36<4:43:21,  7.78s/it] 43%|████▎     | 1653/3837 [3:37:44<4:47:48,  7.91s/it] 43%|████▎     | 1654/3837 [3:37:52<4:51:11,  8.00s/it] 43%|████▎     | 1655/3837 [3:38:00<4:53:18,  8.07s/it] 43%|████▎     | 1656/3837 [3:38:09<4:55:04,  8.12s/it] 43%|████▎     | 1657/3837 [3:38:17<4:56:39,  8.16s/it] 43%|████▎     | 1658/3837 [3:38:25<4:56:53,  8.18s/it] 43%|████▎     | 1659/3837 [3:38:32<4:43:58,  7.82s/it] 43%|████▎     | 1660/3837 [3:38:42<5:02:53,  8.35s/it]                                                       {'loss': 4.3405, 'grad_norm': 11.69050407409668, 'learning_rate': 1.2640481337647472e-05, 'epoch': 0.43}
 43%|████▎     | 1660/3837 [3:38:42<5:02:53,  8.35s/it] 43%|████▎     | 1661/3837 [3:38:50<5:02:43,  8.35s/it] 43%|████▎     | 1662/3837 [3:38:58<5:00:37,  8.29s/it] 43%|████▎     | 1663/3837 [3:39:05<4:45:43,  7.89s/it] 43%|████▎     | 1664/3837 [3:39:13<4:49:22,  7.99s/it] 43%|████▎     | 1665/3837 [3:39:22<4:51:48,  8.06s/it] 43%|████▎     | 1666/3837 [3:39:30<4:54:26,  8.14s/it] 43%|████▎     | 1667/3837 [3:39:37<4:41:25,  7.78s/it] 43%|████▎     | 1668/3837 [3:39:45<4:46:29,  7.93s/it] 43%|████▎     | 1669/3837 [3:39:55<5:03:56,  8.41s/it] 44%|████▎     | 1670/3837 [3:40:03<5:02:25,  8.37s/it] 44%|████▎     | 1671/3837 [3:40:11<5:00:59,  8.34s/it] 44%|████▎     | 1672/3837 [3:40:19<4:59:30,  8.30s/it] 44%|████▎     | 1673/3837 [3:40:28<4:58:18,  8.27s/it] 44%|████▎     | 1674/3837 [3:40:35<4:44:20,  7.89s/it] 44%|████▎     | 1675/3837 [3:40:43<4:48:17,  8.00s/it] 44%|████▎     | 1676/3837 [3:40:51<4:50:35,  8.07s/it] 44%|████▎     | 1677/3837 [3:40:59<4:52:01,  8.11s/it] 44%|████▎     | 1678/3837 [3:41:07<4:52:39,  8.13s/it] 44%|████▍     | 1679/3837 [3:41:14<4:39:48,  7.78s/it] 44%|████▍     | 1680/3837 [3:41:23<4:44:45,  7.92s/it]                                                       {'loss': 4.3927, 'grad_norm': 8.719404220581055, 'learning_rate': 1.247724804322802e-05, 'epoch': 0.44}
 44%|████▍     | 1680/3837 [3:41:23<4:44:45,  7.92s/it] 44%|████▍     | 1681/3837 [3:41:32<5:01:44,  8.40s/it] 44%|████▍     | 1682/3837 [3:41:42<5:13:29,  8.73s/it] 44%|████▍     | 1683/3837 [3:41:49<4:54:36,  8.21s/it] 44%|████▍     | 1684/3837 [3:41:57<4:54:49,  8.22s/it] 44%|████▍     | 1685/3837 [3:42:06<5:08:42,  8.61s/it] 44%|████▍     | 1686/3837 [3:42:15<5:04:29,  8.49s/it] 44%|████▍     | 1687/3837 [3:42:23<5:01:01,  8.40s/it] 44%|████▍     | 1688/3837 [3:42:31<4:59:03,  8.35s/it] 44%|████▍     | 1689/3837 [3:42:39<4:57:49,  8.32s/it] 44%|████▍     | 1690/3837 [3:42:48<4:56:22,  8.28s/it] 44%|████▍     | 1691/3837 [3:42:56<4:56:01,  8.28s/it] 44%|████▍     | 1692/3837 [3:43:04<4:55:11,  8.26s/it] 44%|████▍     | 1693/3837 [3:43:12<4:54:29,  8.24s/it] 44%|████▍     | 1694/3837 [3:43:20<4:53:51,  8.23s/it] 44%|████▍     | 1695/3837 [3:43:29<4:53:34,  8.22s/it] 44%|████▍     | 1696/3837 [3:43:36<4:39:46,  7.84s/it] 44%|████▍     | 1697/3837 [3:43:44<4:43:39,  7.95s/it] 44%|████▍     | 1698/3837 [3:43:51<4:34:04,  7.69s/it] 44%|████▍     | 1699/3837 [3:43:59<4:40:06,  7.86s/it] 44%|████▍     | 1700/3837 [3:44:09<4:57:57,  8.37s/it]                                                       {'loss': 4.3052, 'grad_norm': 10.368812561035156, 'learning_rate': 1.2313308431951119e-05, 'epoch': 0.44}
 44%|████▍     | 1700/3837 [3:44:09<4:57:57,  8.37s/it] 44%|████▍     | 1701/3837 [3:44:16<4:42:26,  7.93s/it] 44%|████▍     | 1702/3837 [3:44:23<4:32:43,  7.66s/it] 44%|████▍     | 1703/3837 [3:44:30<4:25:16,  7.46s/it] 44%|████▍     | 1704/3837 [3:44:38<4:33:14,  7.69s/it] 44%|████▍     | 1705/3837 [3:44:45<4:25:00,  7.46s/it] 44%|████▍     | 1706/3837 [3:44:53<4:32:45,  7.68s/it] 44%|████▍     | 1707/3837 [3:45:00<4:25:32,  7.48s/it] 45%|████▍     | 1708/3837 [3:45:07<4:19:57,  7.33s/it] 45%|████▍     | 1709/3837 [3:45:15<4:29:11,  7.59s/it] 45%|████▍     | 1710/3837 [3:45:23<4:36:02,  7.79s/it] 45%|████▍     | 1711/3837 [3:45:32<4:39:58,  7.90s/it] 45%|████▍     | 1712/3837 [3:45:40<4:43:06,  7.99s/it] 45%|████▍     | 1713/3837 [3:45:47<4:32:04,  7.69s/it] 45%|████▍     | 1714/3837 [3:45:55<4:37:53,  7.85s/it] 45%|████▍     | 1715/3837 [3:46:02<4:28:33,  7.59s/it] 45%|████▍     | 1716/3837 [3:46:10<4:35:54,  7.81s/it] 45%|████▍     | 1717/3837 [3:46:18<4:40:16,  7.93s/it] 45%|████▍     | 1718/3837 [3:46:25<4:29:41,  7.64s/it] 45%|████▍     | 1719/3837 [3:46:32<4:22:30,  7.44s/it] 45%|████▍     | 1720/3837 [3:46:39<4:17:04,  7.29s/it]                                                       {'loss': 4.1294, 'grad_norm': 9.880313873291016, 'learning_rate': 1.2148709246536535e-05, 'epoch': 0.45}
 45%|████▍     | 1720/3837 [3:46:39<4:17:04,  7.29s/it] 45%|████▍     | 1721/3837 [3:46:48<4:26:16,  7.55s/it] 45%|████▍     | 1722/3837 [3:46:56<4:34:26,  7.79s/it] 45%|████▍     | 1723/3837 [3:47:04<4:38:38,  7.91s/it] 45%|████▍     | 1724/3837 [3:47:11<4:27:44,  7.60s/it] 45%|████▍     | 1725/3837 [3:47:19<4:34:11,  7.79s/it] 45%|████▍     | 1726/3837 [3:47:27<4:38:07,  7.91s/it] 45%|████▌     | 1727/3837 [3:47:36<4:41:19,  8.00s/it] 45%|████▌     | 1728/3837 [3:47:45<4:57:15,  8.46s/it] 45%|████▌     | 1729/3837 [3:47:53<4:53:57,  8.37s/it] 45%|████▌     | 1730/3837 [3:48:01<4:52:30,  8.33s/it] 45%|████▌     | 1731/3837 [3:48:08<4:37:15,  7.90s/it] 45%|████▌     | 1732/3837 [3:48:15<4:27:10,  7.62s/it] 45%|████▌     | 1733/3837 [3:48:22<4:20:02,  7.42s/it] 45%|████▌     | 1734/3837 [3:48:30<4:28:18,  7.65s/it] 45%|████▌     | 1735/3837 [3:48:37<4:20:57,  7.45s/it] 45%|████▌     | 1736/3837 [3:48:46<4:29:14,  7.69s/it] 45%|████▌     | 1737/3837 [3:48:54<4:34:03,  7.83s/it] 45%|████▌     | 1738/3837 [3:49:02<4:38:13,  7.95s/it] 45%|████▌     | 1739/3837 [3:49:10<4:41:09,  8.04s/it] 45%|████▌     | 1740/3837 [3:49:19<4:42:28,  8.08s/it]                                                       {'loss': 4.4272, 'grad_norm': 10.156134605407715, 'learning_rate': 1.1983497417762831e-05, 'epoch': 0.45}
 45%|████▌     | 1740/3837 [3:49:19<4:42:28,  8.08s/it] 45%|████▌     | 1741/3837 [3:49:27<4:43:37,  8.12s/it] 45%|████▌     | 1742/3837 [3:49:35<4:45:48,  8.19s/it] 45%|████▌     | 1743/3837 [3:49:43<4:45:36,  8.18s/it] 45%|████▌     | 1744/3837 [3:49:51<4:45:38,  8.19s/it] 45%|████▌     | 1745/3837 [3:50:00<4:46:40,  8.22s/it] 46%|████▌     | 1746/3837 [3:50:08<4:46:12,  8.21s/it] 46%|████▌     | 1747/3837 [3:50:16<4:45:56,  8.21s/it] 46%|████▌     | 1748/3837 [3:50:24<4:45:53,  8.21s/it] 46%|████▌     | 1749/3837 [3:50:33<4:45:48,  8.21s/it] 46%|████▌     | 1750/3837 [3:50:41<4:45:34,  8.21s/it] 46%|████▌     | 1751/3837 [3:50:49<4:45:21,  8.21s/it] 46%|████▌     | 1752/3837 [3:50:56<4:32:18,  7.84s/it] 46%|████▌     | 1753/3837 [3:51:04<4:35:59,  7.95s/it] 46%|████▌     | 1754/3837 [3:51:14<4:52:20,  8.42s/it] 46%|████▌     | 1755/3837 [3:51:22<4:50:15,  8.36s/it] 46%|████▌     | 1756/3837 [3:51:29<4:35:32,  7.94s/it] 46%|████▌     | 1757/3837 [3:51:37<4:38:47,  8.04s/it] 46%|████▌     | 1758/3837 [3:51:45<4:40:26,  8.09s/it] 46%|████▌     | 1759/3837 [3:51:54<4:41:10,  8.12s/it] 46%|████▌     | 1760/3837 [3:52:01<4:29:18,  7.78s/it]                                                       {'loss': 4.3055, 'grad_norm': 9.321148872375488, 'learning_rate': 1.1817720051086417e-05, 'epoch': 0.46}
 46%|████▌     | 1760/3837 [3:52:01<4:29:18,  7.78s/it] 46%|████▌     | 1761/3837 [3:52:09<4:33:10,  7.90s/it] 46%|████▌     | 1762/3837 [3:52:18<4:49:50,  8.38s/it] 46%|████▌     | 1763/3837 [3:52:26<4:47:46,  8.33s/it] 46%|████▌     | 1764/3837 [3:52:33<4:32:43,  7.89s/it] 46%|████▌     | 1765/3837 [3:52:40<4:23:00,  7.62s/it] 46%|████▌     | 1766/3837 [3:52:47<4:16:21,  7.43s/it] 46%|████▌     | 1767/3837 [3:52:55<4:23:44,  7.64s/it] 46%|████▌     | 1768/3837 [3:53:04<4:29:14,  7.81s/it] 46%|████▌     | 1769/3837 [3:53:12<4:33:47,  7.94s/it] 46%|████▌     | 1770/3837 [3:53:19<4:23:16,  7.64s/it] 46%|████▌     | 1771/3837 [3:53:27<4:29:07,  7.82s/it] 46%|████▌     | 1772/3837 [3:53:34<4:19:21,  7.54s/it] 46%|████▌     | 1773/3837 [3:53:42<4:26:38,  7.75s/it] 46%|████▌     | 1774/3837 [3:53:50<4:31:03,  7.88s/it] 46%|████▋     | 1775/3837 [3:53:59<4:35:48,  8.03s/it] 46%|████▋     | 1776/3837 [3:54:06<4:25:44,  7.74s/it] 46%|████▋     | 1777/3837 [3:54:13<4:18:20,  7.52s/it] 46%|████▋     | 1778/3837 [3:54:21<4:25:15,  7.73s/it] 46%|████▋     | 1779/3837 [3:54:28<4:17:34,  7.51s/it] 46%|████▋     | 1780/3837 [3:54:36<4:24:22,  7.71s/it]                                                       {'loss': 4.2839, 'grad_norm': 11.378663063049316, 'learning_rate': 1.1651424413210757e-05, 'epoch': 0.46}
 46%|████▋     | 1780/3837 [3:54:36<4:24:22,  7.71s/it] 46%|████▋     | 1781/3837 [3:54:44<4:30:15,  7.89s/it] 46%|████▋     | 1782/3837 [3:54:53<4:34:40,  8.02s/it] 46%|████▋     | 1783/3837 [3:55:02<4:50:15,  8.48s/it] 46%|████▋     | 1784/3837 [3:55:09<4:34:44,  8.03s/it] 47%|████▋     | 1785/3837 [3:55:18<4:36:40,  8.09s/it] 47%|████▋     | 1786/3837 [3:55:24<4:24:36,  7.74s/it] 47%|████▋     | 1787/3837 [3:55:33<4:29:08,  7.88s/it] 47%|████▋     | 1788/3837 [3:55:41<4:33:13,  8.00s/it] 47%|████▋     | 1789/3837 [3:55:48<4:23:02,  7.71s/it] 47%|████▋     | 1790/3837 [3:55:56<4:28:30,  7.87s/it] 47%|████▋     | 1791/3837 [3:56:04<4:32:23,  7.99s/it] 47%|████▋     | 1792/3837 [3:56:11<4:21:53,  7.68s/it] 47%|████▋     | 1793/3837 [3:56:20<4:26:57,  7.84s/it] 47%|████▋     | 1794/3837 [3:56:27<4:18:12,  7.58s/it] 47%|████▋     | 1795/3837 [3:56:34<4:11:11,  7.38s/it] 47%|████▋     | 1796/3837 [3:56:42<4:19:55,  7.64s/it] 47%|████▋     | 1797/3837 [3:56:50<4:25:26,  7.81s/it] 47%|████▋     | 1798/3837 [3:56:58<4:29:13,  7.92s/it] 47%|████▋     | 1799/3837 [3:57:05<4:19:36,  7.64s/it] 47%|████▋     | 1800/3837 [3:57:13<4:25:16,  7.81s/it]                                                       {'loss': 4.3166, 'grad_norm': 10.545044898986816, 'learning_rate': 1.1484657918609614e-05, 'epoch': 0.47}
 47%|████▋     | 1800/3837 [3:57:13<4:25:16,  7.81s/it] 47%|████▋     | 1801/3837 [3:57:22<4:28:53,  7.92s/it] 47%|████▋     | 1802/3837 [3:57:30<4:31:19,  8.00s/it] 47%|████▋     | 1803/3837 [3:57:38<4:33:09,  8.06s/it] 47%|████▋     | 1804/3837 [3:57:46<4:34:17,  8.10s/it] 47%|████▋     | 1805/3837 [3:57:54<4:35:14,  8.13s/it] 47%|████▋     | 1806/3837 [3:58:01<4:22:51,  7.77s/it] 47%|████▋     | 1807/3837 [3:58:08<4:14:11,  7.51s/it] 47%|████▋     | 1808/3837 [3:58:16<4:21:20,  7.73s/it] 47%|████▋     | 1809/3837 [3:58:25<4:26:01,  7.87s/it] 47%|████▋     | 1810/3837 [3:58:33<4:28:47,  7.96s/it] 47%|████▋     | 1811/3837 [3:58:41<4:31:02,  8.03s/it] 47%|████▋     | 1812/3837 [3:58:49<4:32:34,  8.08s/it] 47%|████▋     | 1813/3837 [3:58:56<4:21:18,  7.75s/it] 47%|████▋     | 1814/3837 [3:59:04<4:26:01,  7.89s/it] 47%|████▋     | 1815/3837 [3:59:13<4:29:21,  7.99s/it] 47%|████▋     | 1816/3837 [3:59:20<4:18:45,  7.68s/it] 47%|████▋     | 1817/3837 [3:59:28<4:24:24,  7.85s/it] 47%|████▋     | 1818/3837 [3:59:36<4:27:27,  7.95s/it] 47%|████▋     | 1819/3837 [3:59:44<4:29:58,  8.03s/it] 47%|████▋     | 1820/3837 [3:59:52<4:32:29,  8.11s/it]                                                       {'loss': 4.2311, 'grad_norm': 10.836008071899414, 'learning_rate': 1.131746811600816e-05, 'epoch': 0.47}
 47%|████▋     | 1820/3837 [3:59:52<4:32:29,  8.11s/it] 47%|████▋     | 1821/3837 [4:00:01<4:33:58,  8.15s/it] 47%|████▋     | 1822/3837 [4:00:09<4:34:11,  8.16s/it] 48%|████▊     | 1823/3837 [4:00:16<4:22:06,  7.81s/it] 48%|████▊     | 1824/3837 [4:00:23<4:12:33,  7.53s/it] 48%|████▊     | 1825/3837 [4:00:31<4:19:09,  7.73s/it] 48%|████▊     | 1826/3837 [4:00:39<4:23:42,  7.87s/it] 48%|████▊     | 1827/3837 [4:00:47<4:26:57,  7.97s/it] 48%|████▊     | 1828/3837 [4:00:56<4:29:26,  8.05s/it] 48%|████▊     | 1829/3837 [4:01:04<4:30:30,  8.08s/it] 48%|████▊     | 1830/3837 [4:01:12<4:32:10,  8.14s/it] 48%|████▊     | 1831/3837 [4:01:22<4:46:12,  8.56s/it] 48%|████▊     | 1832/3837 [4:01:30<4:42:50,  8.46s/it] 48%|████▊     | 1833/3837 [4:01:38<4:40:01,  8.38s/it] 48%|████▊     | 1834/3837 [4:01:45<4:25:53,  7.96s/it] 48%|████▊     | 1835/3837 [4:01:53<4:28:17,  8.04s/it] 48%|████▊     | 1836/3837 [4:02:01<4:29:51,  8.09s/it] 48%|████▊     | 1837/3837 [4:02:10<4:31:41,  8.15s/it] 48%|████▊     | 1838/3837 [4:02:18<4:32:27,  8.18s/it] 48%|████▊     | 1839/3837 [4:02:26<4:32:41,  8.19s/it] 48%|████▊     | 1840/3837 [4:02:34<4:32:23,  8.18s/it]                                                       {'loss': 4.0499, 'grad_norm': 10.906420707702637, 'learning_rate': 1.1149902674825816e-05, 'epoch': 0.48}
 48%|████▊     | 1840/3837 [4:02:34<4:32:23,  8.18s/it] 48%|████▊     | 1841/3837 [4:02:43<4:32:56,  8.20s/it] 48%|████▊     | 1842/3837 [4:02:51<4:33:33,  8.23s/it] 48%|████▊     | 1843/3837 [4:02:58<4:20:37,  7.84s/it] 48%|████▊     | 1844/3837 [4:03:06<4:24:14,  7.95s/it] 48%|████▊     | 1845/3837 [4:03:14<4:27:24,  8.05s/it] 48%|████▊     | 1846/3837 [4:03:23<4:29:43,  8.13s/it] 48%|████▊     | 1847/3837 [4:03:30<4:17:26,  7.76s/it] 48%|████▊     | 1848/3837 [4:03:36<4:08:45,  7.50s/it] 48%|████▊     | 1849/3837 [4:03:43<4:02:41,  7.32s/it] 48%|████▊     | 1850/3837 [4:03:52<4:11:52,  7.61s/it] 48%|████▊     | 1851/3837 [4:04:00<4:17:27,  7.78s/it] 48%|████▊     | 1852/3837 [4:04:08<4:21:07,  7.89s/it] 48%|████▊     | 1853/3837 [4:04:16<4:24:20,  7.99s/it] 48%|████▊     | 1854/3837 [4:04:24<4:26:38,  8.07s/it] 48%|████▊     | 1855/3837 [4:04:33<4:28:33,  8.13s/it] 48%|████▊     | 1856/3837 [4:04:42<4:42:06,  8.54s/it] 48%|████▊     | 1857/3837 [4:04:49<4:26:35,  8.08s/it] 48%|████▊     | 1858/3837 [4:04:57<4:27:36,  8.11s/it] 48%|████▊     | 1859/3837 [4:05:06<4:28:18,  8.14s/it] 48%|████▊     | 1860/3837 [4:05:13<4:16:32,  7.79s/it]                                                       {'loss': 4.178, 'grad_norm': 10.436570167541504, 'learning_rate': 1.0982009371584657e-05, 'epoch': 0.48}
 48%|████▊     | 1860/3837 [4:05:13<4:16:32,  7.79s/it] 49%|████▊     | 1861/3837 [4:05:21<4:21:03,  7.93s/it] 49%|████▊     | 1862/3837 [4:05:29<4:23:33,  8.01s/it] 49%|████▊     | 1863/3837 [4:05:37<4:25:24,  8.07s/it] 49%|████▊     | 1864/3837 [4:05:45<4:26:42,  8.11s/it] 49%|████▊     | 1865/3837 [4:05:52<4:14:42,  7.75s/it] 49%|████▊     | 1866/3837 [4:06:01<4:19:22,  7.90s/it] 49%|████▊     | 1867/3837 [4:06:09<4:22:27,  7.99s/it] 49%|████▊     | 1868/3837 [4:06:17<4:24:22,  8.06s/it] 49%|████▊     | 1869/3837 [4:06:25<4:26:05,  8.11s/it] 49%|████▊     | 1870/3837 [4:06:32<4:14:45,  7.77s/it] 49%|████▉     | 1871/3837 [4:06:40<4:19:38,  7.92s/it] 49%|████▉     | 1872/3837 [4:06:49<4:22:09,  8.00s/it] 49%|████▉     | 1873/3837 [4:06:56<4:11:06,  7.67s/it] 49%|████▉     | 1874/3837 [4:07:04<4:16:27,  7.84s/it] 49%|████▉     | 1875/3837 [4:07:12<4:20:01,  7.95s/it] 49%|████▉     | 1876/3837 [4:07:20<4:21:59,  8.02s/it] 49%|████▉     | 1877/3837 [4:07:28<4:24:06,  8.09s/it] 49%|████▉     | 1878/3837 [4:07:38<4:37:34,  8.50s/it] 49%|████▉     | 1879/3837 [4:07:46<4:34:17,  8.41s/it] 49%|████▉     | 1880/3837 [4:07:52<4:06:59,  7.57s/it]                                                       {'loss': 4.1751, 'grad_norm': 8.803701400756836, 'learning_rate': 1.0813836076287306e-05, 'epoch': 0.49}
 49%|████▉     | 1880/3837 [4:07:52<4:06:59,  7.57s/it] 49%|████▉     | 1881/3837 [4:08:00<4:13:27,  7.77s/it] 49%|████▉     | 1882/3837 [4:08:07<4:06:06,  7.55s/it] 49%|████▉     | 1883/3837 [4:08:15<4:12:42,  7.76s/it] 49%|████▉     | 1884/3837 [4:08:25<4:30:08,  8.30s/it] 49%|████▉     | 1885/3837 [4:08:34<4:42:13,  8.67s/it] 49%|████▉     | 1886/3837 [4:08:43<4:37:21,  8.53s/it] 49%|████▉     | 1887/3837 [4:08:51<4:35:47,  8.49s/it] 49%|████▉     | 1888/3837 [4:08:59<4:33:07,  8.41s/it] 49%|████▉     | 1889/3837 [4:09:07<4:31:15,  8.35s/it] 49%|████▉     | 1890/3837 [4:09:16<4:29:21,  8.30s/it] 49%|████▉     | 1891/3837 [4:09:24<4:29:06,  8.30s/it] 49%|████▉     | 1892/3837 [4:09:32<4:28:19,  8.28s/it] 49%|████▉     | 1893/3837 [4:09:40<4:27:34,  8.26s/it] 49%|████▉     | 1894/3837 [4:09:47<4:14:19,  7.85s/it] 49%|████▉     | 1895/3837 [4:09:55<4:14:54,  7.88s/it] 49%|████▉     | 1896/3837 [4:10:03<4:18:05,  7.98s/it] 49%|████▉     | 1897/3837 [4:10:12<4:20:03,  8.04s/it] 49%|████▉     | 1898/3837 [4:10:18<4:08:58,  7.70s/it] 49%|████▉     | 1899/3837 [4:10:27<4:13:41,  7.85s/it] 50%|████▉     | 1900/3837 [4:10:34<4:04:20,  7.57s/it]                                                       {'loss': 4.3345, 'grad_norm': 10.908146858215332, 'learning_rate': 1.0645430738768162e-05, 'epoch': 0.5}
 50%|████▉     | 1900/3837 [4:10:34<4:04:20,  7.57s/it] 50%|████▉     | 1901/3837 [4:10:40<3:58:03,  7.38s/it] 50%|████▉     | 1902/3837 [4:10:49<4:06:00,  7.63s/it] 50%|████▉     | 1903/3837 [4:10:57<4:11:31,  7.80s/it] 50%|████▉     | 1904/3837 [4:11:05<4:15:39,  7.94s/it] 50%|████▉     | 1905/3837 [4:11:13<4:18:18,  8.02s/it] 50%|████▉     | 1906/3837 [4:11:22<4:20:31,  8.10s/it] 50%|████▉     | 1907/3837 [4:11:30<4:21:35,  8.13s/it] 50%|████▉     | 1908/3837 [4:11:38<4:21:56,  8.15s/it] 50%|████▉     | 1909/3837 [4:11:45<4:10:52,  7.81s/it] 50%|████▉     | 1910/3837 [4:11:53<4:14:47,  7.93s/it] 50%|████▉     | 1911/3837 [4:12:02<4:17:28,  8.02s/it] 50%|████▉     | 1912/3837 [4:12:09<4:07:29,  7.71s/it] 50%|████▉     | 1913/3837 [4:12:17<4:12:18,  7.87s/it] 50%|████▉     | 1914/3837 [4:12:24<4:02:57,  7.58s/it] 50%|████▉     | 1915/3837 [4:12:32<4:09:00,  7.77s/it] 50%|████▉     | 1916/3837 [4:12:39<4:01:05,  7.53s/it] 50%|████▉     | 1917/3837 [4:12:46<3:55:24,  7.36s/it] 50%|████▉     | 1918/3837 [4:12:54<4:03:26,  7.61s/it] 50%|█████     | 1919/3837 [4:13:02<4:08:51,  7.78s/it] 50%|█████     | 1920/3837 [4:13:10<4:13:38,  7.94s/it]                                                       {'loss': 4.0666, 'grad_norm': 11.51278305053711, 'learning_rate': 1.0476841375021876e-05, 'epoch': 0.5}
 50%|█████     | 1920/3837 [4:13:10<4:13:38,  7.94s/it] 50%|█████     | 1921/3837 [4:13:19<4:15:57,  8.02s/it] 50%|█████     | 1922/3837 [4:13:28<4:29:49,  8.45s/it] 50%|█████     | 1923/3837 [4:13:36<4:25:02,  8.31s/it] 50%|█████     | 1924/3837 [4:13:44<4:23:16,  8.26s/it] 50%|█████     | 1925/3837 [4:13:52<4:22:48,  8.25s/it] 50%|█████     | 1926/3837 [4:14:01<4:22:33,  8.24s/it] 50%|█████     | 1927/3837 [4:14:09<4:22:07,  8.23s/it] 50%|█████     | 1928/3837 [4:14:17<4:21:39,  8.22s/it] 50%|█████     | 1929/3837 [4:14:24<4:09:46,  7.85s/it] 50%|█████     | 1930/3837 [4:14:32<4:12:51,  7.96s/it] 50%|█████     | 1931/3837 [4:14:41<4:16:04,  8.06s/it] 50%|█████     | 1932/3837 [4:14:49<4:18:29,  8.14s/it] 50%|█████     | 1933/3837 [4:14:56<4:07:12,  7.79s/it] 50%|█████     | 1934/3837 [4:15:04<4:11:21,  7.93s/it] 50%|█████     | 1935/3837 [4:15:14<4:26:02,  8.39s/it] 50%|█████     | 1936/3837 [4:15:21<4:11:36,  7.94s/it] 50%|█████     | 1937/3837 [4:15:27<4:02:05,  7.65s/it] 51%|█████     | 1938/3837 [4:15:37<4:19:22,  8.19s/it] 51%|█████     | 1939/3837 [4:15:45<4:19:27,  8.20s/it] 51%|█████     | 1940/3837 [4:15:53<4:19:02,  8.19s/it]                                                       {'loss': 4.125, 'grad_norm': 9.570987701416016, 'learning_rate': 1.0308116053512929e-05, 'epoch': 0.51}
 51%|█████     | 1940/3837 [4:15:53<4:19:02,  8.19s/it] 51%|█████     | 1941/3837 [4:16:02<4:18:43,  8.19s/it] 51%|█████     | 1942/3837 [4:16:08<4:06:02,  7.79s/it] 51%|█████     | 1943/3837 [4:16:15<3:57:16,  7.52s/it] 51%|█████     | 1944/3837 [4:16:23<4:03:49,  7.73s/it] 51%|█████     | 1945/3837 [4:16:32<4:08:20,  7.88s/it] 51%|█████     | 1946/3837 [4:16:39<3:59:50,  7.61s/it] 51%|█████     | 1947/3837 [4:16:47<4:05:13,  7.78s/it] 51%|█████     | 1948/3837 [4:16:54<3:56:34,  7.51s/it] 51%|█████     | 1949/3837 [4:17:02<4:04:03,  7.76s/it] 51%|█████     | 1950/3837 [4:17:09<3:56:54,  7.53s/it] 51%|█████     | 1951/3837 [4:17:17<4:04:25,  7.78s/it] 51%|█████     | 1952/3837 [4:17:26<4:08:57,  7.92s/it] 51%|█████     | 1953/3837 [4:17:35<4:23:42,  8.40s/it] 51%|█████     | 1954/3837 [4:17:43<4:22:12,  8.35s/it] 51%|█████     | 1955/3837 [4:17:52<4:21:01,  8.32s/it] 51%|█████     | 1956/3837 [4:18:00<4:20:24,  8.31s/it] 51%|█████     | 1957/3837 [4:18:07<4:12:12,  8.05s/it] 51%|█████     | 1958/3837 [4:18:16<4:13:35,  8.10s/it] 51%|█████     | 1959/3837 [4:18:25<4:26:35,  8.52s/it] 51%|█████     | 1960/3837 [4:18:33<4:23:05,  8.41s/it]                                                       {'loss': 4.2681, 'grad_norm': 11.320902824401855, 'learning_rate': 1.0139302881470307e-05, 'epoch': 0.51}
 51%|█████     | 1960/3837 [4:18:33<4:23:05,  8.41s/it] 51%|█████     | 1961/3837 [4:18:42<4:21:20,  8.36s/it] 51%|█████     | 1962/3837 [4:18:50<4:19:59,  8.32s/it] 51%|█████     | 1963/3837 [4:18:58<4:18:50,  8.29s/it] 51%|█████     | 1964/3837 [4:19:06<4:17:49,  8.26s/it] 51%|█████     | 1965/3837 [4:19:13<4:06:01,  7.89s/it] 51%|█████     | 1966/3837 [4:19:20<3:56:51,  7.60s/it] 51%|█████▏    | 1967/3837 [4:19:27<3:50:35,  7.40s/it] 51%|█████▏    | 1968/3837 [4:19:35<3:57:48,  7.63s/it] 51%|█████▏    | 1969/3837 [4:19:43<4:02:58,  7.80s/it] 51%|█████▏    | 1970/3837 [4:19:52<4:07:03,  7.94s/it] 51%|█████▏    | 1971/3837 [4:19:59<3:58:13,  7.66s/it] 51%|█████▏    | 1972/3837 [4:20:07<4:03:41,  7.84s/it] 51%|█████▏    | 1973/3837 [4:20:15<4:06:45,  7.94s/it] 51%|█████▏    | 1974/3837 [4:20:23<4:09:27,  8.03s/it] 51%|█████▏    | 1975/3837 [4:20:32<4:10:41,  8.08s/it] 51%|█████▏    | 1976/3837 [4:20:40<4:11:35,  8.11s/it] 52%|█████▏    | 1977/3837 [4:20:48<4:12:02,  8.13s/it] 52%|█████▏    | 1978/3837 [4:20:56<4:13:20,  8.18s/it] 52%|█████▏    | 1979/3837 [4:21:06<4:25:52,  8.59s/it] 52%|█████▏    | 1980/3837 [4:21:13<4:10:13,  8.08s/it]                                                       {'loss': 4.2195, 'grad_norm': 9.529279708862305, 'learning_rate': 9.970449991171078e-06, 'epoch': 0.52}
 52%|█████▏    | 1980/3837 [4:21:13<4:10:13,  8.08s/it] 52%|█████▏    | 1981/3837 [4:21:21<4:11:44,  8.14s/it] 52%|█████▏    | 1982/3837 [4:21:27<3:48:50,  7.40s/it] 52%|█████▏    | 1983/3837 [4:21:35<3:55:37,  7.63s/it] 52%|█████▏    | 1984/3837 [4:21:43<4:01:50,  7.83s/it] 52%|█████▏    | 1985/3837 [4:21:50<3:53:42,  7.57s/it] 52%|█████▏    | 1986/3837 [4:21:58<4:00:36,  7.80s/it] 52%|█████▏    | 1987/3837 [4:22:07<4:04:08,  7.92s/it] 52%|█████▏    | 1988/3837 [4:22:15<4:07:16,  8.02s/it] 52%|█████▏    | 1989/3837 [4:22:23<4:09:14,  8.09s/it] 52%|█████▏    | 1990/3837 [4:22:31<4:10:53,  8.15s/it] 52%|█████▏    | 1991/3837 [4:22:40<4:11:36,  8.18s/it] 52%|█████▏    | 1992/3837 [4:22:48<4:12:09,  8.20s/it] 52%|█████▏    | 1993/3837 [4:22:56<4:12:06,  8.20s/it] 52%|█████▏    | 1994/3837 [4:23:03<4:00:14,  7.82s/it] 52%|█████▏    | 1995/3837 [4:23:11<4:04:18,  7.96s/it] 52%|█████▏    | 1996/3837 [4:23:20<4:06:27,  8.03s/it] 52%|█████▏    | 1997/3837 [4:23:26<3:55:37,  7.68s/it] 52%|█████▏    | 1998/3837 [4:23:35<4:00:28,  7.85s/it] 52%|█████▏    | 1999/3837 [4:23:42<3:53:26,  7.62s/it] 52%|█████▏    | 2000/3837 [4:23:50<3:59:07,  7.81s/it]                                                       {'loss': 4.1558, 'grad_norm': 10.528421401977539, 'learning_rate': 9.801605526216826e-06, 'epoch': 0.52}
 52%|█████▏    | 2000/3837 [4:23:50<3:59:07,  7.81s/it]/home/zhengduo/miniconda3/envs/vgllm2/lib/python3.10/site-packages/torch/utils/checkpoint.py:87: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
  warnings.warn(
/home/zhengduo/workspace/vgllm/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:42: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(dtype=dtype):
 52%|█████▏    | 2001/3837 [4:24:39<10:20:48, 20.29s/it] 52%|█████▏    | 2002/3837 [4:24:48<8:29:54, 16.67s/it]  52%|█████▏    | 2003/3837 [4:24:55<7:00:22, 13.75s/it] 52%|█████▏    | 2004/3837 [4:25:02<5:58:22, 11.73s/it] 52%|█████▏    | 2005/3837 [4:25:10<5:26:33, 10.70s/it] 52%|█████▏    | 2006/3837 [4:25:18<5:03:29,  9.95s/it] 52%|█████▏    | 2007/3837 [4:25:25<4:36:08,  9.05s/it] 52%|█████▏    | 2008/3837 [4:25:33<4:28:17,  8.80s/it] 52%|█████▏    | 2009/3837 [4:25:41<4:22:11,  8.61s/it] 52%|█████▏    | 2010/3837 [4:25:50<4:18:55,  8.50s/it] 52%|█████▏    | 2011/3837 [4:25:58<4:17:30,  8.46s/it] 52%|█████▏    | 2012/3837 [4:26:06<4:15:08,  8.39s/it] 52%|█████▏    | 2013/3837 [4:26:14<4:13:31,  8.34s/it] 52%|█████▏    | 2014/3837 [4:26:23<4:12:47,  8.32s/it] 53%|█████▎    | 2015/3837 [4:26:31<4:11:29,  8.28s/it] 53%|█████▎    | 2016/3837 [4:26:39<4:10:52,  8.27s/it] 53%|█████▎    | 2017/3837 [4:26:47<4:11:07,  8.28s/it] 53%|█████▎    | 2018/3837 [4:26:54<3:58:49,  7.88s/it] 53%|█████▎    | 2019/3837 [4:27:01<3:49:55,  7.59s/it] 53%|█████▎    | 2020/3837 [4:27:10<3:55:48,  7.79s/it]                                                       {'loss': 4.0867, 'grad_norm': 9.867714881896973, 'learning_rate': 9.632817627806907e-06, 'epoch': 0.53}
 53%|█████▎    | 2020/3837 [4:27:10<3:55:48,  7.79s/it] 53%|█████▎    | 2021/3837 [4:27:18<3:59:52,  7.93s/it] 53%|█████▎    | 2022/3837 [4:27:25<3:51:39,  7.66s/it] 53%|█████▎    | 2023/3837 [4:27:32<3:44:21,  7.42s/it] 53%|█████▎    | 2024/3837 [4:27:40<3:51:03,  7.65s/it] 53%|█████▎    | 2025/3837 [4:27:48<3:55:48,  7.81s/it] 53%|█████▎    | 2026/3837 [4:27:55<3:48:39,  7.58s/it] 53%|█████▎    | 2027/3837 [4:28:03<3:55:07,  7.79s/it] 53%|█████▎    | 2028/3837 [4:28:12<3:58:49,  7.92s/it] 53%|█████▎    | 2029/3837 [4:28:19<3:49:46,  7.63s/it] 53%|█████▎    | 2030/3837 [4:28:26<3:44:41,  7.46s/it] 53%|█████▎    | 2031/3837 [4:28:35<4:02:59,  8.07s/it] 53%|█████▎    | 2032/3837 [4:28:43<4:04:20,  8.12s/it] 53%|█████▎    | 2033/3837 [4:28:52<4:05:44,  8.17s/it] 53%|█████▎    | 2034/3837 [4:28:59<3:54:05,  7.79s/it] 53%|█████▎    | 2035/3837 [4:29:07<3:57:21,  7.90s/it] 53%|█████▎    | 2036/3837 [4:29:15<3:59:38,  7.98s/it] 53%|█████▎    | 2037/3837 [4:29:22<3:49:50,  7.66s/it] 53%|█████▎    | 2038/3837 [4:29:30<3:55:46,  7.86s/it] 53%|█████▎    | 2039/3837 [4:29:38<3:59:02,  7.98s/it] 53%|█████▎    | 2040/3837 [4:29:47<4:01:42,  8.07s/it]                                                       {'loss': 3.9552, 'grad_norm': 10.867067337036133, 'learning_rate': 9.464134421012325e-06, 'epoch': 0.53}
 53%|█████▎    | 2040/3837 [4:29:47<4:01:42,  8.07s/it] 53%|█████▎    | 2041/3837 [4:29:55<4:02:54,  8.12s/it] 53%|█████▎    | 2042/3837 [4:30:03<4:03:49,  8.15s/it] 53%|█████▎    | 2043/3837 [4:30:10<3:52:53,  7.79s/it] 53%|█████▎    | 2044/3837 [4:30:17<3:44:25,  7.51s/it] 53%|█████▎    | 2045/3837 [4:30:24<3:39:22,  7.35s/it] 53%|█████▎    | 2046/3837 [4:30:32<3:46:38,  7.59s/it] 53%|█████▎    | 2047/3837 [4:30:41<3:59:55,  8.04s/it] 53%|█████▎    | 2048/3837 [4:30:49<4:00:55,  8.08s/it] 53%|█████▎    | 2049/3837 [4:30:56<3:51:28,  7.77s/it] 53%|█████▎    | 2050/3837 [4:31:05<3:55:02,  7.89s/it] 53%|█████▎    | 2051/3837 [4:31:11<3:46:48,  7.62s/it] 53%|█████▎    | 2052/3837 [4:31:18<3:40:28,  7.41s/it] 54%|█████▎    | 2053/3837 [4:31:27<3:47:45,  7.66s/it] 54%|█████▎    | 2054/3837 [4:31:35<3:53:08,  7.85s/it] 54%|█████▎    | 2055/3837 [4:31:43<3:57:17,  7.99s/it] 54%|█████▎    | 2056/3837 [4:31:51<3:59:16,  8.06s/it] 54%|█████▎    | 2057/3837 [4:31:58<3:49:27,  7.73s/it] 54%|█████▎    | 2058/3837 [4:32:07<3:54:04,  7.89s/it] 54%|█████▎    | 2059/3837 [4:32:14<3:45:21,  7.60s/it] 54%|█████▎    | 2060/3837 [4:32:22<3:50:53,  7.80s/it]                                                       {'loss': 3.9472, 'grad_norm': 10.61895751953125, 'learning_rate': 9.295604001054243e-06, 'epoch': 0.54}
 54%|█████▎    | 2060/3837 [4:32:22<3:50:53,  7.80s/it] 54%|█████▎    | 2061/3837 [4:32:30<3:54:14,  7.91s/it] 54%|█████▎    | 2062/3837 [4:32:38<3:56:35,  8.00s/it] 54%|█████▍    | 2063/3837 [4:32:45<3:47:37,  7.70s/it] 54%|█████▍    | 2064/3837 [4:32:54<3:52:30,  7.87s/it] 54%|█████▍    | 2065/3837 [4:33:00<3:43:48,  7.58s/it] 54%|█████▍    | 2066/3837 [4:33:09<3:49:00,  7.76s/it] 54%|█████▍    | 2067/3837 [4:33:16<3:41:39,  7.51s/it] 54%|█████▍    | 2068/3837 [4:33:24<3:47:30,  7.72s/it] 54%|█████▍    | 2069/3837 [4:33:32<3:51:46,  7.87s/it] 54%|█████▍    | 2070/3837 [4:33:39<3:44:09,  7.61s/it] 54%|█████▍    | 2071/3837 [4:33:46<3:38:37,  7.43s/it] 54%|█████▍    | 2072/3837 [4:33:54<3:45:51,  7.68s/it] 54%|█████▍    | 2073/3837 [4:34:03<3:50:51,  7.85s/it] 54%|█████▍    | 2074/3837 [4:34:11<3:53:41,  7.95s/it] 54%|█████▍    | 2075/3837 [4:34:18<3:44:37,  7.65s/it] 54%|█████▍    | 2076/3837 [4:34:25<3:38:42,  7.45s/it] 54%|█████▍    | 2077/3837 [4:34:33<3:45:09,  7.68s/it] 54%|█████▍    | 2078/3837 [4:34:41<3:50:00,  7.85s/it] 54%|█████▍    | 2079/3837 [4:34:49<3:53:45,  7.98s/it] 54%|█████▍    | 2080/3837 [4:34:56<3:44:03,  7.65s/it]                                                       {'loss': 4.0579, 'grad_norm': 10.114909172058105, 'learning_rate': 9.127274419591018e-06, 'epoch': 0.54}
 54%|█████▍    | 2080/3837 [4:34:56<3:44:03,  7.65s/it] 54%|█████▍    | 2081/3837 [4:35:03<3:37:32,  7.43s/it] 54%|█████▍    | 2082/3837 [4:35:10<3:32:43,  7.27s/it] 54%|█████▍    | 2083/3837 [4:35:18<3:41:23,  7.57s/it] 54%|█████▍    | 2084/3837 [4:35:27<3:46:20,  7.75s/it] 54%|█████▍    | 2085/3837 [4:35:33<3:38:58,  7.50s/it] 54%|█████▍    | 2086/3837 [4:35:42<3:44:58,  7.71s/it] 54%|█████▍    | 2087/3837 [4:35:50<3:49:06,  7.85s/it] 54%|█████▍    | 2088/3837 [4:35:59<4:03:18,  8.35s/it] 54%|█████▍    | 2089/3837 [4:36:07<3:57:54,  8.17s/it] 54%|█████▍    | 2090/3837 [4:36:14<3:47:54,  7.83s/it] 54%|█████▍    | 2091/3837 [4:36:21<3:39:39,  7.55s/it] 55%|█████▍    | 2092/3837 [4:36:29<3:45:10,  7.74s/it] 55%|█████▍    | 2093/3837 [4:36:37<3:49:04,  7.88s/it] 55%|█████▍    | 2094/3837 [4:36:44<3:40:58,  7.61s/it] 55%|█████▍    | 2095/3837 [4:36:53<3:46:03,  7.79s/it] 55%|█████▍    | 2096/3837 [4:36:59<3:38:28,  7.53s/it] 55%|█████▍    | 2097/3837 [4:37:08<3:44:55,  7.76s/it] 55%|█████▍    | 2098/3837 [4:37:15<3:38:28,  7.54s/it] 55%|█████▍    | 2099/3837 [4:37:23<3:44:17,  7.74s/it] 55%|█████▍    | 2100/3837 [4:37:31<3:48:26,  7.89s/it]                                                       {'loss': 3.9641, 'grad_norm': 10.638964653015137, 'learning_rate': 8.959193671017596e-06, 'epoch': 0.55}
 55%|█████▍    | 2100/3837 [4:37:31<3:48:26,  7.89s/it] 55%|█████▍    | 2101/3837 [4:37:38<3:40:00,  7.60s/it] 55%|█████▍    | 2102/3837 [4:37:46<3:45:52,  7.81s/it] 55%|█████▍    | 2103/3837 [4:37:53<3:38:06,  7.55s/it] 55%|█████▍    | 2104/3837 [4:38:02<3:43:34,  7.74s/it] 55%|█████▍    | 2105/3837 [4:38:10<3:47:21,  7.88s/it] 55%|█████▍    | 2106/3837 [4:38:18<3:50:07,  7.98s/it] 55%|█████▍    | 2107/3837 [4:38:25<3:41:05,  7.67s/it] 55%|█████▍    | 2108/3837 [4:38:32<3:34:46,  7.45s/it] 55%|█████▍    | 2109/3837 [4:38:40<3:41:23,  7.69s/it] 55%|█████▍    | 2110/3837 [4:38:48<3:45:48,  7.84s/it] 55%|█████▌    | 2111/3837 [4:38:55<3:37:47,  7.57s/it] 55%|█████▌    | 2112/3837 [4:39:04<3:43:22,  7.77s/it] 55%|█████▌    | 2113/3837 [4:39:11<3:36:24,  7.53s/it] 55%|█████▌    | 2114/3837 [4:39:19<3:42:01,  7.73s/it] 55%|█████▌    | 2115/3837 [4:39:27<3:46:01,  7.88s/it] 55%|█████▌    | 2116/3837 [4:39:34<3:37:54,  7.60s/it] 55%|█████▌    | 2117/3837 [4:39:41<3:33:11,  7.44s/it] 55%|█████▌    | 2118/3837 [4:39:48<3:28:48,  7.29s/it] 55%|█████▌    | 2119/3837 [4:39:56<3:37:12,  7.59s/it] 55%|█████▌    | 2120/3837 [4:40:06<3:53:38,  8.16s/it]                                                       {'loss': 4.0323, 'grad_norm': 11.6610746383667, 'learning_rate': 8.791409678781314e-06, 'epoch': 0.55}
 55%|█████▌    | 2120/3837 [4:40:06<3:53:38,  8.16s/it] 55%|█████▌    | 2121/3837 [4:40:14<3:54:11,  8.19s/it] 55%|█████▌    | 2122/3837 [4:40:21<3:44:19,  7.85s/it] 55%|█████▌    | 2123/3837 [4:40:29<3:47:17,  7.96s/it] 55%|█████▌    | 2124/3837 [4:40:36<3:37:59,  7.64s/it] 55%|█████▌    | 2125/3837 [4:40:44<3:42:47,  7.81s/it] 55%|█████▌    | 2126/3837 [4:40:51<3:35:52,  7.57s/it] 55%|█████▌    | 2127/3837 [4:40:59<3:41:06,  7.76s/it] 55%|█████▌    | 2128/3837 [4:41:06<3:34:10,  7.52s/it] 55%|█████▌    | 2129/3837 [4:41:16<3:51:25,  8.13s/it] 56%|█████▌    | 2130/3837 [4:41:24<3:51:50,  8.15s/it] 56%|█████▌    | 2131/3837 [4:41:31<3:41:49,  7.80s/it] 56%|█████▌    | 2132/3837 [4:41:39<3:45:13,  7.93s/it] 56%|█████▌    | 2133/3837 [4:41:48<3:47:34,  8.01s/it] 56%|█████▌    | 2134/3837 [4:41:54<3:37:50,  7.67s/it] 56%|█████▌    | 2135/3837 [4:42:01<3:31:49,  7.47s/it] 56%|█████▌    | 2136/3837 [4:42:10<3:37:53,  7.69s/it] 56%|█████▌    | 2137/3837 [4:42:17<3:31:44,  7.47s/it] 56%|█████▌    | 2138/3837 [4:42:25<3:38:21,  7.71s/it] 56%|█████▌    | 2139/3837 [4:42:33<3:42:15,  7.85s/it] 56%|█████▌    | 2140/3837 [4:42:41<3:44:49,  7.95s/it]                                                       {'loss': 3.9888, 'grad_norm': 10.459600448608398, 'learning_rate': 8.62397028171787e-06, 'epoch': 0.56}
 56%|█████▌    | 2140/3837 [4:42:41<3:44:49,  7.95s/it] 56%|█████▌    | 2141/3837 [4:42:49<3:46:39,  8.02s/it] 56%|█████▌    | 2142/3837 [4:42:58<3:48:02,  8.07s/it] 56%|█████▌    | 2143/3837 [4:43:06<3:48:58,  8.11s/it] 56%|█████▌    | 2144/3837 [4:43:14<3:49:53,  8.15s/it] 56%|█████▌    | 2145/3837 [4:43:22<3:50:08,  8.16s/it] 56%|█████▌    | 2146/3837 [4:43:29<3:39:55,  7.80s/it] 56%|█████▌    | 2147/3837 [4:43:36<3:32:24,  7.54s/it] 56%|█████▌    | 2148/3837 [4:43:43<3:27:43,  7.38s/it] 56%|█████▌    | 2149/3837 [4:43:51<3:35:13,  7.65s/it] 56%|█████▌    | 2150/3837 [4:44:00<3:39:57,  7.82s/it] 56%|█████▌    | 2151/3837 [4:44:07<3:32:42,  7.57s/it] 56%|█████▌    | 2152/3837 [4:44:16<3:48:59,  8.15s/it] 56%|█████▌    | 2153/3837 [4:44:26<4:00:17,  8.56s/it] 56%|█████▌    | 2154/3837 [4:44:34<3:57:00,  8.45s/it] 56%|█████▌    | 2155/3837 [4:44:41<3:44:07,  7.99s/it] 56%|█████▌    | 2156/3837 [4:44:49<3:45:27,  8.05s/it] 56%|█████▌    | 2157/3837 [4:44:56<3:36:31,  7.73s/it] 56%|█████▌    | 2158/3837 [4:45:04<3:40:31,  7.88s/it] 56%|█████▋    | 2159/3837 [4:45:12<3:43:26,  7.99s/it] 56%|█████▋    | 2160/3837 [4:45:21<3:45:12,  8.06s/it]                                                       {'loss': 4.0327, 'grad_norm': 10.140456199645996, 'learning_rate': 8.456923220411444e-06, 'epoch': 0.56}
 56%|█████▋    | 2160/3837 [4:45:21<3:45:12,  8.06s/it] 56%|█████▋    | 2161/3837 [4:45:29<3:46:54,  8.12s/it] 56%|█████▋    | 2162/3837 [4:45:36<3:36:44,  7.76s/it] 56%|█████▋    | 2163/3837 [4:45:44<3:40:46,  7.91s/it] 56%|█████▋    | 2164/3837 [4:45:52<3:43:16,  8.01s/it] 56%|█████▋    | 2165/3837 [4:46:01<3:44:35,  8.06s/it] 56%|█████▋    | 2166/3837 [4:46:08<3:35:27,  7.74s/it] 56%|█████▋    | 2167/3837 [4:46:16<3:39:39,  7.89s/it] 57%|█████▋    | 2168/3837 [4:46:23<3:32:25,  7.64s/it] 57%|█████▋    | 2169/3837 [4:46:31<3:37:37,  7.83s/it] 57%|█████▋    | 2170/3837 [4:46:39<3:40:32,  7.94s/it] 57%|█████▋    | 2171/3837 [4:46:46<3:32:09,  7.64s/it] 57%|█████▋    | 2172/3837 [4:46:54<3:36:48,  7.81s/it] 57%|█████▋    | 2173/3837 [4:47:04<3:50:40,  8.32s/it] 57%|█████▋    | 2174/3837 [4:47:12<3:50:06,  8.30s/it] 57%|█████▋    | 2175/3837 [4:47:20<3:49:07,  8.27s/it] 57%|█████▋    | 2176/3837 [4:47:28<3:45:02,  8.13s/it] 57%|█████▋    | 2177/3837 [4:47:35<3:35:30,  7.79s/it] 57%|█████▋    | 2178/3837 [4:47:43<3:38:37,  7.91s/it] 57%|█████▋    | 2179/3837 [4:47:52<3:41:16,  8.01s/it] 57%|█████▋    | 2180/3837 [4:48:00<3:42:54,  8.07s/it]                                                       {'loss': 3.8812, 'grad_norm': 10.949334144592285, 'learning_rate': 8.290316123582832e-06, 'epoch': 0.57}
 57%|█████▋    | 2180/3837 [4:48:00<3:42:54,  8.07s/it] 57%|█████▋    | 2181/3837 [4:48:08<3:43:42,  8.11s/it] 57%|█████▋    | 2182/3837 [4:48:16<3:44:12,  8.13s/it] 57%|█████▋    | 2183/3837 [4:48:25<3:45:25,  8.18s/it] 57%|█████▋    | 2184/3837 [4:48:33<3:45:50,  8.20s/it] 57%|█████▋    | 2185/3837 [4:48:41<3:45:51,  8.20s/it] 57%|█████▋    | 2186/3837 [4:48:49<3:45:46,  8.21s/it] 57%|█████▋    | 2187/3837 [4:48:56<3:34:59,  7.82s/it] 57%|█████▋    | 2188/3837 [4:49:04<3:38:08,  7.94s/it] 57%|█████▋    | 2189/3837 [4:49:13<3:40:24,  8.02s/it] 57%|█████▋    | 2190/3837 [4:49:21<3:42:19,  8.10s/it] 57%|█████▋    | 2191/3837 [4:49:29<3:43:49,  8.16s/it] 57%|█████▋    | 2192/3837 [4:49:36<3:33:46,  7.80s/it] 57%|█████▋    | 2193/3837 [4:49:44<3:36:54,  7.92s/it] 57%|█████▋    | 2194/3837 [4:49:51<3:28:59,  7.63s/it] 57%|█████▋    | 2195/3837 [4:49:58<3:23:31,  7.44s/it] 57%|█████▋    | 2196/3837 [4:50:05<3:19:24,  7.29s/it] 57%|█████▋    | 2197/3837 [4:50:13<3:26:46,  7.57s/it] 57%|█████▋    | 2198/3837 [4:50:22<3:31:50,  7.76s/it] 57%|█████▋    | 2199/3837 [4:50:29<3:25:10,  7.52s/it] 57%|█████▋    | 2200/3837 [4:50:37<3:30:36,  7.72s/it]                                                       {'loss': 3.9727, 'grad_norm': 10.680109977722168, 'learning_rate': 8.124196494509463e-06, 'epoch': 0.57}
 57%|█████▋    | 2200/3837 [4:50:37<3:30:36,  7.72s/it] 57%|█████▋    | 2201/3837 [4:50:45<3:35:16,  7.90s/it] 57%|█████▋    | 2202/3837 [4:50:53<3:37:44,  7.99s/it] 57%|█████▋    | 2203/3837 [4:51:00<3:28:33,  7.66s/it] 57%|█████▋    | 2204/3837 [4:51:07<3:23:09,  7.46s/it] 57%|█████▋    | 2205/3837 [4:51:15<3:29:35,  7.71s/it] 57%|█████▋    | 2206/3837 [4:51:24<3:33:19,  7.85s/it] 58%|█████▊    | 2207/3837 [4:51:32<3:35:53,  7.95s/it] 58%|█████▊    | 2208/3837 [4:51:39<3:27:19,  7.64s/it] 58%|█████▊    | 2209/3837 [4:51:47<3:32:05,  7.82s/it] 58%|█████▊    | 2210/3837 [4:51:54<3:25:22,  7.57s/it] 58%|█████▊    | 2211/3837 [4:52:02<3:31:08,  7.79s/it] 58%|█████▊    | 2212/3837 [4:52:10<3:34:22,  7.92s/it] 58%|█████▊    | 2213/3837 [4:52:20<3:47:03,  8.39s/it] 58%|█████▊    | 2214/3837 [4:52:28<3:45:29,  8.34s/it] 58%|█████▊    | 2215/3837 [4:52:36<3:44:06,  8.29s/it] 58%|█████▊    | 2216/3837 [4:52:45<3:43:17,  8.26s/it] 58%|█████▊    | 2217/3837 [4:52:53<3:42:37,  8.25s/it] 58%|█████▊    | 2218/3837 [4:53:01<3:42:23,  8.24s/it] 58%|█████▊    | 2219/3837 [4:53:10<3:48:50,  8.49s/it] 58%|█████▊    | 2220/3837 [4:53:17<3:36:06,  8.02s/it]                                                       {'loss': 4.1098, 'grad_norm': 10.451966285705566, 'learning_rate': 7.958611697481192e-06, 'epoch': 0.58}
 58%|█████▊    | 2220/3837 [4:53:17<3:36:06,  8.02s/it] 58%|█████▊    | 2221/3837 [4:53:24<3:29:43,  7.79s/it] 58%|█████▊    | 2222/3837 [4:53:32<3:33:15,  7.92s/it] 58%|█████▊    | 2223/3837 [4:53:41<3:35:14,  8.00s/it] 58%|█████▊    | 2224/3837 [4:53:49<3:36:43,  8.06s/it] 58%|█████▊    | 2225/3837 [4:53:56<3:27:14,  7.71s/it] 58%|█████▊    | 2226/3837 [4:54:05<3:41:25,  8.25s/it] 58%|█████▊    | 2227/3837 [4:54:12<3:30:14,  7.84s/it] 58%|█████▊    | 2228/3837 [4:54:19<3:23:19,  7.58s/it] 58%|█████▊    | 2229/3837 [4:54:27<3:27:58,  7.76s/it] 58%|█████▊    | 2230/3837 [4:54:34<3:21:11,  7.51s/it] 58%|█████▊    | 2231/3837 [4:54:42<3:26:56,  7.73s/it] 58%|█████▊    | 2232/3837 [4:54:51<3:31:19,  7.90s/it] 58%|█████▊    | 2233/3837 [4:55:00<3:44:12,  8.39s/it] 58%|█████▊    | 2234/3837 [4:55:07<3:32:32,  7.96s/it] 58%|█████▊    | 2235/3837 [4:55:14<3:24:56,  7.68s/it] 58%|█████▊    | 2236/3837 [4:55:22<3:29:11,  7.84s/it] 58%|█████▊    | 2237/3837 [4:55:31<3:31:57,  7.95s/it] 58%|█████▊    | 2238/3837 [4:55:38<3:24:04,  7.66s/it] 58%|█████▊    | 2239/3837 [4:55:45<3:18:35,  7.46s/it] 58%|█████▊    | 2240/3837 [4:55:53<3:24:52,  7.70s/it]                                                       {'loss': 3.9223, 'grad_norm': 11.036892890930176, 'learning_rate': 7.793608944295723e-06, 'epoch': 0.58}
 58%|█████▊    | 2240/3837 [4:55:53<3:24:52,  7.70s/it] 58%|█████▊    | 2241/3837 [4:56:00<3:18:34,  7.46s/it] 58%|█████▊    | 2242/3837 [4:56:08<3:24:03,  7.68s/it] 58%|█████▊    | 2243/3837 [4:56:16<3:28:23,  7.84s/it] 58%|█████▊    | 2244/3837 [4:56:23<3:21:12,  7.58s/it] 59%|█████▊    | 2245/3837 [4:56:31<3:26:27,  7.78s/it] 59%|█████▊    | 2246/3837 [4:56:40<3:29:51,  7.91s/it] 59%|█████▊    | 2247/3837 [4:56:47<3:22:37,  7.65s/it] 59%|█████▊    | 2248/3837 [4:56:55<3:27:28,  7.83s/it] 59%|█████▊    | 2249/3837 [4:57:03<3:30:26,  7.95s/it] 59%|█████▊    | 2250/3837 [4:57:10<3:22:25,  7.65s/it] 59%|█████▊    | 2251/3837 [4:57:17<3:16:24,  7.43s/it] 59%|█████▊    | 2252/3837 [4:57:24<3:12:31,  7.29s/it] 59%|█████▊    | 2253/3837 [4:57:31<3:10:14,  7.21s/it] 59%|█████▊    | 2254/3837 [4:57:39<3:17:36,  7.49s/it] 59%|█████▉    | 2255/3837 [4:57:47<3:23:17,  7.71s/it] 59%|█████▉    | 2256/3837 [4:57:56<3:27:23,  7.87s/it] 59%|█████▉    | 2257/3837 [4:58:03<3:20:29,  7.61s/it] 59%|█████▉    | 2258/3837 [4:58:10<3:15:19,  7.42s/it] 59%|█████▉    | 2259/3837 [4:58:18<3:21:35,  7.66s/it] 59%|█████▉    | 2260/3837 [4:58:26<3:25:29,  7.82s/it]                                                       {'loss': 3.9119, 'grad_norm': 9.987024307250977, 'learning_rate': 7.629235280797506e-06, 'epoch': 0.59}
 59%|█████▉    | 2260/3837 [4:58:26<3:25:29,  7.82s/it] 59%|█████▉    | 2261/3837 [4:58:36<3:38:46,  8.33s/it] 59%|█████▉    | 2262/3837 [4:58:43<3:28:31,  7.94s/it] 59%|█████▉    | 2263/3837 [4:58:51<3:34:49,  8.19s/it] 59%|█████▉    | 2264/3837 [4:58:59<3:34:17,  8.17s/it] 59%|█████▉    | 2265/3837 [4:59:06<3:24:55,  7.82s/it] 59%|█████▉    | 2266/3837 [4:59:15<3:29:14,  7.99s/it] 59%|█████▉    | 2267/3837 [4:59:22<3:21:03,  7.68s/it] 59%|█████▉    | 2268/3837 [4:59:29<3:15:26,  7.47s/it] 59%|█████▉    | 2269/3837 [4:59:36<3:10:58,  7.31s/it] 59%|█████▉    | 2270/3837 [4:59:43<3:08:01,  7.20s/it] 59%|█████▉    | 2271/3837 [4:59:51<3:15:59,  7.51s/it] 59%|█████▉    | 2272/3837 [4:59:59<3:21:41,  7.73s/it] 59%|█████▉    | 2273/3837 [5:00:06<3:15:50,  7.51s/it] 59%|█████▉    | 2274/3837 [5:00:14<3:21:07,  7.72s/it] 59%|█████▉    | 2275/3837 [5:00:21<3:15:12,  7.50s/it] 59%|█████▉    | 2276/3837 [5:00:28<3:11:18,  7.35s/it] 59%|█████▉    | 2277/3837 [5:00:35<3:07:58,  7.23s/it] 59%|█████▉    | 2278/3837 [5:00:43<3:12:04,  7.39s/it] 59%|█████▉    | 2279/3837 [5:00:51<3:18:52,  7.66s/it] 59%|█████▉    | 2280/3837 [5:01:00<3:22:53,  7.82s/it]                                                       {'loss': 3.8546, 'grad_norm': 12.138853073120117, 'learning_rate': 7.465537573463943e-06, 'epoch': 0.59}
 59%|█████▉    | 2280/3837 [5:01:00<3:22:53,  7.82s/it] 59%|█████▉    | 2281/3837 [5:01:07<3:17:05,  7.60s/it] 59%|█████▉    | 2282/3837 [5:01:15<3:21:30,  7.78s/it] 59%|█████▉    | 2283/3837 [5:01:22<3:14:48,  7.52s/it] 60%|█████▉    | 2284/3837 [5:01:29<3:10:12,  7.35s/it] 60%|█████▉    | 2285/3837 [5:01:37<3:16:27,  7.60s/it] 60%|█████▉    | 2286/3837 [5:01:45<3:21:23,  7.79s/it] 60%|█████▉    | 2287/3837 [5:01:52<3:14:56,  7.55s/it] 60%|█████▉    | 2288/3837 [5:02:00<3:20:24,  7.76s/it] 60%|█████▉    | 2289/3837 [5:02:09<3:23:47,  7.90s/it] 60%|█████▉    | 2290/3837 [5:02:17<3:25:29,  7.97s/it] 60%|█████▉    | 2291/3837 [5:02:24<3:17:36,  7.67s/it] 60%|█████▉    | 2292/3837 [5:02:31<3:12:14,  7.47s/it] 60%|█████▉    | 2293/3837 [5:02:39<3:18:09,  7.70s/it] 60%|█████▉    | 2294/3837 [5:02:47<3:21:37,  7.84s/it] 60%|█████▉    | 2295/3837 [5:02:54<3:14:54,  7.58s/it] 60%|█████▉    | 2296/3837 [5:03:01<3:10:28,  7.42s/it] 60%|█████▉    | 2297/3837 [5:03:08<3:08:43,  7.35s/it] 60%|█████▉    | 2298/3837 [5:03:16<3:12:42,  7.51s/it] 60%|█████▉    | 2299/3837 [5:03:24<3:17:14,  7.69s/it] 60%|█████▉    | 2300/3837 [5:03:31<3:11:31,  7.48s/it]                                                       {'loss': 3.8743, 'grad_norm': 9.698243141174316, 'learning_rate': 7.302562496042758e-06, 'epoch': 0.6}
 60%|█████▉    | 2300/3837 [5:03:31<3:11:31,  7.48s/it] 60%|█████▉    | 2301/3837 [5:03:41<3:27:30,  8.11s/it] 60%|█████▉    | 2302/3837 [5:03:49<3:28:27,  8.15s/it] 60%|██████    | 2303/3837 [5:03:59<3:38:42,  8.55s/it] 60%|██████    | 2304/3837 [5:04:07<3:36:25,  8.47s/it] 60%|██████    | 2305/3837 [5:04:15<3:34:22,  8.40s/it] 60%|██████    | 2306/3837 [5:04:23<3:33:10,  8.35s/it] 60%|██████    | 2307/3837 [5:04:32<3:31:53,  8.31s/it] 60%|██████    | 2308/3837 [5:04:40<3:30:54,  8.28s/it] 60%|██████    | 2309/3837 [5:04:47<3:21:10,  7.90s/it] 60%|██████    | 2310/3837 [5:04:55<3:23:12,  7.98s/it] 60%|██████    | 2311/3837 [5:05:03<3:25:32,  8.08s/it] 60%|██████    | 2312/3837 [5:05:11<3:26:31,  8.13s/it] 60%|██████    | 2313/3837 [5:05:18<3:17:13,  7.76s/it] 60%|██████    | 2314/3837 [5:05:27<3:20:38,  7.90s/it] 60%|██████    | 2315/3837 [5:05:35<3:22:56,  8.00s/it] 60%|██████    | 2316/3837 [5:05:43<3:24:53,  8.08s/it] 60%|██████    | 2317/3837 [5:05:50<3:16:07,  7.74s/it] 60%|██████    | 2318/3837 [5:05:58<3:19:33,  7.88s/it] 60%|██████    | 2319/3837 [5:06:07<3:22:06,  7.99s/it] 60%|██████    | 2320/3837 [5:06:14<3:14:24,  7.69s/it]                                                       {'loss': 3.8502, 'grad_norm': 10.529878616333008, 'learning_rate': 7.1403565162442975e-06, 'epoch': 0.6}
 60%|██████    | 2320/3837 [5:06:14<3:14:24,  7.69s/it] 60%|██████    | 2321/3837 [5:06:22<3:18:12,  7.84s/it] 61%|██████    | 2322/3837 [5:06:30<3:20:35,  7.94s/it] 61%|██████    | 2323/3837 [5:06:38<3:23:08,  8.05s/it] 61%|██████    | 2324/3837 [5:06:46<3:24:14,  8.10s/it] 61%|██████    | 2325/3837 [5:06:53<3:15:51,  7.77s/it] 61%|██████    | 2326/3837 [5:07:02<3:19:22,  7.92s/it] 61%|██████    | 2327/3837 [5:07:10<3:21:10,  7.99s/it] 61%|██████    | 2328/3837 [5:07:18<3:22:46,  8.06s/it] 61%|██████    | 2329/3837 [5:07:28<3:33:16,  8.49s/it] 61%|██████    | 2330/3837 [5:07:35<3:21:49,  8.04s/it] 61%|██████    | 2331/3837 [5:07:43<3:23:23,  8.10s/it] 61%|██████    | 2332/3837 [5:07:50<3:15:20,  7.79s/it] 61%|██████    | 2333/3837 [5:07:58<3:18:51,  7.93s/it] 61%|██████    | 2334/3837 [5:08:06<3:20:36,  8.01s/it] 61%|██████    | 2335/3837 [5:08:13<3:12:17,  7.68s/it] 61%|██████    | 2336/3837 [5:08:21<3:16:17,  7.85s/it] 61%|██████    | 2337/3837 [5:08:29<3:10:18,  7.61s/it] 61%|██████    | 2338/3837 [5:08:37<3:14:22,  7.78s/it] 61%|██████    | 2339/3837 [5:08:45<3:17:51,  7.92s/it] 61%|██████    | 2340/3837 [5:08:52<3:10:58,  7.65s/it]                                                       {'loss': 3.9538, 'grad_norm': 10.022808074951172, 'learning_rate': 6.978965882492581e-06, 'epoch': 0.61}
 61%|██████    | 2340/3837 [5:08:52<3:10:58,  7.65s/it] 61%|██████    | 2341/3837 [5:08:59<3:05:38,  7.45s/it] 61%|██████    | 2342/3837 [5:09:07<3:11:20,  7.68s/it] 61%|██████    | 2343/3837 [5:09:15<3:15:18,  7.84s/it] 61%|██████    | 2344/3837 [5:09:24<3:18:30,  7.98s/it] 61%|██████    | 2345/3837 [5:09:32<3:20:23,  8.06s/it] 61%|██████    | 2346/3837 [5:09:40<3:21:36,  8.11s/it] 61%|██████    | 2347/3837 [5:09:47<3:12:30,  7.75s/it] 61%|██████    | 2348/3837 [5:09:55<3:15:32,  7.88s/it] 61%|██████    | 2349/3837 [5:10:02<3:08:15,  7.59s/it] 61%|██████    | 2350/3837 [5:10:10<3:12:37,  7.77s/it] 61%|██████▏   | 2351/3837 [5:10:19<3:16:17,  7.93s/it] 61%|██████▏   | 2352/3837 [5:10:27<3:18:25,  8.02s/it] 61%|██████▏   | 2353/3837 [5:10:35<3:19:33,  8.07s/it] 61%|██████▏   | 2354/3837 [5:10:43<3:20:46,  8.12s/it] 61%|██████▏   | 2355/3837 [5:10:52<3:21:18,  8.15s/it] 61%|██████▏   | 2356/3837 [5:11:00<3:21:39,  8.17s/it] 61%|██████▏   | 2357/3837 [5:11:07<3:12:07,  7.79s/it] 61%|██████▏   | 2358/3837 [5:11:16<3:24:33,  8.30s/it] 61%|██████▏   | 2359/3837 [5:11:23<3:13:59,  7.88s/it] 62%|██████▏   | 2360/3837 [5:11:31<3:16:44,  7.99s/it]                                                       {'loss': 3.8101, 'grad_norm': 11.245535850524902, 'learning_rate': 6.818436610738883e-06, 'epoch': 0.61}
 62%|██████▏   | 2360/3837 [5:11:31<3:16:44,  7.99s/it] 62%|██████▏   | 2361/3837 [5:11:39<3:17:59,  8.05s/it] 62%|██████▏   | 2362/3837 [5:11:46<3:10:04,  7.73s/it] 62%|██████▏   | 2363/3837 [5:11:55<3:13:48,  7.89s/it] 62%|██████▏   | 2364/3837 [5:12:03<3:16:05,  7.99s/it] 62%|██████▏   | 2365/3837 [5:12:12<3:27:08,  8.44s/it] 62%|██████▏   | 2366/3837 [5:12:19<3:16:07,  8.00s/it] 62%|██████▏   | 2367/3837 [5:12:28<3:17:58,  8.08s/it] 62%|██████▏   | 2368/3837 [5:12:36<3:19:08,  8.13s/it] 62%|██████▏   | 2369/3837 [5:12:44<3:19:39,  8.16s/it] 62%|██████▏   | 2370/3837 [5:12:52<3:20:23,  8.20s/it] 62%|██████▏   | 2371/3837 [5:12:59<3:11:10,  7.82s/it] 62%|██████▏   | 2372/3837 [5:13:08<3:14:01,  7.95s/it] 62%|██████▏   | 2373/3837 [5:13:15<3:06:38,  7.65s/it] 62%|██████▏   | 2374/3837 [5:13:23<3:11:09,  7.84s/it] 62%|██████▏   | 2375/3837 [5:13:30<3:05:11,  7.60s/it] 62%|██████▏   | 2376/3837 [5:13:39<3:19:09,  8.18s/it] 62%|██████▏   | 2377/3837 [5:13:46<3:10:09,  7.81s/it] 62%|██████▏   | 2378/3837 [5:13:53<3:04:20,  7.58s/it] 62%|██████▏   | 2379/3837 [5:14:02<3:09:01,  7.78s/it] 62%|██████▏   | 2380/3837 [5:14:10<3:12:44,  7.94s/it]                                                       {'loss': 3.7183, 'grad_norm': 9.926983833312988, 'learning_rate': 6.658814471341592e-06, 'epoch': 0.62}
 62%|██████▏   | 2380/3837 [5:14:10<3:12:44,  7.94s/it] 62%|██████▏   | 2381/3837 [5:14:18<3:14:30,  8.02s/it] 62%|██████▏   | 2382/3837 [5:14:25<3:07:32,  7.73s/it] 62%|██████▏   | 2383/3837 [5:14:34<3:11:30,  7.90s/it] 62%|██████▏   | 2384/3837 [5:14:42<3:13:45,  8.00s/it] 62%|██████▏   | 2385/3837 [5:14:49<3:06:41,  7.71s/it] 62%|██████▏   | 2386/3837 [5:14:57<3:09:47,  7.85s/it] 62%|██████▏   | 2387/3837 [5:15:04<3:03:03,  7.58s/it] 62%|██████▏   | 2388/3837 [5:15:12<3:07:23,  7.76s/it] 62%|██████▏   | 2389/3837 [5:15:20<3:10:30,  7.89s/it] 62%|██████▏   | 2390/3837 [5:15:29<3:12:29,  7.98s/it] 62%|██████▏   | 2391/3837 [5:15:37<3:14:02,  8.05s/it] 62%|██████▏   | 2392/3837 [5:15:45<3:15:09,  8.10s/it] 62%|██████▏   | 2393/3837 [5:15:52<3:07:11,  7.78s/it] 62%|██████▏   | 2394/3837 [5:16:00<3:10:29,  7.92s/it] 62%|██████▏   | 2395/3837 [5:16:08<3:12:02,  7.99s/it] 62%|██████▏   | 2396/3837 [5:16:17<3:13:57,  8.08s/it] 62%|██████▏   | 2397/3837 [5:16:25<3:15:20,  8.14s/it] 62%|██████▏   | 2398/3837 [5:16:33<3:16:16,  8.18s/it] 63%|██████▎   | 2399/3837 [5:16:41<3:16:33,  8.20s/it] 63%|██████▎   | 2400/3837 [5:16:48<3:08:04,  7.85s/it]                                                       {'loss': 3.9612, 'grad_norm': 12.291942596435547, 'learning_rate': 6.5001449760160914e-06, 'epoch': 0.63}
 63%|██████▎   | 2400/3837 [5:16:49<3:08:04,  7.85s/it] 63%|██████▎   | 2401/3837 [5:16:58<3:20:18,  8.37s/it] 63%|██████▎   | 2402/3837 [5:17:06<3:19:29,  8.34s/it] 63%|██████▎   | 2403/3837 [5:17:15<3:18:05,  8.29s/it] 63%|██████▎   | 2404/3837 [5:17:23<3:17:11,  8.26s/it] 63%|██████▎   | 2405/3837 [5:17:30<3:07:49,  7.87s/it] 63%|██████▎   | 2406/3837 [5:17:37<3:01:39,  7.62s/it] 63%|██████▎   | 2407/3837 [5:17:45<3:05:55,  7.80s/it] 63%|██████▎   | 2408/3837 [5:17:52<2:59:34,  7.54s/it] 63%|██████▎   | 2409/3837 [5:18:00<3:03:57,  7.73s/it] 63%|██████▎   | 2410/3837 [5:18:08<3:07:17,  7.88s/it] 63%|██████▎   | 2411/3837 [5:18:15<3:01:07,  7.62s/it] 63%|██████▎   | 2412/3837 [5:18:23<3:04:56,  7.79s/it] 63%|██████▎   | 2413/3837 [5:18:30<2:59:36,  7.57s/it] 63%|██████▎   | 2414/3837 [5:18:40<3:13:56,  8.18s/it] 63%|██████▎   | 2415/3837 [5:18:47<3:06:47,  7.88s/it] 63%|██████▎   | 2416/3837 [5:18:54<3:00:29,  7.62s/it] 63%|██████▎   | 2417/3837 [5:19:01<2:55:40,  7.42s/it] 63%|██████▎   | 2418/3837 [5:19:08<2:52:04,  7.28s/it] 63%|██████▎   | 2419/3837 [5:19:15<2:49:19,  7.16s/it] 63%|██████▎   | 2420/3837 [5:19:22<2:47:00,  7.07s/it]                                                       {'loss': 4.0596, 'grad_norm': 9.480598449707031, 'learning_rate': 6.3424733648583885e-06, 'epoch': 0.63}
 63%|██████▎   | 2420/3837 [5:19:22<2:47:00,  7.07s/it] 63%|██████▎   | 2421/3837 [5:19:29<2:48:05,  7.12s/it] 63%|██████▎   | 2422/3837 [5:19:37<2:55:45,  7.45s/it] 63%|██████▎   | 2423/3837 [5:19:46<3:01:09,  7.69s/it] 63%|██████▎   | 2424/3837 [5:19:53<2:55:37,  7.46s/it] 63%|██████▎   | 2425/3837 [5:19:59<2:51:42,  7.30s/it] 63%|██████▎   | 2426/3837 [5:20:06<2:48:49,  7.18s/it] 63%|██████▎   | 2427/3837 [5:20:13<2:47:28,  7.13s/it] 63%|██████▎   | 2428/3837 [5:20:20<2:45:37,  7.05s/it] 63%|██████▎   | 2429/3837 [5:20:29<2:53:55,  7.41s/it] 63%|██████▎   | 2430/3837 [5:20:37<2:59:32,  7.66s/it] 63%|██████▎   | 2431/3837 [5:20:45<3:03:51,  7.85s/it] 63%|██████▎   | 2432/3837 [5:20:53<3:06:38,  7.97s/it] 63%|██████▎   | 2433/3837 [5:21:01<3:07:51,  8.03s/it] 63%|██████▎   | 2434/3837 [5:21:10<3:08:38,  8.07s/it] 63%|██████▎   | 2435/3837 [5:21:17<3:00:30,  7.73s/it] 63%|██████▎   | 2436/3837 [5:21:26<3:12:54,  8.26s/it] 64%|██████▎   | 2437/3837 [5:21:34<3:12:49,  8.26s/it] 64%|██████▎   | 2438/3837 [5:21:43<3:12:12,  8.24s/it] 64%|██████▎   | 2439/3837 [5:21:51<3:11:42,  8.23s/it] 64%|██████▎   | 2440/3837 [5:21:59<3:12:26,  8.27s/it]                                                       {'loss': 3.8252, 'grad_norm': 9.982366561889648, 'learning_rate': 6.185844593446186e-06, 'epoch': 0.64}
 64%|██████▎   | 2440/3837 [5:21:59<3:12:26,  8.27s/it] 64%|██████▎   | 2441/3837 [5:22:07<3:12:16,  8.26s/it] 64%|██████▎   | 2442/3837 [5:22:14<3:02:48,  7.86s/it] 64%|██████▎   | 2443/3837 [5:22:22<3:04:54,  7.96s/it] 64%|██████▎   | 2444/3837 [5:22:29<2:57:39,  7.65s/it] 64%|██████▎   | 2445/3837 [5:22:38<3:02:00,  7.84s/it] 64%|██████▎   | 2446/3837 [5:22:46<3:04:06,  7.94s/it] 64%|██████▍   | 2447/3837 [5:22:54<3:05:37,  8.01s/it] 64%|██████▍   | 2448/3837 [5:23:01<2:58:21,  7.70s/it] 64%|██████▍   | 2449/3837 [5:23:09<3:01:40,  7.85s/it] 64%|██████▍   | 2450/3837 [5:23:16<2:55:13,  7.58s/it] 64%|██████▍   | 2451/3837 [5:23:24<2:59:46,  7.78s/it] 64%|██████▍   | 2452/3837 [5:23:31<2:54:07,  7.54s/it] 64%|██████▍   | 2453/3837 [5:23:40<2:58:35,  7.74s/it] 64%|██████▍   | 2454/3837 [5:23:48<3:01:30,  7.87s/it] 64%|██████▍   | 2455/3837 [5:23:56<3:04:20,  8.00s/it] 64%|██████▍   | 2456/3837 [5:24:04<3:06:05,  8.09s/it] 64%|██████▍   | 2457/3837 [5:24:11<2:58:09,  7.75s/it] 64%|██████▍   | 2458/3837 [5:24:18<2:52:22,  7.50s/it] 64%|██████▍   | 2459/3837 [5:24:27<2:58:02,  7.75s/it] 64%|██████▍   | 2460/3837 [5:24:35<3:01:27,  7.91s/it]                                                       {'loss': 3.8578, 'grad_norm': 12.009989738464355, 'learning_rate': 6.030303320021085e-06, 'epoch': 0.64}
 64%|██████▍   | 2460/3837 [5:24:35<3:01:27,  7.91s/it] 64%|██████▍   | 2461/3837 [5:24:43<3:03:31,  8.00s/it] 64%|██████▍   | 2462/3837 [5:24:50<2:56:22,  7.70s/it] 64%|██████▍   | 2463/3837 [5:24:58<3:00:00,  7.86s/it] 64%|██████▍   | 2464/3837 [5:25:05<2:54:14,  7.61s/it] 64%|██████▍   | 2465/3837 [5:25:12<2:49:04,  7.39s/it] 64%|██████▍   | 2466/3837 [5:25:20<2:54:38,  7.64s/it] 64%|██████▍   | 2467/3837 [5:25:29<2:58:49,  7.83s/it] 64%|██████▍   | 2468/3837 [5:25:37<3:01:22,  7.95s/it] 64%|██████▍   | 2469/3837 [5:25:45<3:03:13,  8.04s/it] 64%|██████▍   | 2470/3837 [5:25:53<3:04:02,  8.08s/it] 64%|██████▍   | 2471/3837 [5:26:00<2:56:17,  7.74s/it] 64%|██████▍   | 2472/3837 [5:26:07<2:51:15,  7.53s/it] 64%|██████▍   | 2473/3837 [5:26:16<2:56:25,  7.76s/it] 64%|██████▍   | 2474/3837 [5:26:24<2:59:45,  7.91s/it] 65%|██████▍   | 2475/3837 [5:26:33<3:10:22,  8.39s/it] 65%|██████▍   | 2476/3837 [5:26:42<3:09:14,  8.34s/it] 65%|██████▍   | 2477/3837 [5:26:50<3:08:02,  8.30s/it] 65%|██████▍   | 2478/3837 [5:26:59<3:16:05,  8.66s/it] 65%|██████▍   | 2479/3837 [5:27:08<3:12:47,  8.52s/it] 65%|██████▍   | 2480/3837 [5:27:14<3:01:50,  8.04s/it]                                                       {'loss': 3.8615, 'grad_norm': 9.877748489379883, 'learning_rate': 5.875893892755542e-06, 'epoch': 0.65}
 65%|██████▍   | 2480/3837 [5:27:14<3:01:50,  8.04s/it] 65%|██████▍   | 2481/3837 [5:27:24<3:11:11,  8.46s/it] 65%|██████▍   | 2482/3837 [5:27:32<3:09:28,  8.39s/it] 65%|██████▍   | 2483/3837 [5:27:39<2:59:30,  7.95s/it] 65%|██████▍   | 2484/3837 [5:27:47<3:00:49,  8.02s/it] 65%|██████▍   | 2485/3837 [5:27:55<3:01:48,  8.07s/it] 65%|██████▍   | 2486/3837 [5:28:04<3:02:17,  8.10s/it] 65%|██████▍   | 2487/3837 [5:28:12<3:03:12,  8.14s/it] 65%|██████▍   | 2488/3837 [5:28:19<2:55:10,  7.79s/it] 65%|██████▍   | 2489/3837 [5:28:27<2:57:56,  7.92s/it] 65%|██████▍   | 2490/3837 [5:28:35<2:59:31,  8.00s/it] 65%|██████▍   | 2491/3837 [5:28:43<3:00:37,  8.05s/it] 65%|██████▍   | 2492/3837 [5:28:50<2:53:30,  7.74s/it] 65%|██████▍   | 2493/3837 [5:28:57<2:48:17,  7.51s/it] 65%|██████▍   | 2494/3837 [5:29:06<2:53:14,  7.74s/it] 65%|██████▌   | 2495/3837 [5:29:13<2:47:53,  7.51s/it] 65%|██████▌   | 2496/3837 [5:29:20<2:43:59,  7.34s/it] 65%|██████▌   | 2497/3837 [5:29:28<2:50:15,  7.62s/it] 65%|██████▌   | 2498/3837 [5:29:36<2:54:03,  7.80s/it] 65%|██████▌   | 2499/3837 [5:29:44<2:57:43,  7.97s/it] 65%|██████▌   | 2500/3837 [5:29:53<2:59:17,  8.05s/it]                                                       {'loss': 3.7307, 'grad_norm': 10.883020401000977, 'learning_rate': 5.722660337108263e-06, 'epoch': 0.65}
 65%|██████▌   | 2500/3837 [5:29:53<2:59:17,  8.05s/it] 65%|██████▌   | 2501/3837 [5:30:01<3:00:24,  8.10s/it] 65%|██████▌   | 2502/3837 [5:30:09<3:01:24,  8.15s/it] 65%|██████▌   | 2503/3837 [5:30:17<3:02:05,  8.19s/it] 65%|██████▌   | 2504/3837 [5:30:26<3:02:06,  8.20s/it] 65%|██████▌   | 2505/3837 [5:30:34<3:02:49,  8.24s/it] 65%|██████▌   | 2506/3837 [5:30:42<3:02:30,  8.23s/it] 65%|██████▌   | 2507/3837 [5:30:50<3:02:04,  8.21s/it] 65%|██████▌   | 2508/3837 [5:30:57<2:53:38,  7.84s/it] 65%|██████▌   | 2509/3837 [5:31:06<2:55:58,  7.95s/it] 65%|██████▌   | 2510/3837 [5:31:14<2:57:45,  8.04s/it] 65%|██████▌   | 2511/3837 [5:31:22<2:59:27,  8.12s/it] 65%|██████▌   | 2512/3837 [5:31:30<3:00:00,  8.15s/it] 65%|██████▌   | 2513/3837 [5:31:39<3:00:30,  8.18s/it] 66%|██████▌   | 2514/3837 [5:31:47<3:00:52,  8.20s/it] 66%|██████▌   | 2515/3837 [5:31:55<3:01:10,  8.22s/it] 66%|██████▌   | 2516/3837 [5:32:03<2:56:10,  8.00s/it] 66%|██████▌   | 2517/3837 [5:32:11<2:58:13,  8.10s/it] 66%|██████▌   | 2518/3837 [5:32:19<2:58:42,  8.13s/it] 66%|██████▌   | 2519/3837 [5:32:26<2:51:37,  7.81s/it] 66%|██████▌   | 2520/3837 [5:32:33<2:45:55,  7.56s/it]                                                       {'loss': 3.7585, 'grad_norm': 10.700980186462402, 'learning_rate': 5.570646343271584e-06, 'epoch': 0.66}
 66%|██████▌   | 2520/3837 [5:32:33<2:45:55,  7.56s/it] 66%|██████▌   | 2521/3837 [5:32:41<2:50:06,  7.76s/it] 66%|██████▌   | 2522/3837 [5:32:50<2:52:37,  7.88s/it] 66%|██████▌   | 2523/3837 [5:32:58<2:55:07,  8.00s/it] 66%|██████▌   | 2524/3837 [5:33:06<2:56:37,  8.07s/it] 66%|██████▌   | 2525/3837 [5:33:13<2:49:18,  7.74s/it] 66%|██████▌   | 2526/3837 [5:33:23<3:00:46,  8.27s/it] 66%|██████▌   | 2527/3837 [5:33:31<3:00:18,  8.26s/it] 66%|██████▌   | 2528/3837 [5:33:39<3:00:04,  8.25s/it] 66%|██████▌   | 2529/3837 [5:33:47<2:59:30,  8.23s/it] 66%|██████▌   | 2530/3837 [5:33:54<2:50:55,  7.85s/it] 66%|██████▌   | 2531/3837 [5:34:02<2:52:50,  7.94s/it] 66%|██████▌   | 2532/3837 [5:34:11<2:54:43,  8.03s/it] 66%|██████▌   | 2533/3837 [5:34:19<2:56:05,  8.10s/it] 66%|██████▌   | 2534/3837 [5:34:28<3:05:07,  8.52s/it] 66%|██████▌   | 2535/3837 [5:34:36<3:02:29,  8.41s/it] 66%|██████▌   | 2536/3837 [5:34:45<3:01:19,  8.36s/it] 66%|██████▌   | 2537/3837 [5:34:54<3:09:04,  8.73s/it] 66%|██████▌   | 2538/3837 [5:35:04<3:14:00,  8.96s/it] 66%|██████▌   | 2539/3837 [5:35:12<3:09:18,  8.75s/it] 66%|██████▌   | 2540/3837 [5:35:19<2:57:15,  8.20s/it]                                                       {'loss': 3.8536, 'grad_norm': 8.13733959197998, 'learning_rate': 5.419895253714462e-06, 'epoch': 0.66}
 66%|██████▌   | 2540/3837 [5:35:19<2:57:15,  8.20s/it] 66%|██████▌   | 2541/3837 [5:35:28<3:05:37,  8.59s/it] 66%|██████▌   | 2542/3837 [5:35:37<3:03:20,  8.49s/it] 66%|██████▋   | 2543/3837 [5:35:45<3:01:19,  8.41s/it] 66%|██████▋   | 2544/3837 [5:35:53<3:00:09,  8.36s/it] 66%|██████▋   | 2545/3837 [5:36:03<3:07:26,  8.71s/it] 66%|██████▋   | 2546/3837 [5:36:11<3:04:18,  8.57s/it] 66%|██████▋   | 2547/3837 [5:36:19<3:01:55,  8.46s/it] 66%|██████▋   | 2548/3837 [5:36:27<3:00:11,  8.39s/it] 66%|██████▋   | 2549/3837 [5:36:36<2:58:57,  8.34s/it] 66%|██████▋   | 2550/3837 [5:36:44<2:59:00,  8.35s/it] 66%|██████▋   | 2551/3837 [5:36:52<2:58:02,  8.31s/it] 67%|██████▋   | 2552/3837 [5:37:00<2:57:24,  8.28s/it] 67%|██████▋   | 2553/3837 [5:37:09<2:56:47,  8.26s/it] 67%|██████▋   | 2554/3837 [5:37:15<2:47:39,  7.84s/it] 67%|██████▋   | 2555/3837 [5:37:22<2:42:04,  7.59s/it] 67%|██████▋   | 2556/3837 [5:37:29<2:37:40,  7.39s/it] 67%|██████▋   | 2557/3837 [5:37:38<2:42:40,  7.63s/it] 67%|██████▋   | 2558/3837 [5:37:46<2:46:08,  7.79s/it] 67%|██████▋   | 2559/3837 [5:37:53<2:40:27,  7.53s/it] 67%|██████▋   | 2560/3837 [5:38:01<2:45:15,  7.76s/it]                                                       {'loss': 3.9534, 'grad_norm': 11.889455795288086, 'learning_rate': 5.270450050824605e-06, 'epoch': 0.67}
 67%|██████▋   | 2560/3837 [5:38:01<2:45:15,  7.76s/it] 67%|██████▋   | 2561/3837 [5:38:09<2:48:10,  7.91s/it] 67%|██████▋   | 2562/3837 [5:38:17<2:49:54,  8.00s/it] 67%|██████▋   | 2563/3837 [5:38:24<2:43:39,  7.71s/it] 67%|██████▋   | 2564/3837 [5:38:34<2:55:28,  8.27s/it] 67%|██████▋   | 2565/3837 [5:38:42<2:54:53,  8.25s/it] 67%|██████▋   | 2566/3837 [5:38:52<3:02:31,  8.62s/it] 67%|██████▋   | 2567/3837 [5:39:00<2:59:50,  8.50s/it] 67%|██████▋   | 2568/3837 [5:39:07<2:49:41,  8.02s/it] 67%|██████▋   | 2569/3837 [5:39:14<2:42:32,  7.69s/it] 67%|██████▋   | 2570/3837 [5:39:21<2:37:57,  7.48s/it] 67%|██████▋   | 2571/3837 [5:39:28<2:34:24,  7.32s/it] 67%|██████▋   | 2572/3837 [5:39:36<2:39:43,  7.58s/it] 67%|██████▋   | 2573/3837 [5:39:44<2:43:30,  7.76s/it] 67%|██████▋   | 2574/3837 [5:39:51<2:38:40,  7.54s/it] 67%|██████▋   | 2575/3837 [5:39:59<2:42:41,  7.73s/it] 67%|██████▋   | 2576/3837 [5:40:07<2:45:12,  7.86s/it] 67%|██████▋   | 2577/3837 [5:40:17<2:55:18,  8.35s/it] 67%|██████▋   | 2578/3837 [5:40:25<2:54:38,  8.32s/it] 67%|██████▋   | 2579/3837 [5:40:33<2:54:08,  8.31s/it] 67%|██████▋   | 2580/3837 [5:40:42<2:54:17,  8.32s/it]                                                       {'loss': 3.984, 'grad_norm': 10.596364974975586, 'learning_rate': 5.122353344653253e-06, 'epoch': 0.67}
 67%|██████▋   | 2580/3837 [5:40:42<2:54:17,  8.32s/it] 67%|██████▋   | 2581/3837 [5:40:50<2:53:37,  8.29s/it] 67%|██████▋   | 2582/3837 [5:40:58<2:53:02,  8.27s/it] 67%|██████▋   | 2583/3837 [5:41:05<2:44:36,  7.88s/it] 67%|██████▋   | 2584/3837 [5:41:13<2:46:37,  7.98s/it] 67%|██████▋   | 2585/3837 [5:41:22<2:47:55,  8.05s/it] 67%|██████▋   | 2586/3837 [5:41:31<2:56:40,  8.47s/it] 67%|██████▋   | 2587/3837 [5:41:39<2:55:54,  8.44s/it] 67%|██████▋   | 2588/3837 [5:41:46<2:46:20,  7.99s/it] 67%|██████▋   | 2589/3837 [5:41:55<2:48:04,  8.08s/it] 68%|██████▊   | 2590/3837 [5:42:03<2:48:42,  8.12s/it] 68%|██████▊   | 2591/3837 [5:42:11<2:48:55,  8.13s/it] 68%|██████▊   | 2592/3837 [5:42:19<2:49:20,  8.16s/it] 68%|██████▊   | 2593/3837 [5:42:27<2:49:12,  8.16s/it] 68%|██████▊   | 2594/3837 [5:42:34<2:41:24,  7.79s/it] 68%|██████▊   | 2595/3837 [5:42:41<2:36:00,  7.54s/it] 68%|██████▊   | 2596/3837 [5:42:50<2:39:57,  7.73s/it] 68%|██████▊   | 2597/3837 [5:42:58<2:43:12,  7.90s/it] 68%|██████▊   | 2598/3837 [5:43:07<2:52:47,  8.37s/it] 68%|██████▊   | 2599/3837 [5:43:14<2:44:20,  7.97s/it] 68%|██████▊   | 2600/3837 [5:43:23<2:46:03,  8.05s/it]                                                       {'loss': 3.8549, 'grad_norm': 11.742351531982422, 'learning_rate': 4.975647360766147e-06, 'epoch': 0.68}
 68%|██████▊   | 2600/3837 [5:43:23<2:46:03,  8.05s/it] 68%|██████▊   | 2601/3837 [5:43:31<2:47:05,  8.11s/it] 68%|██████▊   | 2602/3837 [5:43:36<2:31:53,  7.38s/it] 68%|██████▊   | 2603/3837 [5:43:45<2:37:19,  7.65s/it] 68%|██████▊   | 2604/3837 [5:43:52<2:32:43,  7.43s/it] 68%|██████▊   | 2605/3837 [5:43:59<2:29:36,  7.29s/it] 68%|██████▊   | 2606/3837 [5:44:07<2:35:28,  7.58s/it] 68%|██████▊   | 2607/3837 [5:44:15<2:39:08,  7.76s/it] 68%|██████▊   | 2608/3837 [5:44:23<2:41:31,  7.89s/it] 68%|██████▊   | 2609/3837 [5:44:30<2:35:49,  7.61s/it] 68%|██████▊   | 2610/3837 [5:44:38<2:39:32,  7.80s/it] 68%|██████▊   | 2611/3837 [5:44:45<2:34:01,  7.54s/it] 68%|██████▊   | 2612/3837 [5:44:54<2:38:22,  7.76s/it] 68%|██████▊   | 2613/3837 [5:45:02<2:41:08,  7.90s/it] 68%|██████▊   | 2614/3837 [5:45:10<2:42:58,  8.00s/it] 68%|██████▊   | 2615/3837 [5:45:18<2:44:04,  8.06s/it] 68%|██████▊   | 2616/3837 [5:45:25<2:36:56,  7.71s/it] 68%|██████▊   | 2617/3837 [5:45:32<2:33:30,  7.55s/it] 68%|██████▊   | 2618/3837 [5:45:39<2:29:18,  7.35s/it] 68%|██████▊   | 2619/3837 [5:45:48<2:34:42,  7.62s/it] 68%|██████▊   | 2620/3837 [5:45:56<2:38:17,  7.80s/it]                                                       {'loss': 3.7056, 'grad_norm': 11.651729583740234, 'learning_rate': 4.830373928204098e-06, 'epoch': 0.68}
 68%|██████▊   | 2620/3837 [5:45:56<2:38:17,  7.80s/it] 68%|██████▊   | 2621/3837 [5:46:04<2:40:29,  7.92s/it] 68%|██████▊   | 2622/3837 [5:46:12<2:42:13,  8.01s/it] 68%|██████▊   | 2623/3837 [5:46:20<2:43:38,  8.09s/it] 68%|██████▊   | 2624/3837 [5:46:29<2:44:33,  8.14s/it] 68%|██████▊   | 2625/3837 [5:46:37<2:45:35,  8.20s/it] 68%|██████▊   | 2626/3837 [5:46:45<2:45:34,  8.20s/it] 68%|██████▊   | 2627/3837 [5:46:53<2:45:26,  8.20s/it] 68%|██████▊   | 2628/3837 [5:47:00<2:37:36,  7.82s/it] 69%|██████▊   | 2629/3837 [5:47:07<2:32:04,  7.55s/it] 69%|██████▊   | 2630/3837 [5:47:16<2:36:01,  7.76s/it] 69%|██████▊   | 2631/3837 [5:47:23<2:31:10,  7.52s/it] 69%|██████▊   | 2632/3837 [5:47:31<2:35:17,  7.73s/it] 69%|██████▊   | 2633/3837 [5:47:39<2:38:05,  7.88s/it] 69%|██████▊   | 2634/3837 [5:47:46<2:32:32,  7.61s/it] 69%|██████▊   | 2635/3837 [5:47:53<2:28:43,  7.42s/it] 69%|██████▊   | 2636/3837 [5:48:00<2:25:40,  7.28s/it] 69%|██████▊   | 2637/3837 [5:48:07<2:23:52,  7.19s/it] 69%|██████▉   | 2638/3837 [5:48:14<2:22:17,  7.12s/it] 69%|██████▉   | 2639/3837 [5:48:21<2:21:16,  7.08s/it] 69%|██████▉   | 2640/3837 [5:48:28<2:20:17,  7.03s/it]                                                       {'loss': 3.6264, 'grad_norm': 10.251343727111816, 'learning_rate': 4.686574467556638e-06, 'epoch': 0.69}
 69%|██████▉   | 2640/3837 [5:48:28<2:20:17,  7.03s/it] 69%|██████▉   | 2641/3837 [5:48:36<2:27:22,  7.39s/it] 69%|██████▉   | 2642/3837 [5:48:44<2:32:01,  7.63s/it] 69%|██████▉   | 2643/3837 [5:48:52<2:35:12,  7.80s/it] 69%|██████▉   | 2644/3837 [5:49:01<2:37:37,  7.93s/it] 69%|██████▉   | 2645/3837 [5:49:09<2:39:01,  8.00s/it] 69%|██████▉   | 2646/3837 [5:49:17<2:40:10,  8.07s/it] 69%|██████▉   | 2647/3837 [5:49:25<2:40:47,  8.11s/it] 69%|██████▉   | 2648/3837 [5:49:33<2:41:24,  8.15s/it] 69%|██████▉   | 2649/3837 [5:49:42<2:41:42,  8.17s/it] 69%|██████▉   | 2650/3837 [5:49:51<2:49:25,  8.56s/it] 69%|██████▉   | 2651/3837 [5:49:59<2:47:32,  8.48s/it] 69%|██████▉   | 2652/3837 [5:50:08<2:45:57,  8.40s/it] 69%|██████▉   | 2653/3837 [5:50:17<2:52:19,  8.73s/it] 69%|██████▉   | 2654/3837 [5:50:24<2:42:07,  8.22s/it] 69%|██████▉   | 2655/3837 [5:50:32<2:41:47,  8.21s/it] 69%|██████▉   | 2656/3837 [5:50:42<2:49:14,  8.60s/it] 69%|██████▉   | 2657/3837 [5:50:50<2:47:18,  8.51s/it] 69%|██████▉   | 2658/3837 [5:51:00<2:52:58,  8.80s/it] 69%|██████▉   | 2659/3837 [5:51:07<2:42:24,  8.27s/it] 69%|██████▉   | 2660/3837 [5:51:15<2:41:51,  8.25s/it]                                                       {'loss': 3.8519, 'grad_norm': 9.55517292022705, 'learning_rate': 4.5442899791521026e-06, 'epoch': 0.69}
 69%|██████▉   | 2660/3837 [5:51:15<2:41:51,  8.25s/it] 69%|██████▉   | 2661/3837 [5:51:23<2:41:27,  8.24s/it] 69%|██████▉   | 2662/3837 [5:51:31<2:41:28,  8.25s/it] 69%|██████▉   | 2663/3837 [5:51:38<2:33:17,  7.83s/it] 69%|██████▉   | 2664/3837 [5:51:45<2:28:07,  7.58s/it] 69%|██████▉   | 2665/3837 [5:51:53<2:31:48,  7.77s/it] 69%|██████▉   | 2666/3837 [5:52:02<2:34:22,  7.91s/it] 70%|██████▉   | 2667/3837 [5:52:10<2:36:16,  8.01s/it] 70%|██████▉   | 2668/3837 [5:52:19<2:44:51,  8.46s/it] 70%|██████▉   | 2669/3837 [5:52:27<2:40:41,  8.25s/it] 70%|██████▉   | 2670/3837 [5:52:35<2:40:27,  8.25s/it] 70%|██████▉   | 2671/3837 [5:52:44<2:40:25,  8.26s/it] 70%|██████▉   | 2672/3837 [5:52:51<2:32:50,  7.87s/it] 70%|██████▉   | 2673/3837 [5:52:59<2:34:57,  7.99s/it] 70%|██████▉   | 2674/3837 [5:53:07<2:36:05,  8.05s/it] 70%|██████▉   | 2675/3837 [5:53:15<2:36:55,  8.10s/it] 70%|██████▉   | 2676/3837 [5:53:22<2:30:06,  7.76s/it] 70%|██████▉   | 2677/3837 [5:53:30<2:30:55,  7.81s/it] 70%|██████▉   | 2678/3837 [5:53:40<2:40:23,  8.30s/it] 70%|██████▉   | 2679/3837 [5:53:48<2:39:38,  8.27s/it] 70%|██████▉   | 2680/3837 [5:53:56<2:39:19,  8.26s/it]                                                       {'loss': 3.6975, 'grad_norm': 10.76073932647705, 'learning_rate': 4.403561031367562e-06, 'epoch': 0.7}
 70%|██████▉   | 2680/3837 [5:53:56<2:39:19,  8.26s/it] 70%|██████▉   | 2681/3837 [5:54:03<2:31:29,  7.86s/it] 70%|██████▉   | 2682/3837 [5:54:11<2:33:33,  7.98s/it] 70%|██████▉   | 2683/3837 [5:54:18<2:27:39,  7.68s/it] 70%|██████▉   | 2684/3837 [5:54:25<2:22:54,  7.44s/it] 70%|██████▉   | 2685/3837 [5:54:32<2:20:01,  7.29s/it] 70%|███████   | 2686/3837 [5:54:40<2:25:24,  7.58s/it] 70%|███████   | 2687/3837 [5:54:49<2:29:14,  7.79s/it] 70%|███████   | 2688/3837 [5:54:56<2:24:23,  7.54s/it] 70%|███████   | 2689/3837 [5:55:04<2:28:03,  7.74s/it] 70%|███████   | 2690/3837 [5:55:12<2:30:25,  7.87s/it] 70%|███████   | 2691/3837 [5:55:20<2:32:10,  7.97s/it] 70%|███████   | 2692/3837 [5:55:27<2:26:32,  7.68s/it] 70%|███████   | 2693/3837 [5:55:35<2:30:02,  7.87s/it] 70%|███████   | 2694/3837 [5:55:44<2:32:00,  7.98s/it] 70%|███████   | 2695/3837 [5:55:52<2:33:10,  8.05s/it] 70%|███████   | 2696/3837 [5:56:00<2:34:09,  8.11s/it] 70%|███████   | 2697/3837 [5:56:08<2:31:58,  8.00s/it] 70%|███████   | 2698/3837 [5:56:16<2:33:06,  8.07s/it] 70%|███████   | 2699/3837 [5:56:26<2:41:25,  8.51s/it] 70%|███████   | 2700/3837 [5:56:33<2:32:40,  8.06s/it]                                                       {'loss': 3.8276, 'grad_norm': 11.325791358947754, 'learning_rate': 4.264427749061896e-06, 'epoch': 0.7}
 70%|███████   | 2700/3837 [5:56:33<2:32:40,  8.06s/it] 70%|███████   | 2701/3837 [5:56:40<2:26:32,  7.74s/it] 70%|███████   | 2702/3837 [5:56:47<2:22:15,  7.52s/it] 70%|███████   | 2703/3837 [5:56:55<2:26:01,  7.73s/it] 70%|███████   | 2704/3837 [5:57:02<2:21:55,  7.52s/it] 70%|███████   | 2705/3837 [5:57:10<2:25:45,  7.73s/it] 71%|███████   | 2706/3837 [5:57:18<2:28:25,  7.87s/it] 71%|███████   | 2707/3837 [5:57:27<2:30:59,  8.02s/it] 71%|███████   | 2708/3837 [5:57:34<2:25:13,  7.72s/it] 71%|███████   | 2709/3837 [5:57:41<2:23:15,  7.62s/it] 71%|███████   | 2710/3837 [5:57:49<2:22:27,  7.58s/it] 71%|███████   | 2711/3837 [5:57:57<2:25:48,  7.77s/it] 71%|███████   | 2712/3837 [5:58:05<2:28:11,  7.90s/it] 71%|███████   | 2713/3837 [5:58:12<2:25:31,  7.77s/it] 71%|███████   | 2714/3837 [5:58:21<2:27:57,  7.91s/it] 71%|███████   | 2715/3837 [5:58:29<2:29:28,  7.99s/it] 71%|███████   | 2716/3837 [5:58:38<2:37:45,  8.44s/it] 71%|███████   | 2717/3837 [5:58:47<2:36:19,  8.37s/it] 71%|███████   | 2718/3837 [5:58:55<2:35:27,  8.34s/it] 71%|███████   | 2719/3837 [5:59:03<2:34:39,  8.30s/it] 71%|███████   | 2720/3837 [5:59:10<2:27:20,  7.91s/it]                                                       {'loss': 3.7811, 'grad_norm': 11.209366798400879, 'learning_rate': 4.126929802135339e-06, 'epoch': 0.71}
 71%|███████   | 2720/3837 [5:59:10<2:27:20,  7.91s/it] 71%|███████   | 2721/3837 [5:59:18<2:28:48,  8.00s/it] 71%|███████   | 2722/3837 [5:59:27<2:30:00,  8.07s/it] 71%|███████   | 2723/3837 [5:59:33<2:23:41,  7.74s/it] 71%|███████   | 2724/3837 [5:59:42<2:26:34,  7.90s/it] 71%|███████   | 2725/3837 [5:59:49<2:21:10,  7.62s/it] 71%|███████   | 2726/3837 [5:59:57<2:24:17,  7.79s/it] 71%|███████   | 2727/3837 [6:00:04<2:19:59,  7.57s/it] 71%|███████   | 2728/3837 [6:00:12<2:23:46,  7.78s/it] 71%|███████   | 2729/3837 [6:00:20<2:26:14,  7.92s/it] 71%|███████   | 2730/3837 [6:00:29<2:27:57,  8.02s/it] 71%|███████   | 2731/3837 [6:00:37<2:28:50,  8.08s/it] 71%|███████   | 2732/3837 [6:00:45<2:29:48,  8.13s/it] 71%|███████   | 2733/3837 [6:00:53<2:30:03,  8.16s/it] 71%|███████▏  | 2734/3837 [6:01:00<2:23:39,  7.81s/it] 71%|███████▏  | 2735/3837 [6:01:09<2:25:31,  7.92s/it] 71%|███████▏  | 2736/3837 [6:01:17<2:27:19,  8.03s/it] 71%|███████▏  | 2737/3837 [6:01:25<2:28:23,  8.09s/it] 71%|███████▏  | 2738/3837 [6:01:33<2:28:52,  8.13s/it] 71%|███████▏  | 2739/3837 [6:01:42<2:29:20,  8.16s/it] 71%|███████▏  | 2740/3837 [6:01:50<2:29:19,  8.17s/it]                                                       {'loss': 3.6794, 'grad_norm': 10.287395477294922, 'learning_rate': 3.991106394218727e-06, 'epoch': 0.71}
 71%|███████▏  | 2740/3837 [6:01:50<2:29:19,  8.17s/it] 71%|███████▏  | 2741/3837 [6:01:58<2:29:17,  8.17s/it] 71%|███████▏  | 2742/3837 [6:02:06<2:29:16,  8.18s/it] 71%|███████▏  | 2743/3837 [6:02:13<2:22:33,  7.82s/it] 72%|███████▏  | 2744/3837 [6:02:20<2:17:23,  7.54s/it] 72%|███████▏  | 2745/3837 [6:02:27<2:13:43,  7.35s/it] 72%|███████▏  | 2746/3837 [6:02:35<2:18:38,  7.62s/it] 72%|███████▏  | 2747/3837 [6:02:43<2:21:39,  7.80s/it] 72%|███████▏  | 2748/3837 [6:02:52<2:23:44,  7.92s/it] 72%|███████▏  | 2749/3837 [6:03:00<2:25:04,  8.00s/it] 72%|███████▏  | 2750/3837 [6:03:08<2:26:44,  8.10s/it] 72%|███████▏  | 2751/3837 [6:03:15<2:20:11,  7.75s/it] 72%|███████▏  | 2752/3837 [6:03:23<2:22:51,  7.90s/it] 72%|███████▏  | 2753/3837 [6:03:32<2:24:31,  8.00s/it] 72%|███████▏  | 2754/3837 [6:03:42<2:38:23,  8.78s/it] 72%|███████▏  | 2755/3837 [6:03:50<2:35:13,  8.61s/it] 72%|███████▏  | 2756/3837 [6:03:57<2:27:21,  8.18s/it] 72%|███████▏  | 2757/3837 [6:04:06<2:27:25,  8.19s/it] 72%|███████▏  | 2758/3837 [6:04:13<2:20:23,  7.81s/it] 72%|███████▏  | 2759/3837 [6:04:20<2:15:35,  7.55s/it] 72%|███████▏  | 2760/3837 [6:04:29<2:25:49,  8.12s/it]                                                       {'loss': 3.7436, 'grad_norm': 12.562703132629395, 'learning_rate': 3.8569962514957e-06, 'epoch': 0.72}
 72%|███████▏  | 2760/3837 [6:04:29<2:25:49,  8.12s/it] 72%|███████▏  | 2761/3837 [6:04:37<2:23:47,  8.02s/it] 72%|███████▏  | 2762/3837 [6:04:45<2:24:35,  8.07s/it] 72%|███████▏  | 2763/3837 [6:04:52<2:18:52,  7.76s/it] 72%|███████▏  | 2764/3837 [6:04:59<2:15:18,  7.57s/it] 72%|███████▏  | 2765/3837 [6:05:07<2:18:41,  7.76s/it] 72%|███████▏  | 2766/3837 [6:05:14<2:14:17,  7.52s/it] 72%|███████▏  | 2767/3837 [6:05:21<2:11:08,  7.35s/it] 72%|███████▏  | 2768/3837 [6:05:28<2:08:43,  7.22s/it] 72%|███████▏  | 2769/3837 [6:05:35<2:07:35,  7.17s/it] 72%|███████▏  | 2770/3837 [6:05:45<2:19:52,  7.87s/it] 72%|███████▏  | 2771/3837 [6:05:53<2:21:27,  7.96s/it] 72%|███████▏  | 2772/3837 [6:06:03<2:30:02,  8.45s/it] 72%|███████▏  | 2773/3837 [6:06:11<2:28:38,  8.38s/it] 72%|███████▏  | 2774/3837 [6:06:18<2:22:24,  8.04s/it] 72%|███████▏  | 2775/3837 [6:06:28<2:30:12,  8.49s/it] 72%|███████▏  | 2776/3837 [6:06:36<2:28:35,  8.40s/it] 72%|███████▏  | 2777/3837 [6:06:44<2:27:27,  8.35s/it] 72%|███████▏  | 2778/3837 [6:06:52<2:26:52,  8.32s/it] 72%|███████▏  | 2779/3837 [6:06:59<2:20:02,  7.94s/it] 72%|███████▏  | 2780/3837 [6:07:06<2:14:41,  7.65s/it]                                                       {'loss': 3.6408, 'grad_norm': 10.575380325317383, 'learning_rate': 3.724637611661036e-06, 'epoch': 0.72}
 72%|███████▏  | 2780/3837 [6:07:06<2:14:41,  7.65s/it] 72%|███████▏  | 2781/3837 [6:07:16<2:24:17,  8.20s/it] 73%|███████▎  | 2782/3837 [6:07:23<2:18:02,  7.85s/it] 73%|███████▎  | 2783/3837 [6:07:31<2:19:57,  7.97s/it] 73%|███████▎  | 2784/3837 [6:07:39<2:21:30,  8.06s/it] 73%|███████▎  | 2785/3837 [6:07:46<2:15:13,  7.71s/it] 73%|███████▎  | 2786/3837 [6:07:53<2:11:19,  7.50s/it] 73%|███████▎  | 2787/3837 [6:08:01<2:14:48,  7.70s/it] 73%|███████▎  | 2788/3837 [6:08:10<2:17:44,  7.88s/it] 73%|███████▎  | 2789/3837 [6:08:18<2:19:24,  7.98s/it] 73%|███████▎  | 2790/3837 [6:08:26<2:20:24,  8.05s/it] 73%|███████▎  | 2791/3837 [6:08:33<2:14:34,  7.72s/it] 73%|███████▎  | 2792/3837 [6:08:41<2:17:27,  7.89s/it] 73%|███████▎  | 2793/3837 [6:08:51<2:25:50,  8.38s/it] 73%|███████▎  | 2794/3837 [6:08:59<2:25:07,  8.35s/it] 73%|███████▎  | 2795/3837 [6:09:06<2:17:47,  7.93s/it] 73%|███████▎  | 2796/3837 [6:09:14<2:19:05,  8.02s/it] 73%|███████▎  | 2797/3837 [6:09:23<2:20:20,  8.10s/it] 73%|███████▎  | 2798/3837 [6:09:31<2:20:50,  8.13s/it] 73%|███████▎  | 2799/3837 [6:09:39<2:20:53,  8.14s/it] 73%|███████▎  | 2800/3837 [6:09:46<2:14:47,  7.80s/it]                                                       {'loss': 3.7888, 'grad_norm': 11.949583053588867, 'learning_rate': 3.594068213018249e-06, 'epoch': 0.73}
 73%|███████▎  | 2800/3837 [6:09:46<2:14:47,  7.80s/it] 73%|███████▎  | 2801/3837 [6:09:55<2:23:35,  8.32s/it] 73%|███████▎  | 2802/3837 [6:10:02<2:16:29,  7.91s/it] 73%|███████▎  | 2803/3837 [6:10:09<2:11:18,  7.62s/it] 73%|███████▎  | 2804/3837 [6:10:18<2:15:01,  7.84s/it] 73%|███████▎  | 2805/3837 [6:10:25<2:10:16,  7.57s/it] 73%|███████▎  | 2806/3837 [6:10:33<2:13:52,  7.79s/it] 73%|███████▎  | 2807/3837 [6:10:41<2:16:24,  7.95s/it] 73%|███████▎  | 2808/3837 [6:10:48<2:11:36,  7.67s/it] 73%|███████▎  | 2809/3837 [6:10:55<2:07:55,  7.47s/it] 73%|███████▎  | 2810/3837 [6:11:03<2:11:26,  7.68s/it] 73%|███████▎  | 2811/3837 [6:11:12<2:14:23,  7.86s/it] 73%|███████▎  | 2812/3837 [6:11:19<2:09:21,  7.57s/it] 73%|███████▎  | 2813/3837 [6:11:26<2:06:07,  7.39s/it] 73%|███████▎  | 2814/3837 [6:11:33<2:03:35,  7.25s/it] 73%|███████▎  | 2815/3837 [6:11:41<2:08:14,  7.53s/it] 73%|███████▎  | 2816/3837 [6:11:49<2:11:41,  7.74s/it] 73%|███████▎  | 2817/3837 [6:11:56<2:07:22,  7.49s/it] 73%|███████▎  | 2818/3837 [6:12:03<2:04:37,  7.34s/it] 73%|███████▎  | 2819/3837 [6:12:11<2:09:17,  7.62s/it] 73%|███████▎  | 2820/3837 [6:12:18<2:05:32,  7.41s/it]                                                       {'loss': 3.5871, 'grad_norm': 8.394584655761719, 'learning_rate': 3.4653252837195973e-06, 'epoch': 0.73}
 73%|███████▎  | 2820/3837 [6:12:18<2:05:32,  7.41s/it] 74%|███████▎  | 2821/3837 [6:12:26<2:09:52,  7.67s/it] 74%|███████▎  | 2822/3837 [6:12:35<2:13:00,  7.86s/it] 74%|███████▎  | 2823/3837 [6:12:42<2:08:20,  7.59s/it] 74%|███████▎  | 2824/3837 [6:12:50<2:11:22,  7.78s/it] 74%|███████▎  | 2825/3837 [6:12:58<2:13:34,  7.92s/it] 74%|███████▎  | 2826/3837 [6:13:08<2:21:22,  8.39s/it] 74%|███████▎  | 2827/3837 [6:13:16<2:20:14,  8.33s/it] 74%|███████▎  | 2828/3837 [6:13:23<2:12:57,  7.91s/it] 74%|███████▎  | 2829/3837 [6:13:30<2:07:58,  7.62s/it] 74%|███████▍  | 2830/3837 [6:13:38<2:11:07,  7.81s/it] 74%|███████▍  | 2831/3837 [6:13:46<2:12:49,  7.92s/it] 74%|███████▍  | 2832/3837 [6:13:54<2:13:47,  7.99s/it] 74%|███████▍  | 2833/3837 [6:14:02<2:14:52,  8.06s/it] 74%|███████▍  | 2834/3837 [6:14:11<2:15:35,  8.11s/it] 74%|███████▍  | 2835/3837 [6:14:19<2:16:15,  8.16s/it] 74%|███████▍  | 2836/3837 [6:14:27<2:16:28,  8.18s/it] 74%|███████▍  | 2837/3837 [6:14:35<2:16:38,  8.20s/it] 74%|███████▍  | 2838/3837 [6:14:42<2:10:14,  7.82s/it] 74%|███████▍  | 2839/3837 [6:14:51<2:12:38,  7.97s/it] 74%|███████▍  | 2840/3837 [6:14:59<2:13:39,  8.04s/it]                                                       {'loss': 3.758, 'grad_norm': 11.921957015991211, 'learning_rate': 3.338445531151523e-06, 'epoch': 0.74}
 74%|███████▍  | 2840/3837 [6:14:59<2:13:39,  8.04s/it] 74%|███████▍  | 2841/3837 [6:15:06<2:07:57,  7.71s/it] 74%|███████▍  | 2842/3837 [6:15:14<2:10:11,  7.85s/it] 74%|███████▍  | 2843/3837 [6:15:21<2:05:17,  7.56s/it] 74%|███████▍  | 2844/3837 [6:15:29<2:08:19,  7.75s/it] 74%|███████▍  | 2845/3837 [6:15:37<2:10:43,  7.91s/it] 74%|███████▍  | 2846/3837 [6:15:44<2:06:08,  7.64s/it] 74%|███████▍  | 2847/3837 [6:15:53<2:08:50,  7.81s/it] 74%|███████▍  | 2848/3837 [6:16:01<2:11:07,  7.95s/it] 74%|███████▍  | 2849/3837 [6:16:08<2:06:12,  7.66s/it] 74%|███████▍  | 2850/3837 [6:16:15<2:03:04,  7.48s/it] 74%|███████▍  | 2851/3837 [6:16:23<2:07:44,  7.77s/it] 74%|███████▍  | 2852/3837 [6:16:30<2:03:29,  7.52s/it] 74%|███████▍  | 2853/3837 [6:16:39<2:07:12,  7.76s/it] 74%|███████▍  | 2854/3837 [6:16:46<2:03:29,  7.54s/it] 74%|███████▍  | 2855/3837 [6:16:54<2:07:09,  7.77s/it] 74%|███████▍  | 2856/3837 [6:17:02<2:09:12,  7.90s/it] 74%|███████▍  | 2857/3837 [6:17:10<2:10:56,  8.02s/it] 74%|███████▍  | 2858/3837 [6:17:20<2:18:24,  8.48s/it] 75%|███████▍  | 2859/3837 [6:17:27<2:10:58,  8.04s/it] 75%|███████▍  | 2860/3837 [6:17:35<2:12:06,  8.11s/it]                                                       {'loss': 3.6481, 'grad_norm': 10.240530014038086, 'learning_rate': 3.213465131468592e-06, 'epoch': 0.75}
 75%|███████▍  | 2860/3837 [6:17:35<2:12:06,  8.11s/it] 75%|███████▍  | 2861/3837 [6:17:43<2:12:33,  8.15s/it] 75%|███████▍  | 2862/3837 [6:17:52<2:12:31,  8.16s/it] 75%|███████▍  | 2863/3837 [6:18:00<2:12:54,  8.19s/it] 75%|███████▍  | 2864/3837 [6:18:07<2:06:44,  7.82s/it] 75%|███████▍  | 2865/3837 [6:18:15<2:08:24,  7.93s/it] 75%|███████▍  | 2866/3837 [6:18:23<2:09:50,  8.02s/it] 75%|███████▍  | 2867/3837 [6:18:32<2:11:19,  8.12s/it] 75%|███████▍  | 2868/3837 [6:18:40<2:11:47,  8.16s/it] 75%|███████▍  | 2869/3837 [6:18:48<2:11:58,  8.18s/it] 75%|███████▍  | 2870/3837 [6:18:56<2:12:07,  8.20s/it] 75%|███████▍  | 2871/3837 [6:19:05<2:12:00,  8.20s/it] 75%|███████▍  | 2872/3837 [6:19:12<2:06:09,  7.84s/it] 75%|███████▍  | 2873/3837 [6:19:19<2:01:47,  7.58s/it] 75%|███████▍  | 2874/3837 [6:19:27<2:04:45,  7.77s/it] 75%|███████▍  | 2875/3837 [6:19:34<2:00:31,  7.52s/it] 75%|███████▍  | 2876/3837 [6:19:41<1:57:24,  7.33s/it] 75%|███████▍  | 2877/3837 [6:19:49<2:01:29,  7.59s/it] 75%|███████▌  | 2878/3837 [6:19:56<1:58:17,  7.40s/it] 75%|███████▌  | 2879/3837 [6:20:04<2:02:12,  7.65s/it] 75%|███████▌  | 2880/3837 [6:20:11<2:01:13,  7.60s/it]                                                       {'loss': 3.5425, 'grad_norm': 10.54297924041748, 'learning_rate': 3.0904197192788853e-06, 'epoch': 0.75}
 75%|███████▌  | 2880/3837 [6:20:11<2:01:13,  7.60s/it] 75%|███████▌  | 2881/3837 [6:20:18<1:57:59,  7.41s/it] 75%|███████▌  | 2882/3837 [6:20:27<2:01:51,  7.66s/it] 75%|███████▌  | 2883/3837 [6:20:34<1:58:33,  7.46s/it] 75%|███████▌  | 2884/3837 [6:20:42<2:02:02,  7.68s/it] 75%|███████▌  | 2885/3837 [6:20:49<1:58:24,  7.46s/it] 75%|███████▌  | 2886/3837 [6:20:56<1:55:44,  7.30s/it] 75%|███████▌  | 2887/3837 [6:21:03<1:53:50,  7.19s/it] 75%|███████▌  | 2888/3837 [6:21:11<1:58:55,  7.52s/it] 75%|███████▌  | 2889/3837 [6:21:19<2:02:32,  7.76s/it] 75%|███████▌  | 2890/3837 [6:21:28<2:05:17,  7.94s/it] 75%|███████▌  | 2891/3837 [6:21:36<2:06:56,  8.05s/it] 75%|███████▌  | 2892/3837 [6:21:43<2:01:54,  7.74s/it] 75%|███████▌  | 2893/3837 [6:21:51<2:04:14,  7.90s/it] 75%|███████▌  | 2894/3837 [6:21:59<2:05:36,  7.99s/it] 75%|███████▌  | 2895/3837 [6:22:06<2:00:34,  7.68s/it] 75%|███████▌  | 2896/3837 [6:22:15<2:03:06,  7.85s/it] 76%|███████▌  | 2897/3837 [6:22:23<2:04:51,  7.97s/it] 76%|███████▌  | 2898/3837 [6:22:32<2:11:56,  8.43s/it] 76%|███████▌  | 2899/3837 [6:22:41<2:11:11,  8.39s/it] 76%|███████▌  | 2900/3837 [6:22:49<2:10:41,  8.37s/it]                                                       {'loss': 3.6756, 'grad_norm': 10.206727981567383, 'learning_rate': 2.9693443774838125e-06, 'epoch': 0.76}
 76%|███████▌  | 2900/3837 [6:22:49<2:10:41,  8.37s/it] 76%|███████▌  | 2901/3837 [6:22:57<2:10:15,  8.35s/it] 76%|███████▌  | 2902/3837 [6:23:04<2:03:35,  7.93s/it] 76%|███████▌  | 2903/3837 [6:23:13<2:05:03,  8.03s/it] 76%|███████▌  | 2904/3837 [6:23:21<2:05:42,  8.08s/it] 76%|███████▌  | 2905/3837 [6:23:30<2:12:08,  8.51s/it] 76%|███████▌  | 2906/3837 [6:23:37<2:04:45,  8.04s/it] 76%|███████▌  | 2907/3837 [6:23:45<2:05:27,  8.09s/it] 76%|███████▌  | 2908/3837 [6:23:54<2:05:45,  8.12s/it] 76%|███████▌  | 2909/3837 [6:24:01<2:00:36,  7.80s/it] 76%|███████▌  | 2910/3837 [6:24:08<1:56:28,  7.54s/it] 76%|███████▌  | 2911/3837 [6:24:16<1:59:21,  7.73s/it] 76%|███████▌  | 2912/3837 [6:24:23<1:56:04,  7.53s/it] 76%|███████▌  | 2913/3837 [6:24:31<1:58:57,  7.72s/it] 76%|███████▌  | 2914/3837 [6:24:39<2:01:45,  7.91s/it] 76%|███████▌  | 2915/3837 [6:24:48<2:03:21,  8.03s/it] 76%|███████▌  | 2916/3837 [6:24:56<2:03:53,  8.07s/it] 76%|███████▌  | 2917/3837 [6:25:04<2:04:23,  8.11s/it] 76%|███████▌  | 2918/3837 [6:25:13<2:07:13,  8.31s/it] 76%|███████▌  | 2919/3837 [6:25:20<2:00:46,  7.89s/it] 76%|███████▌  | 2920/3837 [6:25:28<2:02:12,  8.00s/it]                                                       {'loss': 3.5475, 'grad_norm': 9.472676277160645, 'learning_rate': 2.8502736272752105e-06, 'epoch': 0.76}
 76%|███████▌  | 2920/3837 [6:25:28<2:02:12,  8.00s/it] 76%|███████▌  | 2921/3837 [6:25:36<2:02:57,  8.05s/it] 76%|███████▌  | 2922/3837 [6:25:43<1:57:46,  7.72s/it] 76%|███████▌  | 2923/3837 [6:25:51<1:59:56,  7.87s/it] 76%|███████▌  | 2924/3837 [6:25:58<1:56:02,  7.63s/it] 76%|███████▌  | 2925/3837 [6:26:07<1:58:38,  7.81s/it] 76%|███████▋  | 2926/3837 [6:26:15<2:00:38,  7.95s/it] 76%|███████▋  | 2927/3837 [6:26:23<2:01:57,  8.04s/it] 76%|███████▋  | 2928/3837 [6:26:30<1:57:48,  7.78s/it] 76%|███████▋  | 2929/3837 [6:26:37<1:54:10,  7.54s/it] 76%|███████▋  | 2930/3837 [6:26:45<1:56:58,  7.74s/it] 76%|███████▋  | 2931/3837 [6:26:54<1:58:53,  7.87s/it] 76%|███████▋  | 2932/3837 [6:27:01<1:54:37,  7.60s/it] 76%|███████▋  | 2933/3837 [6:27:08<1:51:52,  7.43s/it] 76%|███████▋  | 2934/3837 [6:27:17<2:01:14,  8.06s/it] 76%|███████▋  | 2935/3837 [6:27:27<2:07:40,  8.49s/it] 77%|███████▋  | 2936/3837 [6:27:34<2:00:42,  8.04s/it] 77%|███████▋  | 2937/3837 [6:27:42<2:01:40,  8.11s/it] 77%|███████▋  | 2938/3837 [6:27:51<2:07:49,  8.53s/it] 77%|███████▋  | 2939/3837 [6:28:00<2:06:51,  8.48s/it] 77%|███████▋  | 2940/3837 [6:28:08<2:05:27,  8.39s/it]                                                       {'loss': 3.6848, 'grad_norm': 12.8024320602417, 'learning_rate': 2.7332414182926114e-06, 'epoch': 0.77}
 77%|███████▋  | 2940/3837 [6:28:08<2:05:27,  8.39s/it] 77%|███████▋  | 2941/3837 [6:28:16<2:04:54,  8.36s/it] 77%|███████▋  | 2942/3837 [6:28:23<1:59:11,  7.99s/it] 77%|███████▋  | 2943/3837 [6:28:32<2:00:28,  8.09s/it] 77%|███████▋  | 2944/3837 [6:28:39<1:55:19,  7.75s/it] 77%|███████▋  | 2945/3837 [6:28:47<1:57:24,  7.90s/it] 77%|███████▋  | 2946/3837 [6:28:55<1:59:06,  8.02s/it] 77%|███████▋  | 2947/3837 [6:29:03<1:59:47,  8.08s/it] 77%|███████▋  | 2948/3837 [6:29:10<1:54:33,  7.73s/it] 77%|███████▋  | 2949/3837 [6:29:19<1:56:49,  7.89s/it] 77%|███████▋  | 2950/3837 [6:29:26<1:52:37,  7.62s/it] 77%|███████▋  | 2951/3837 [6:29:33<1:50:03,  7.45s/it] 77%|███████▋  | 2952/3837 [6:29:40<1:47:48,  7.31s/it] 77%|███████▋  | 2953/3837 [6:29:47<1:46:04,  7.20s/it] 77%|███████▋  | 2954/3837 [6:29:55<1:50:15,  7.49s/it] 77%|███████▋  | 2955/3837 [6:30:03<1:53:11,  7.70s/it] 77%|███████▋  | 2956/3837 [6:30:11<1:55:38,  7.88s/it] 77%|███████▋  | 2957/3837 [6:30:18<1:51:22,  7.59s/it] 77%|███████▋  | 2958/3837 [6:30:26<1:53:53,  7.77s/it] 77%|███████▋  | 2959/3837 [6:30:33<1:49:58,  7.52s/it] 77%|███████▋  | 2960/3837 [6:30:40<1:47:33,  7.36s/it]                                                       {'loss': 3.5323, 'grad_norm': 10.517744064331055, 'learning_rate': 2.6182811189434697e-06, 'epoch': 0.77}
 77%|███████▋  | 2960/3837 [6:30:40<1:47:33,  7.36s/it] 77%|███████▋  | 2961/3837 [6:30:49<1:52:04,  7.68s/it] 77%|███████▋  | 2962/3837 [6:30:57<1:54:13,  7.83s/it] 77%|███████▋  | 2963/3837 [6:31:05<1:55:47,  7.95s/it] 77%|███████▋  | 2964/3837 [6:31:12<1:51:32,  7.67s/it] 77%|███████▋  | 2965/3837 [6:31:20<1:53:54,  7.84s/it] 77%|███████▋  | 2966/3837 [6:31:29<1:55:43,  7.97s/it] 77%|███████▋  | 2967/3837 [6:31:37<1:56:32,  8.04s/it] 77%|███████▋  | 2968/3837 [6:31:45<1:57:01,  8.08s/it] 77%|███████▋  | 2969/3837 [6:31:53<1:57:30,  8.12s/it] 77%|███████▋  | 2970/3837 [6:32:02<1:58:24,  8.19s/it] 77%|███████▋  | 2971/3837 [6:32:10<1:58:20,  8.20s/it] 77%|███████▋  | 2972/3837 [6:32:17<1:53:02,  7.84s/it] 77%|███████▋  | 2973/3837 [6:32:25<1:54:24,  7.95s/it] 78%|███████▊  | 2974/3837 [6:32:35<2:01:08,  8.42s/it] 78%|███████▊  | 2975/3837 [6:32:43<2:00:15,  8.37s/it] 78%|███████▊  | 2976/3837 [6:32:51<1:59:43,  8.34s/it] 78%|███████▊  | 2977/3837 [6:32:59<1:58:54,  8.30s/it] 78%|███████▊  | 2978/3837 [6:33:06<1:52:49,  7.88s/it] 78%|███████▊  | 2979/3837 [6:33:16<1:59:44,  8.37s/it] 78%|███████▊  | 2980/3837 [6:33:25<2:04:26,  8.71s/it]                                                       {'loss': 3.8225, 'grad_norm': 10.572683334350586, 'learning_rate': 2.505425506889103e-06, 'epoch': 0.78}
 78%|███████▊  | 2980/3837 [6:33:25<2:04:26,  8.71s/it] 78%|███████▊  | 2981/3837 [6:33:32<1:56:49,  8.19s/it] 78%|███████▊  | 2982/3837 [6:33:40<1:56:45,  8.19s/it] 78%|███████▊  | 2983/3837 [6:33:50<2:02:42,  8.62s/it] 78%|███████▊  | 2984/3837 [6:33:58<2:00:56,  8.51s/it] 78%|███████▊  | 2985/3837 [6:34:05<1:54:11,  8.04s/it] 78%|███████▊  | 2986/3837 [6:34:13<1:54:50,  8.10s/it] 78%|███████▊  | 2987/3837 [6:34:20<1:49:58,  7.76s/it] 78%|███████▊  | 2988/3837 [6:34:29<1:52:10,  7.93s/it] 78%|███████▊  | 2989/3837 [6:34:37<1:53:35,  8.04s/it] 78%|███████▊  | 2990/3837 [6:34:45<1:54:20,  8.10s/it] 78%|███████▊  | 2991/3837 [6:34:53<1:54:39,  8.13s/it] 78%|███████▊  | 2992/3837 [6:35:00<1:49:44,  7.79s/it] 78%|███████▊  | 2993/3837 [6:35:09<1:51:25,  7.92s/it] 78%|███████▊  | 2994/3837 [6:35:17<1:52:27,  8.00s/it] 78%|███████▊  | 2995/3837 [6:35:25<1:53:29,  8.09s/it] 78%|███████▊  | 2996/3837 [6:35:33<1:54:01,  8.13s/it] 78%|███████▊  | 2997/3837 [6:35:40<1:48:45,  7.77s/it] 78%|███████▊  | 2998/3837 [6:35:47<1:44:59,  7.51s/it] 78%|███████▊  | 2999/3837 [6:35:55<1:48:02,  7.74s/it] 78%|███████▊  | 3000/3837 [6:36:04<1:49:54,  7.88s/it]                                                       {'loss': 3.5822, 'grad_norm': 11.843483924865723, 'learning_rate': 2.3947067596990823e-06, 'epoch': 0.78}
 78%|███████▊  | 3000/3837 [6:36:04<1:49:54,  7.88s/it]/home/zhengduo/miniconda3/envs/vgllm2/lib/python3.10/site-packages/torch/utils/checkpoint.py:87: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
  warnings.warn(
/home/zhengduo/workspace/vgllm/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:42: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(dtype=dtype):
 78%|███████▊  | 3001/3837 [6:36:55<4:50:07, 20.82s/it] 78%|███████▊  | 3002/3837 [6:37:03<3:57:25, 17.06s/it] 78%|███████▊  | 3003/3837 [6:37:13<3:25:43, 14.80s/it] 78%|███████▊  | 3004/3837 [6:37:21<2:57:54, 12.81s/it] 78%|███████▊  | 3005/3837 [6:37:28<2:35:07, 11.19s/it] 78%|███████▊  | 3006/3837 [6:37:36<2:22:39, 10.30s/it] 78%|███████▊  | 3007/3837 [6:37:45<2:13:53,  9.68s/it] 78%|███████▊  | 3008/3837 [6:37:53<2:07:26,  9.22s/it] 78%|███████▊  | 3009/3837 [6:38:02<2:08:31,  9.31s/it] 78%|███████▊  | 3010/3837 [6:38:09<1:58:30,  8.60s/it] 78%|███████▊  | 3011/3837 [6:38:17<1:57:03,  8.50s/it] 78%|███████▊  | 3012/3837 [6:38:24<1:50:34,  8.04s/it] 79%|███████▊  | 3013/3837 [6:38:33<1:51:29,  8.12s/it] 79%|███████▊  | 3014/3837 [6:38:41<1:51:36,  8.14s/it] 79%|███████▊  | 3015/3837 [6:38:48<1:46:32,  7.78s/it] 79%|███████▊  | 3016/3837 [6:38:56<1:48:12,  7.91s/it] 79%|███████▊  | 3017/3837 [6:39:04<1:49:37,  8.02s/it] 79%|███████▊  | 3018/3837 [6:39:13<1:50:34,  8.10s/it] 79%|███████▊  | 3019/3837 [6:39:20<1:45:32,  7.74s/it] 79%|███████▊  | 3020/3837 [6:39:28<1:47:03,  7.86s/it]                                                       {'loss': 3.7806, 'grad_norm': 10.255704879760742, 'learning_rate': 2.286156445676707e-06, 'epoch': 0.79}
 79%|███████▊  | 3020/3837 [6:39:28<1:47:03,  7.86s/it] 79%|███████▊  | 3021/3837 [6:39:36<1:48:33,  7.98s/it] 79%|███████▉  | 3022/3837 [6:39:44<1:49:18,  8.05s/it] 79%|███████▉  | 3023/3837 [6:39:51<1:44:47,  7.72s/it] 79%|███████▉  | 3024/3837 [6:39:59<1:46:45,  7.88s/it] 79%|███████▉  | 3025/3837 [6:40:08<1:48:15,  8.00s/it] 79%|███████▉  | 3026/3837 [6:40:15<1:44:18,  7.72s/it] 79%|███████▉  | 3027/3837 [6:40:23<1:46:02,  7.85s/it] 79%|███████▉  | 3028/3837 [6:40:30<1:41:55,  7.56s/it] 79%|███████▉  | 3029/3837 [6:40:37<1:39:26,  7.38s/it] 79%|███████▉  | 3030/3837 [6:40:44<1:37:49,  7.27s/it] 79%|███████▉  | 3031/3837 [6:40:52<1:41:44,  7.57s/it] 79%|███████▉  | 3032/3837 [6:41:00<1:44:16,  7.77s/it] 79%|███████▉  | 3033/3837 [6:41:08<1:45:46,  7.89s/it] 79%|███████▉  | 3034/3837 [6:41:17<1:46:50,  7.98s/it] 79%|███████▉  | 3035/3837 [6:41:25<1:47:45,  8.06s/it] 79%|███████▉  | 3036/3837 [6:41:33<1:48:09,  8.10s/it] 79%|███████▉  | 3037/3837 [6:41:39<1:38:22,  7.38s/it] 79%|███████▉  | 3038/3837 [6:41:47<1:41:29,  7.62s/it] 79%|███████▉  | 3039/3837 [6:41:54<1:39:01,  7.45s/it] 79%|███████▉  | 3040/3837 [6:42:02<1:42:08,  7.69s/it]                                                       {'loss': 3.4683, 'grad_norm': 11.601975440979004, 'learning_rate': 2.1798055148582e-06, 'epoch': 0.79}
 79%|███████▉  | 3040/3837 [6:42:02<1:42:08,  7.69s/it] 79%|███████▉  | 3041/3837 [6:42:09<1:39:01,  7.46s/it] 79%|███████▉  | 3042/3837 [6:42:17<1:42:07,  7.71s/it] 79%|███████▉  | 3043/3837 [6:42:24<1:38:48,  7.47s/it] 79%|███████▉  | 3044/3837 [6:42:31<1:36:55,  7.33s/it] 79%|███████▉  | 3045/3837 [6:42:38<1:35:41,  7.25s/it] 79%|███████▉  | 3046/3837 [6:42:45<1:34:29,  7.17s/it] 79%|███████▉  | 3047/3837 [6:42:54<1:38:23,  7.47s/it] 79%|███████▉  | 3048/3837 [6:43:02<1:41:00,  7.68s/it] 79%|███████▉  | 3049/3837 [6:43:09<1:37:40,  7.44s/it] 79%|███████▉  | 3050/3837 [6:43:17<1:40:30,  7.66s/it] 80%|███████▉  | 3051/3837 [6:43:25<1:42:26,  7.82s/it] 80%|███████▉  | 3052/3837 [6:43:33<1:44:04,  7.95s/it] 80%|███████▉  | 3053/3837 [6:43:41<1:44:57,  8.03s/it] 80%|███████▉  | 3054/3837 [6:43:50<1:45:43,  8.10s/it] 80%|███████▉  | 3055/3837 [6:43:58<1:46:04,  8.14s/it] 80%|███████▉  | 3056/3837 [6:44:05<1:41:10,  7.77s/it] 80%|███████▉  | 3057/3837 [6:44:12<1:37:52,  7.53s/it] 80%|███████▉  | 3058/3837 [6:44:20<1:40:32,  7.74s/it] 80%|███████▉  | 3059/3837 [6:44:28<1:42:45,  7.92s/it] 80%|███████▉  | 3060/3837 [6:44:37<1:43:46,  8.01s/it]                                                       {'loss': 3.6091, 'grad_norm': 9.296564102172852, 'learning_rate': 2.075684290188188e-06, 'epoch': 0.8}
 80%|███████▉  | 3060/3837 [6:44:37<1:43:46,  8.01s/it] 80%|███████▉  | 3061/3837 [6:44:45<1:44:33,  8.08s/it] 80%|███████▉  | 3062/3837 [6:44:53<1:44:54,  8.12s/it] 80%|███████▉  | 3063/3837 [6:45:01<1:45:19,  8.16s/it] 80%|███████▉  | 3064/3837 [6:45:10<1:45:29,  8.19s/it] 80%|███████▉  | 3065/3837 [6:45:18<1:45:15,  8.18s/it] 80%|███████▉  | 3066/3837 [6:45:25<1:40:16,  7.80s/it] 80%|███████▉  | 3067/3837 [6:45:33<1:41:37,  7.92s/it] 80%|███████▉  | 3068/3837 [6:45:40<1:37:54,  7.64s/it] 80%|███████▉  | 3069/3837 [6:45:48<1:40:07,  7.82s/it] 80%|████████  | 3070/3837 [6:45:55<1:36:41,  7.56s/it] 80%|████████  | 3071/3837 [6:46:05<1:43:56,  8.14s/it] 80%|████████  | 3072/3837 [6:46:13<1:43:56,  8.15s/it] 80%|████████  | 3073/3837 [6:46:21<1:43:58,  8.17s/it] 80%|████████  | 3074/3837 [6:46:30<1:48:59,  8.57s/it] 80%|████████  | 3075/3837 [6:46:39<1:47:35,  8.47s/it] 80%|████████  | 3076/3837 [6:46:47<1:46:41,  8.41s/it] 80%|████████  | 3077/3837 [6:46:55<1:46:01,  8.37s/it] 80%|████████  | 3078/3837 [6:47:02<1:40:31,  7.95s/it] 80%|████████  | 3079/3837 [6:47:10<1:41:11,  8.01s/it] 80%|████████  | 3080/3837 [6:47:20<1:46:50,  8.47s/it]                                                       {'loss': 3.6785, 'grad_norm': 12.212531089782715, 'learning_rate': 1.9738224588739762e-06, 'epoch': 0.8}
 80%|████████  | 3080/3837 [6:47:20<1:46:50,  8.47s/it] 80%|████████  | 3081/3837 [6:47:27<1:41:08,  8.03s/it] 80%|████████  | 3082/3837 [6:47:34<1:37:09,  7.72s/it] 80%|████████  | 3083/3837 [6:47:40<1:29:19,  7.11s/it] 80%|████████  | 3084/3837 [6:47:48<1:33:34,  7.46s/it] 80%|████████  | 3085/3837 [6:47:56<1:36:13,  7.68s/it] 80%|████████  | 3086/3837 [6:48:04<1:38:05,  7.84s/it] 80%|████████  | 3087/3837 [6:48:12<1:39:22,  7.95s/it] 80%|████████  | 3088/3837 [6:48:21<1:40:01,  8.01s/it] 81%|████████  | 3089/3837 [6:48:30<1:45:27,  8.46s/it] 81%|████████  | 3090/3837 [6:48:37<1:39:46,  8.01s/it] 81%|████████  | 3091/3837 [6:48:45<1:40:25,  8.08s/it] 81%|████████  | 3092/3837 [6:48:54<1:41:13,  8.15s/it] 81%|████████  | 3093/3837 [6:49:03<1:46:04,  8.55s/it] 81%|████████  | 3094/3837 [6:49:13<1:49:30,  8.84s/it] 81%|████████  | 3095/3837 [6:49:22<1:51:48,  9.04s/it] 81%|████████  | 3096/3837 [6:49:30<1:48:48,  8.81s/it] 81%|████████  | 3097/3837 [6:49:39<1:46:44,  8.65s/it] 81%|████████  | 3098/3837 [6:49:47<1:44:59,  8.52s/it] 81%|████████  | 3099/3837 [6:49:55<1:43:53,  8.45s/it] 81%|████████  | 3100/3837 [6:50:03<1:42:57,  8.38s/it]                                                       {'loss': 3.7071, 'grad_norm': 9.903190612792969, 'learning_rate': 1.8742490639210808e-06, 'epoch': 0.81}
 81%|████████  | 3100/3837 [6:50:03<1:42:57,  8.38s/it] 81%|████████  | 3101/3837 [6:50:10<1:37:33,  7.95s/it] 81%|████████  | 3102/3837 [6:50:19<1:38:26,  8.04s/it] 81%|████████  | 3103/3837 [6:50:27<1:39:02,  8.10s/it] 81%|████████  | 3104/3837 [6:50:35<1:39:47,  8.17s/it] 81%|████████  | 3105/3837 [6:50:42<1:35:23,  7.82s/it] 81%|████████  | 3106/3837 [6:50:50<1:36:38,  7.93s/it] 81%|████████  | 3107/3837 [6:50:59<1:37:23,  8.00s/it] 81%|████████  | 3108/3837 [6:51:07<1:38:09,  8.08s/it] 81%|████████  | 3109/3837 [6:51:14<1:34:17,  7.77s/it] 81%|████████  | 3110/3837 [6:51:21<1:30:55,  7.50s/it] 81%|████████  | 3111/3837 [6:51:29<1:33:33,  7.73s/it] 81%|████████  | 3112/3837 [6:51:37<1:35:02,  7.87s/it] 81%|████████  | 3113/3837 [6:51:44<1:31:36,  7.59s/it] 81%|████████  | 3114/3837 [6:51:52<1:33:51,  7.79s/it] 81%|████████  | 3115/3837 [6:52:01<1:35:26,  7.93s/it] 81%|████████  | 3116/3837 [6:52:09<1:36:18,  8.02s/it] 81%|████████  | 3117/3837 [6:52:16<1:32:15,  7.69s/it] 81%|████████▏ | 3118/3837 [6:52:24<1:34:30,  7.89s/it] 81%|████████▏ | 3119/3837 [6:52:32<1:35:49,  8.01s/it] 81%|████████▏ | 3120/3837 [6:52:41<1:36:38,  8.09s/it]                                                       {'loss': 3.5134, 'grad_norm': 9.959364891052246, 'learning_rate': 1.7769924958524454e-06, 'epoch': 0.81}
 81%|████████▏ | 3120/3837 [6:52:41<1:36:38,  8.09s/it] 81%|████████▏ | 3121/3837 [6:52:49<1:37:07,  8.14s/it] 81%|████████▏ | 3122/3837 [6:52:57<1:37:15,  8.16s/it] 81%|████████▏ | 3123/3837 [6:53:05<1:37:23,  8.18s/it] 81%|████████▏ | 3124/3837 [6:53:12<1:32:50,  7.81s/it] 81%|████████▏ | 3125/3837 [6:53:21<1:34:02,  7.92s/it] 81%|████████▏ | 3126/3837 [6:53:28<1:30:56,  7.68s/it] 81%|████████▏ | 3127/3837 [6:53:36<1:32:41,  7.83s/it] 82%|████████▏ | 3128/3837 [6:53:42<1:25:27,  7.23s/it] 82%|████████▏ | 3129/3837 [6:53:49<1:24:30,  7.16s/it] 82%|████████▏ | 3130/3837 [6:53:57<1:28:23,  7.50s/it] 82%|████████▏ | 3131/3837 [6:54:05<1:30:31,  7.69s/it] 82%|████████▏ | 3132/3837 [6:54:12<1:27:33,  7.45s/it] 82%|████████▏ | 3133/3837 [6:54:20<1:30:32,  7.72s/it] 82%|████████▏ | 3134/3837 [6:54:28<1:29:18,  7.62s/it] 82%|████████▏ | 3135/3837 [6:54:36<1:31:14,  7.80s/it] 82%|████████▏ | 3136/3837 [6:54:44<1:32:44,  7.94s/it] 82%|████████▏ | 3137/3837 [6:54:53<1:34:01,  8.06s/it] 82%|████████▏ | 3138/3837 [6:55:00<1:30:23,  7.76s/it] 82%|████████▏ | 3139/3837 [6:55:08<1:32:05,  7.92s/it] 82%|████████▏ | 3140/3837 [6:55:15<1:28:34,  7.63s/it]                                                       {'loss': 3.7005, 'grad_norm': 11.237746238708496, 'learning_rate': 1.6820804846136897e-06, 'epoch': 0.82}
 82%|████████▏ | 3140/3837 [6:55:15<1:28:34,  7.63s/it] 82%|████████▏ | 3141/3837 [6:55:23<1:30:32,  7.80s/it] 82%|████████▏ | 3142/3837 [6:55:31<1:32:02,  7.95s/it] 82%|████████▏ | 3143/3837 [6:55:40<1:32:53,  8.03s/it] 82%|████████▏ | 3144/3837 [6:55:48<1:33:19,  8.08s/it] 82%|████████▏ | 3145/3837 [6:55:56<1:33:48,  8.13s/it] 82%|████████▏ | 3146/3837 [6:56:04<1:34:10,  8.18s/it] 82%|████████▏ | 3147/3837 [6:56:13<1:34:28,  8.22s/it] 82%|████████▏ | 3148/3837 [6:56:20<1:30:02,  7.84s/it] 82%|████████▏ | 3149/3837 [6:56:28<1:31:10,  7.95s/it] 82%|████████▏ | 3150/3837 [6:56:35<1:27:35,  7.65s/it] 82%|████████▏ | 3151/3837 [6:56:43<1:29:59,  7.87s/it] 82%|████████▏ | 3152/3837 [6:56:53<1:35:25,  8.36s/it] 82%|████████▏ | 3153/3837 [6:57:01<1:34:52,  8.32s/it] 82%|████████▏ | 3154/3837 [6:57:09<1:34:26,  8.30s/it] 82%|████████▏ | 3155/3837 [6:57:17<1:34:03,  8.27s/it] 82%|████████▏ | 3156/3837 [6:57:26<1:33:48,  8.27s/it] 82%|████████▏ | 3157/3837 [6:57:33<1:29:14,  7.87s/it] 82%|████████▏ | 3158/3837 [6:57:41<1:30:14,  7.97s/it] 82%|████████▏ | 3159/3837 [6:57:48<1:26:41,  7.67s/it] 82%|████████▏ | 3160/3837 [6:57:56<1:28:52,  7.88s/it]                                                       {'loss': 3.5548, 'grad_norm': 9.123111724853516, 'learning_rate': 1.5895400916667014e-06, 'epoch': 0.82}
 82%|████████▏ | 3160/3837 [6:57:56<1:28:52,  7.88s/it] 82%|████████▏ | 3161/3837 [6:58:04<1:29:48,  7.97s/it] 82%|████████▏ | 3162/3837 [6:58:13<1:30:54,  8.08s/it] 82%|████████▏ | 3163/3837 [6:58:21<1:31:32,  8.15s/it] 82%|████████▏ | 3164/3837 [6:58:28<1:27:15,  7.78s/it] 82%|████████▏ | 3165/3837 [6:58:36<1:28:56,  7.94s/it] 83%|████████▎ | 3166/3837 [6:58:44<1:29:48,  8.03s/it] 83%|████████▎ | 3167/3837 [6:58:51<1:26:07,  7.71s/it] 83%|████████▎ | 3168/3837 [6:59:00<1:27:47,  7.87s/it] 83%|████████▎ | 3169/3837 [6:59:09<1:33:18,  8.38s/it] 83%|████████▎ | 3170/3837 [6:59:17<1:32:24,  8.31s/it] 83%|████████▎ | 3171/3837 [6:59:25<1:31:50,  8.27s/it] 83%|████████▎ | 3172/3837 [6:59:33<1:27:34,  7.90s/it] 83%|████████▎ | 3173/3837 [6:59:41<1:28:26,  7.99s/it] 83%|████████▎ | 3174/3837 [6:59:49<1:29:16,  8.08s/it] 83%|████████▎ | 3175/3837 [6:59:57<1:29:41,  8.13s/it] 83%|████████▎ | 3176/3837 [7:00:04<1:25:50,  7.79s/it] 83%|████████▎ | 3177/3837 [7:00:11<1:23:05,  7.55s/it] 83%|████████▎ | 3178/3837 [7:00:20<1:25:26,  7.78s/it] 83%|████████▎ | 3179/3837 [7:00:29<1:30:52,  8.29s/it] 83%|████████▎ | 3180/3837 [7:00:36<1:26:40,  7.92s/it]                                                       {'loss': 3.6861, 'grad_norm': 9.3917875289917, 'learning_rate': 1.4993977022738349e-06, 'epoch': 0.83}
 83%|████████▎ | 3180/3837 [7:00:36<1:26:40,  7.92s/it] 83%|████████▎ | 3181/3837 [7:00:44<1:27:23,  7.99s/it] 83%|████████▎ | 3182/3837 [7:00:54<1:32:09,  8.44s/it] 83%|████████▎ | 3183/3837 [7:01:01<1:27:30,  8.03s/it] 83%|████████▎ | 3184/3837 [7:01:09<1:28:14,  8.11s/it] 83%|████████▎ | 3185/3837 [7:01:17<1:28:37,  8.16s/it] 83%|████████▎ | 3186/3837 [7:01:26<1:28:50,  8.19s/it] 83%|████████▎ | 3187/3837 [7:01:34<1:28:46,  8.19s/it] 83%|████████▎ | 3188/3837 [7:01:42<1:28:59,  8.23s/it] 83%|████████▎ | 3189/3837 [7:01:50<1:28:57,  8.24s/it] 83%|████████▎ | 3190/3837 [7:01:59<1:28:51,  8.24s/it] 83%|████████▎ | 3191/3837 [7:02:06<1:24:33,  7.85s/it] 83%|████████▎ | 3192/3837 [7:02:14<1:25:41,  7.97s/it] 83%|████████▎ | 3193/3837 [7:02:22<1:26:29,  8.06s/it] 83%|████████▎ | 3194/3837 [7:02:29<1:23:17,  7.77s/it] 83%|████████▎ | 3195/3837 [7:02:39<1:28:38,  8.28s/it] 83%|████████▎ | 3196/3837 [7:02:47<1:28:21,  8.27s/it] 83%|████████▎ | 3197/3837 [7:02:55<1:28:14,  8.27s/it] 83%|████████▎ | 3198/3837 [7:03:03<1:28:07,  8.27s/it] 83%|████████▎ | 3199/3837 [7:03:12<1:27:46,  8.25s/it] 83%|████████▎ | 3200/3837 [7:03:20<1:27:31,  8.24s/it]                                                       {'loss': 3.6597, 'grad_norm': 10.648542404174805, 'learning_rate': 1.4116790179748985e-06, 'epoch': 0.83}
 83%|████████▎ | 3200/3837 [7:03:20<1:27:31,  8.24s/it] 83%|████████▎ | 3201/3837 [7:03:28<1:27:30,  8.26s/it] 83%|████████▎ | 3202/3837 [7:03:36<1:27:16,  8.25s/it] 83%|████████▎ | 3203/3837 [7:03:45<1:26:56,  8.23s/it] 84%|████████▎ | 3204/3837 [7:03:53<1:26:41,  8.22s/it] 84%|████████▎ | 3205/3837 [7:04:00<1:22:42,  7.85s/it] 84%|████████▎ | 3206/3837 [7:04:08<1:23:32,  7.94s/it] 84%|████████▎ | 3207/3837 [7:04:16<1:24:15,  8.03s/it] 84%|████████▎ | 3208/3837 [7:04:23<1:20:38,  7.69s/it] 84%|████████▎ | 3209/3837 [7:04:31<1:22:05,  7.84s/it] 84%|████████▎ | 3210/3837 [7:04:38<1:19:06,  7.57s/it] 84%|████████▎ | 3211/3837 [7:04:47<1:21:19,  7.79s/it] 84%|████████▎ | 3212/3837 [7:04:55<1:22:40,  7.94s/it] 84%|████████▎ | 3213/3837 [7:05:02<1:19:27,  7.64s/it] 84%|████████▍ | 3214/3837 [7:05:09<1:17:26,  7.46s/it] 84%|████████▍ | 3215/3837 [7:05:18<1:23:42,  8.07s/it] 84%|████████▍ | 3216/3837 [7:05:25<1:20:20,  7.76s/it] 84%|████████▍ | 3217/3837 [7:05:34<1:21:32,  7.89s/it] 84%|████████▍ | 3218/3837 [7:05:42<1:22:18,  7.98s/it] 84%|████████▍ | 3219/3837 [7:05:50<1:22:52,  8.05s/it] 84%|████████▍ | 3220/3837 [7:05:58<1:23:06,  8.08s/it]                                                       {'loss': 3.6384, 'grad_norm': 10.675905227661133, 'learning_rate': 1.3264090492590909e-06, 'epoch': 0.84}
 84%|████████▍ | 3220/3837 [7:05:58<1:23:06,  8.08s/it] 84%|████████▍ | 3221/3837 [7:06:06<1:23:18,  8.11s/it] 84%|████████▍ | 3222/3837 [7:06:15<1:23:40,  8.16s/it] 84%|████████▍ | 3223/3837 [7:06:22<1:19:58,  7.82s/it] 84%|████████▍ | 3224/3837 [7:06:29<1:17:14,  7.56s/it] 84%|████████▍ | 3225/3837 [7:06:37<1:19:10,  7.76s/it] 84%|████████▍ | 3226/3837 [7:06:45<1:20:30,  7.91s/it] 84%|████████▍ | 3227/3837 [7:06:53<1:21:16,  7.99s/it] 84%|████████▍ | 3228/3837 [7:07:01<1:21:56,  8.07s/it] 84%|████████▍ | 3229/3837 [7:07:08<1:18:43,  7.77s/it] 84%|████████▍ | 3230/3837 [7:07:17<1:19:55,  7.90s/it] 84%|████████▍ | 3231/3837 [7:07:24<1:17:08,  7.64s/it] 84%|████████▍ | 3232/3837 [7:07:32<1:18:59,  7.83s/it] 84%|████████▍ | 3233/3837 [7:07:40<1:19:56,  7.94s/it] 84%|████████▍ | 3234/3837 [7:07:48<1:20:36,  8.02s/it] 84%|████████▍ | 3235/3837 [7:07:57<1:21:05,  8.08s/it] 84%|████████▍ | 3236/3837 [7:08:05<1:21:19,  8.12s/it] 84%|████████▍ | 3237/3837 [7:08:13<1:21:41,  8.17s/it] 84%|████████▍ | 3238/3837 [7:08:21<1:21:44,  8.19s/it] 84%|████████▍ | 3239/3837 [7:08:30<1:21:38,  8.19s/it] 84%|████████▍ | 3240/3837 [7:08:38<1:21:28,  8.19s/it]                                                       {'loss': 3.5878, 'grad_norm': 10.430235862731934, 'learning_rate': 1.243612108433978e-06, 'epoch': 0.84}
 84%|████████▍ | 3240/3837 [7:08:38<1:21:28,  8.19s/it] 84%|████████▍ | 3241/3837 [7:08:46<1:21:32,  8.21s/it] 84%|████████▍ | 3242/3837 [7:08:55<1:25:13,  8.59s/it] 85%|████████▍ | 3243/3837 [7:09:04<1:24:15,  8.51s/it] 85%|████████▍ | 3244/3837 [7:09:12<1:23:20,  8.43s/it] 85%|████████▍ | 3245/3837 [7:09:19<1:18:45,  7.98s/it] 85%|████████▍ | 3246/3837 [7:09:27<1:19:15,  8.05s/it] 85%|████████▍ | 3247/3837 [7:09:35<1:19:38,  8.10s/it] 85%|████████▍ | 3248/3837 [7:09:42<1:16:21,  7.78s/it] 85%|████████▍ | 3249/3837 [7:09:51<1:17:22,  7.90s/it] 85%|████████▍ | 3250/3837 [7:10:00<1:21:50,  8.37s/it] 85%|████████▍ | 3251/3837 [7:10:07<1:17:29,  7.93s/it] 85%|████████▍ | 3252/3837 [7:10:14<1:14:42,  7.66s/it] 85%|████████▍ | 3253/3837 [7:10:21<1:12:23,  7.44s/it] 85%|████████▍ | 3254/3837 [7:10:29<1:14:32,  7.67s/it] 85%|████████▍ | 3255/3837 [7:10:37<1:15:54,  7.83s/it] 85%|████████▍ | 3256/3837 [7:10:46<1:16:54,  7.94s/it] 85%|████████▍ | 3257/3837 [7:10:53<1:14:07,  7.67s/it] 85%|████████▍ | 3258/3837 [7:11:01<1:15:31,  7.83s/it] 85%|████████▍ | 3259/3837 [7:11:08<1:12:58,  7.57s/it] 85%|████████▍ | 3260/3837 [7:11:16<1:14:29,  7.75s/it]                                                       {'loss': 3.61, 'grad_norm': 11.344330787658691, 'learning_rate': 1.163311802693521e-06, 'epoch': 0.85}
 85%|████████▍ | 3260/3837 [7:11:16<1:14:29,  7.75s/it] 85%|████████▍ | 3261/3837 [7:11:23<1:11:57,  7.50s/it] 85%|████████▌ | 3262/3837 [7:11:31<1:13:58,  7.72s/it] 85%|████████▌ | 3263/3837 [7:11:39<1:15:31,  7.89s/it] 85%|████████▌ | 3264/3837 [7:11:46<1:12:35,  7.60s/it] 85%|████████▌ | 3265/3837 [7:11:56<1:17:56,  8.18s/it] 85%|████████▌ | 3266/3837 [7:12:04<1:18:20,  8.23s/it] 85%|████████▌ | 3267/3837 [7:12:12<1:18:10,  8.23s/it] 85%|████████▌ | 3268/3837 [7:12:21<1:18:05,  8.23s/it] 85%|████████▌ | 3269/3837 [7:12:28<1:14:27,  7.87s/it] 85%|████████▌ | 3270/3837 [7:12:36<1:15:14,  7.96s/it] 85%|████████▌ | 3271/3837 [7:12:44<1:15:44,  8.03s/it] 85%|████████▌ | 3272/3837 [7:12:52<1:16:13,  8.09s/it] 85%|████████▌ | 3273/3837 [7:13:01<1:16:34,  8.15s/it] 85%|████████▌ | 3274/3837 [7:13:09<1:16:41,  8.17s/it] 85%|████████▌ | 3275/3837 [7:13:17<1:17:04,  8.23s/it] 85%|████████▌ | 3276/3837 [7:13:24<1:13:20,  7.84s/it] 85%|████████▌ | 3277/3837 [7:13:31<1:10:44,  7.58s/it] 85%|████████▌ | 3278/3837 [7:13:38<1:08:53,  7.39s/it] 85%|████████▌ | 3279/3837 [7:13:46<1:11:20,  7.67s/it] 85%|████████▌ | 3280/3837 [7:13:55<1:12:59,  7.86s/it]                                                       {'loss': 3.6397, 'grad_norm': 10.023828506469727, 'learning_rate': 1.085531027387161e-06, 'epoch': 0.85}
 85%|████████▌ | 3280/3837 [7:13:55<1:12:59,  7.86s/it] 86%|████████▌ | 3281/3837 [7:14:03<1:13:53,  7.97s/it] 86%|████████▌ | 3282/3837 [7:14:11<1:14:37,  8.07s/it] 86%|████████▌ | 3283/3837 [7:14:19<1:13:37,  7.97s/it] 86%|████████▌ | 3284/3837 [7:14:27<1:13:58,  8.03s/it] 86%|████████▌ | 3285/3837 [7:14:34<1:10:56,  7.71s/it] 86%|████████▌ | 3286/3837 [7:14:42<1:12:09,  7.86s/it] 86%|████████▌ | 3287/3837 [7:14:50<1:13:08,  7.98s/it] 86%|████████▌ | 3288/3837 [7:14:59<1:13:39,  8.05s/it] 86%|████████▌ | 3289/3837 [7:15:06<1:10:24,  7.71s/it] 86%|████████▌ | 3290/3837 [7:15:14<1:11:49,  7.88s/it] 86%|████████▌ | 3291/3837 [7:15:22<1:12:37,  7.98s/it] 86%|████████▌ | 3292/3837 [7:15:30<1:13:17,  8.07s/it] 86%|████████▌ | 3293/3837 [7:15:37<1:10:19,  7.76s/it] 86%|████████▌ | 3294/3837 [7:15:44<1:08:19,  7.55s/it] 86%|████████▌ | 3295/3837 [7:15:53<1:10:07,  7.76s/it] 86%|████████▌ | 3296/3837 [7:16:00<1:07:49,  7.52s/it] 86%|████████▌ | 3297/3837 [7:16:07<1:06:09,  7.35s/it] 86%|████████▌ | 3298/3837 [7:16:14<1:05:01,  7.24s/it] 86%|████████▌ | 3299/3837 [7:16:21<1:04:06,  7.15s/it] 86%|████████▌ | 3300/3837 [7:16:29<1:06:48,  7.46s/it]                                                       {'loss': 3.5375, 'grad_norm': 9.891332626342773, 'learning_rate': 1.0102919594918592e-06, 'epoch': 0.86}
 86%|████████▌ | 3300/3837 [7:16:29<1:06:48,  7.46s/it] 86%|████████▌ | 3301/3837 [7:16:38<1:12:11,  8.08s/it] 86%|████████▌ | 3302/3837 [7:16:46<1:12:25,  8.12s/it] 86%|████████▌ | 3303/3837 [7:16:55<1:12:34,  8.15s/it] 86%|████████▌ | 3304/3837 [7:17:02<1:09:24,  7.81s/it] 86%|████████▌ | 3305/3837 [7:17:10<1:10:20,  7.93s/it] 86%|████████▌ | 3306/3837 [7:17:18<1:10:53,  8.01s/it] 86%|████████▌ | 3307/3837 [7:17:26<1:11:14,  8.07s/it] 86%|████████▌ | 3308/3837 [7:17:35<1:11:44,  8.14s/it] 86%|████████▌ | 3309/3837 [7:17:42<1:08:35,  7.79s/it] 86%|████████▋ | 3310/3837 [7:17:50<1:09:33,  7.92s/it] 86%|████████▋ | 3311/3837 [7:17:57<1:07:37,  7.71s/it] 86%|████████▋ | 3312/3837 [7:18:05<1:08:46,  7.86s/it] 86%|████████▋ | 3313/3837 [7:18:14<1:09:44,  7.99s/it] 86%|████████▋ | 3314/3837 [7:18:22<1:10:12,  8.06s/it] 86%|████████▋ | 3315/3837 [7:18:30<1:10:20,  8.09s/it] 86%|████████▋ | 3316/3837 [7:18:37<1:07:07,  7.73s/it] 86%|████████▋ | 3317/3837 [7:18:44<1:04:56,  7.49s/it] 86%|████████▋ | 3318/3837 [7:18:51<1:03:38,  7.36s/it] 86%|████████▋ | 3319/3837 [7:18:59<1:05:36,  7.60s/it] 87%|████████▋ | 3320/3837 [7:19:07<1:06:59,  7.77s/it]                                                       {'loss': 3.5993, 'grad_norm': 9.890294075012207, 'learning_rate': 9.376160512889654e-07, 'epoch': 0.87}
 87%|████████▋ | 3320/3837 [7:19:07<1:06:59,  7.77s/it] 87%|████████▋ | 3321/3837 [7:19:15<1:07:57,  7.90s/it] 87%|████████▋ | 3322/3837 [7:19:22<1:05:11,  7.60s/it] 87%|████████▋ | 3323/3837 [7:19:31<1:06:49,  7.80s/it] 87%|████████▋ | 3324/3837 [7:19:39<1:07:42,  7.92s/it] 87%|████████▋ | 3325/3837 [7:19:47<1:08:41,  8.05s/it] 87%|████████▋ | 3326/3837 [7:19:55<1:09:00,  8.10s/it] 87%|████████▋ | 3327/3837 [7:20:04<1:09:30,  8.18s/it] 87%|████████▋ | 3328/3837 [7:20:11<1:06:13,  7.81s/it] 87%|████████▋ | 3329/3837 [7:20:19<1:07:09,  7.93s/it] 87%|████████▋ | 3330/3837 [7:20:26<1:04:41,  7.66s/it] 87%|████████▋ | 3331/3837 [7:20:33<1:02:48,  7.45s/it] 87%|████████▋ | 3332/3837 [7:20:41<1:04:46,  7.70s/it] 87%|████████▋ | 3333/3837 [7:20:48<1:02:50,  7.48s/it] 87%|████████▋ | 3334/3837 [7:20:56<1:04:43,  7.72s/it] 87%|████████▋ | 3335/3837 [7:21:05<1:06:14,  7.92s/it] 87%|████████▋ | 3336/3837 [7:21:13<1:06:44,  7.99s/it] 87%|████████▋ | 3337/3837 [7:21:20<1:04:04,  7.69s/it] 87%|████████▋ | 3338/3837 [7:21:28<1:05:06,  7.83s/it] 87%|████████▋ | 3339/3837 [7:21:35<1:02:37,  7.54s/it] 87%|████████▋ | 3340/3837 [7:21:44<1:07:15,  8.12s/it]                                                       {'loss': 3.6364, 'grad_norm': 12.054093360900879, 'learning_rate': 8.675240242477079e-07, 'epoch': 0.87}
 87%|████████▋ | 3340/3837 [7:21:44<1:07:15,  8.12s/it] 87%|████████▋ | 3341/3837 [7:21:53<1:07:31,  8.17s/it] 87%|████████▋ | 3342/3837 [7:22:01<1:07:36,  8.20s/it] 87%|████████▋ | 3343/3837 [7:22:09<1:07:49,  8.24s/it] 87%|████████▋ | 3344/3837 [7:22:17<1:07:43,  8.24s/it] 87%|████████▋ | 3345/3837 [7:22:26<1:07:25,  8.22s/it] 87%|████████▋ | 3346/3837 [7:22:35<1:10:26,  8.61s/it] 87%|████████▋ | 3347/3837 [7:22:42<1:06:22,  8.13s/it] 87%|████████▋ | 3348/3837 [7:22:50<1:06:29,  8.16s/it] 87%|████████▋ | 3349/3837 [7:22:59<1:06:36,  8.19s/it] 87%|████████▋ | 3350/3837 [7:23:06<1:03:27,  7.82s/it] 87%|████████▋ | 3351/3837 [7:23:14<1:04:18,  7.94s/it] 87%|████████▋ | 3352/3837 [7:23:21<1:01:55,  7.66s/it] 87%|████████▋ | 3353/3837 [7:23:29<1:03:10,  7.83s/it] 87%|████████▋ | 3354/3837 [7:23:37<1:04:05,  7.96s/it] 87%|████████▋ | 3355/3837 [7:23:44<1:01:50,  7.70s/it] 87%|████████▋ | 3356/3837 [7:23:53<1:03:00,  7.86s/it] 87%|████████▋ | 3357/3837 [7:24:00<1:00:46,  7.60s/it] 88%|████████▊ | 3358/3837 [7:24:07<59:08,  7.41s/it]   88%|████████▊ | 3359/3837 [7:24:15<1:00:56,  7.65s/it] 88%|████████▊ | 3360/3837 [7:24:22<59:21,  7.47s/it]                                                       {'loss': 3.6062, 'grad_norm': 10.220995903015137, 'learning_rate': 8.000358631170479e-07, 'epoch': 0.88}
 88%|████████▊ | 3360/3837 [7:24:22<59:21,  7.47s/it] 88%|████████▊ | 3361/3837 [7:24:29<58:00,  7.31s/it] 88%|████████▊ | 3362/3837 [7:24:35<54:03,  6.83s/it] 88%|████████▊ | 3363/3837 [7:24:41<54:12,  6.86s/it] 88%|████████▊ | 3364/3837 [7:24:50<57:11,  7.26s/it] 88%|████████▊ | 3365/3837 [7:24:58<59:27,  7.56s/it] 88%|████████▊ | 3366/3837 [7:25:06<1:00:54,  7.76s/it] 88%|████████▊ | 3367/3837 [7:25:14<1:01:56,  7.91s/it] 88%|████████▊ | 3368/3837 [7:25:23<1:02:40,  8.02s/it] 88%|████████▊ | 3369/3837 [7:25:31<1:02:52,  8.06s/it] 88%|████████▊ | 3370/3837 [7:25:40<1:06:00,  8.48s/it] 88%|████████▊ | 3371/3837 [7:25:49<1:05:20,  8.41s/it] 88%|████████▊ | 3372/3837 [7:25:57<1:04:43,  8.35s/it] 88%|████████▊ | 3373/3837 [7:26:04<1:01:26,  7.94s/it] 88%|████████▊ | 3374/3837 [7:26:11<59:01,  7.65s/it]   88%|████████▊ | 3375/3837 [7:26:19<1:00:13,  7.82s/it] 88%|████████▊ | 3376/3837 [7:26:27<1:01:01,  7.94s/it] 88%|████████▊ | 3377/3837 [7:26:34<58:39,  7.65s/it]   88%|████████▊ | 3378/3837 [7:26:42<59:54,  7.83s/it] 88%|████████▊ | 3379/3837 [7:26:51<1:00:50,  7.97s/it] 88%|████████▊ | 3380/3837 [7:26:59<1:01:24,  8.06s/it]                                                       {'loss': 3.4979, 'grad_norm': 11.80955982208252, 'learning_rate': 7.351708102276101e-07, 'epoch': 0.88}
 88%|████████▊ | 3380/3837 [7:26:59<1:01:24,  8.06s/it] 88%|████████▊ | 3381/3837 [7:27:07<1:01:31,  8.10s/it] 88%|████████▊ | 3382/3837 [7:27:15<1:01:36,  8.12s/it] 88%|████████▊ | 3383/3837 [7:27:23<1:01:36,  8.14s/it] 88%|████████▊ | 3384/3837 [7:27:32<1:01:45,  8.18s/it] 88%|████████▊ | 3385/3837 [7:27:39<58:55,  7.82s/it]   88%|████████▊ | 3386/3837 [7:27:46<56:45,  7.55s/it] 88%|████████▊ | 3387/3837 [7:27:54<58:07,  7.75s/it] 88%|████████▊ | 3388/3837 [7:28:03<1:02:06,  8.30s/it] 88%|████████▊ | 3389/3837 [7:28:12<1:01:55,  8.29s/it] 88%|████████▊ | 3390/3837 [7:28:20<1:01:29,  8.25s/it] 88%|████████▊ | 3391/3837 [7:28:28<1:01:13,  8.24s/it] 88%|████████▊ | 3392/3837 [7:28:36<1:01:10,  8.25s/it] 88%|████████▊ | 3393/3837 [7:28:43<58:17,  7.88s/it]   88%|████████▊ | 3394/3837 [7:28:52<58:55,  7.98s/it] 88%|████████▊ | 3395/3837 [7:29:00<59:16,  8.05s/it] 89%|████████▊ | 3396/3837 [7:29:07<56:40,  7.71s/it] 89%|████████▊ | 3397/3837 [7:29:15<57:40,  7.86s/it] 89%|████████▊ | 3398/3837 [7:29:23<58:18,  7.97s/it] 89%|████████▊ | 3399/3837 [7:29:31<58:46,  8.05s/it] 89%|████████▊ | 3400/3837 [7:29:38<56:12,  7.72s/it]                                                     {'loss': 3.5843, 'grad_norm': 10.545526504516602, 'learning_rate': 6.729473600052749e-07, 'epoch': 0.89}
 89%|████████▊ | 3400/3837 [7:29:38<56:12,  7.72s/it] 89%|████████▊ | 3401/3837 [7:29:45<54:33,  7.51s/it] 89%|████████▊ | 3402/3837 [7:29:54<56:14,  7.76s/it] 89%|████████▊ | 3403/3837 [7:30:02<57:15,  7.91s/it] 89%|████████▊ | 3404/3837 [7:30:10<57:43,  8.00s/it] 89%|████████▊ | 3405/3837 [7:30:18<57:58,  8.05s/it] 89%|████████▉ | 3406/3837 [7:30:27<58:23,  8.13s/it] 89%|████████▉ | 3407/3837 [7:30:35<58:35,  8.18s/it] 89%|████████▉ | 3408/3837 [7:30:43<58:30,  8.18s/it] 89%|████████▉ | 3409/3837 [7:30:51<58:26,  8.19s/it] 89%|████████▉ | 3410/3837 [7:31:00<58:18,  8.19s/it] 89%|████████▉ | 3411/3837 [7:31:08<58:19,  8.21s/it] 89%|████████▉ | 3412/3837 [7:31:17<1:01:03,  8.62s/it] 89%|████████▉ | 3413/3837 [7:31:25<58:22,  8.26s/it]   89%|████████▉ | 3414/3837 [7:31:33<58:11,  8.26s/it] 89%|████████▉ | 3415/3837 [7:31:40<55:20,  7.87s/it] 89%|████████▉ | 3416/3837 [7:31:47<53:11,  7.58s/it] 89%|████████▉ | 3417/3837 [7:31:54<51:39,  7.38s/it] 89%|████████▉ | 3418/3837 [7:32:02<53:17,  7.63s/it] 89%|████████▉ | 3419/3837 [7:32:10<54:24,  7.81s/it] 89%|████████▉ | 3420/3837 [7:32:18<55:06,  7.93s/it]                                                     {'loss': 3.577, 'grad_norm': 12.140129089355469, 'learning_rate': 6.133832536980111e-07, 'epoch': 0.89}
 89%|████████▉ | 3420/3837 [7:32:18<55:06,  7.93s/it] 89%|████████▉ | 3421/3837 [7:32:27<55:37,  8.02s/it] 89%|████████▉ | 3422/3837 [7:32:34<53:12,  7.69s/it] 89%|████████▉ | 3423/3837 [7:32:42<54:13,  7.86s/it] 89%|████████▉ | 3424/3837 [7:32:49<52:16,  7.60s/it] 89%|████████▉ | 3425/3837 [7:32:57<53:35,  7.80s/it] 89%|████████▉ | 3426/3837 [7:33:05<54:13,  7.91s/it] 89%|████████▉ | 3427/3837 [7:33:12<52:00,  7.61s/it] 89%|████████▉ | 3428/3837 [7:33:20<53:05,  7.79s/it] 89%|████████▉ | 3429/3837 [7:33:27<51:25,  7.56s/it] 89%|████████▉ | 3430/3837 [7:33:36<53:13,  7.85s/it] 89%|████████▉ | 3431/3837 [7:33:43<51:14,  7.57s/it] 89%|████████▉ | 3432/3837 [7:33:50<49:36,  7.35s/it] 89%|████████▉ | 3433/3837 [7:33:57<48:46,  7.24s/it] 89%|████████▉ | 3434/3837 [7:34:05<50:34,  7.53s/it] 90%|████████▉ | 3435/3837 [7:34:13<51:50,  7.74s/it] 90%|████████▉ | 3436/3837 [7:34:20<50:08,  7.50s/it] 90%|████████▉ | 3437/3837 [7:34:27<48:58,  7.35s/it] 90%|████████▉ | 3438/3837 [7:34:34<48:07,  7.24s/it] 90%|████████▉ | 3439/3837 [7:34:41<47:33,  7.17s/it] 90%|████████▉ | 3440/3837 [7:34:49<49:47,  7.53s/it]                                                     {'loss': 3.479, 'grad_norm': 10.1608304977417, 'learning_rate': 5.564954743174722e-07, 'epoch': 0.9}
 90%|████████▉ | 3440/3837 [7:34:49<49:47,  7.53s/it] 90%|████████▉ | 3441/3837 [7:34:58<51:09,  7.75s/it] 90%|████████▉ | 3442/3837 [7:35:05<49:31,  7.52s/it] 90%|████████▉ | 3443/3837 [7:35:12<48:17,  7.35s/it] 90%|████████▉ | 3444/3837 [7:35:20<49:47,  7.60s/it] 90%|████████▉ | 3445/3837 [7:35:27<48:19,  7.40s/it] 90%|████████▉ | 3446/3837 [7:35:35<49:50,  7.65s/it] 90%|████████▉ | 3447/3837 [7:35:43<50:53,  7.83s/it] 90%|████████▉ | 3448/3837 [7:35:51<51:25,  7.93s/it] 90%|████████▉ | 3449/3837 [7:35:58<49:18,  7.63s/it] 90%|████████▉ | 3450/3837 [7:36:08<52:47,  8.18s/it] 90%|████████▉ | 3451/3837 [7:36:15<50:26,  7.84s/it] 90%|████████▉ | 3452/3837 [7:36:24<53:28,  8.33s/it] 90%|████████▉ | 3453/3837 [7:36:31<50:36,  7.91s/it] 90%|█████████ | 3454/3837 [7:36:40<51:12,  8.02s/it] 90%|█████████ | 3455/3837 [7:36:49<53:55,  8.47s/it] 90%|█████████ | 3456/3837 [7:36:59<55:44,  8.78s/it] 90%|█████████ | 3457/3837 [7:37:07<54:33,  8.62s/it] 90%|█████████ | 3458/3837 [7:37:15<53:45,  8.51s/it] 90%|█████████ | 3459/3837 [7:37:23<53:11,  8.44s/it] 90%|█████████ | 3460/3837 [7:37:30<50:12,  7.99s/it]                                                     {'loss': 3.6675, 'grad_norm': 11.69425106048584, 'learning_rate': 5.02300241796766e-07, 'epoch': 0.9}
 90%|█████████ | 3460/3837 [7:37:30<50:12,  7.99s/it] 90%|█████████ | 3461/3837 [7:37:39<50:38,  8.08s/it] 90%|█████████ | 3462/3837 [7:37:47<51:21,  8.22s/it] 90%|█████████ | 3463/3837 [7:37:54<49:00,  7.86s/it] 90%|█████████ | 3464/3837 [7:38:01<47:12,  7.59s/it] 90%|█████████ | 3465/3837 [7:38:09<48:16,  7.79s/it] 90%|█████████ | 3466/3837 [7:38:17<48:28,  7.84s/it] 90%|█████████ | 3467/3837 [7:38:26<49:00,  7.95s/it] 90%|█████████ | 3468/3837 [7:38:32<47:00,  7.64s/it] 90%|█████████ | 3469/3837 [7:38:42<50:22,  8.21s/it] 90%|█████████ | 3470/3837 [7:38:50<50:14,  8.21s/it] 90%|█████████ | 3471/3837 [7:38:58<50:10,  8.23s/it] 90%|█████████ | 3472/3837 [7:39:07<50:04,  8.23s/it] 91%|█████████ | 3473/3837 [7:39:15<49:55,  8.23s/it] 91%|█████████ | 3474/3837 [7:39:23<49:43,  8.22s/it] 91%|█████████ | 3475/3837 [7:39:31<49:33,  8.21s/it] 91%|█████████ | 3476/3837 [7:39:40<49:32,  8.24s/it] 91%|█████████ | 3477/3837 [7:39:47<47:09,  7.86s/it] 91%|█████████ | 3478/3837 [7:39:55<47:43,  7.98s/it] 91%|█████████ | 3479/3837 [7:40:02<45:50,  7.68s/it] 91%|█████████ | 3480/3837 [7:40:10<46:38,  7.84s/it]                                                     {'loss': 3.5079, 'grad_norm': 10.977598190307617, 'learning_rate': 4.508130083658113e-07, 'epoch': 0.91}
 91%|█████████ | 3480/3837 [7:40:10<46:38,  7.84s/it] 91%|█████████ | 3481/3837 [7:40:18<47:11,  7.95s/it] 91%|█████████ | 3482/3837 [7:40:25<45:18,  7.66s/it] 91%|█████████ | 3483/3837 [7:40:32<44:00,  7.46s/it] 91%|█████████ | 3484/3837 [7:40:40<45:13,  7.69s/it] 91%|█████████ | 3485/3837 [7:40:49<46:07,  7.86s/it] 91%|█████████ | 3486/3837 [7:40:56<44:39,  7.63s/it] 91%|█████████ | 3487/3837 [7:41:03<43:31,  7.46s/it] 91%|█████████ | 3488/3837 [7:41:11<44:02,  7.57s/it] 91%|█████████ | 3489/3837 [7:41:18<42:56,  7.40s/it] 91%|█████████ | 3490/3837 [7:41:25<42:01,  7.27s/it] 91%|█████████ | 3491/3837 [7:41:34<45:50,  7.95s/it] 91%|█████████ | 3492/3837 [7:41:43<46:18,  8.05s/it] 91%|█████████ | 3493/3837 [7:41:51<46:25,  8.10s/it] 91%|█████████ | 3494/3837 [7:41:59<46:21,  8.11s/it] 91%|█████████ | 3495/3837 [7:42:05<42:31,  7.46s/it] 91%|█████████ | 3496/3837 [7:42:13<43:48,  7.71s/it] 91%|█████████ | 3497/3837 [7:42:21<44:33,  7.86s/it] 91%|█████████ | 3498/3837 [7:42:29<44:17,  7.84s/it] 91%|█████████ | 3499/3837 [7:42:37<44:51,  7.96s/it] 91%|█████████ | 3500/3837 [7:42:46<45:21,  8.08s/it]                                                     {'loss': 3.5395, 'grad_norm': 10.823748588562012, 'learning_rate': 4.020484541455627e-07, 'epoch': 0.91}
 91%|█████████ | 3500/3837 [7:42:46<45:21,  8.08s/it] 91%|█████████ | 3501/3837 [7:42:54<45:33,  8.14s/it] 91%|█████████▏| 3502/3837 [7:43:03<47:43,  8.55s/it] 91%|█████████▏| 3503/3837 [7:43:10<44:55,  8.07s/it] 91%|█████████▏| 3504/3837 [7:43:17<42:59,  7.74s/it] 91%|█████████▏| 3505/3837 [7:43:24<41:35,  7.52s/it] 91%|█████████▏| 3506/3837 [7:43:33<42:38,  7.73s/it] 91%|█████████▏| 3507/3837 [7:43:41<43:16,  7.87s/it] 91%|█████████▏| 3508/3837 [7:43:47<39:34,  7.22s/it] 91%|█████████▏| 3509/3837 [7:43:55<41:04,  7.51s/it] 91%|█████████▏| 3510/3837 [7:44:03<42:10,  7.74s/it] 92%|█████████▏| 3511/3837 [7:44:11<42:47,  7.88s/it] 92%|█████████▏| 3512/3837 [7:44:19<43:08,  7.96s/it] 92%|█████████▏| 3513/3837 [7:44:26<41:19,  7.65s/it] 92%|█████████▏| 3514/3837 [7:44:35<42:06,  7.82s/it] 92%|█████████▏| 3515/3837 [7:44:44<44:43,  8.33s/it] 92%|█████████▏| 3516/3837 [7:44:52<44:33,  8.33s/it] 92%|█████████▏| 3517/3837 [7:45:01<44:23,  8.32s/it] 92%|█████████▏| 3518/3837 [7:45:09<44:04,  8.29s/it] 92%|█████████▏| 3519/3837 [7:45:17<43:56,  8.29s/it] 92%|█████████▏| 3520/3837 [7:45:24<41:44,  7.90s/it]                                                     {'loss': 3.4571, 'grad_norm': 11.13669204711914, 'learning_rate': 3.5602048296240035e-07, 'epoch': 0.92}
 92%|█████████▏| 3520/3837 [7:45:24<41:44,  7.90s/it] 92%|█████████▏| 3521/3837 [7:45:32<42:03,  7.98s/it] 92%|█████████▏| 3522/3837 [7:45:38<39:02,  7.44s/it] 92%|█████████▏| 3523/3837 [7:45:45<38:10,  7.29s/it] 92%|█████████▏| 3524/3837 [7:45:54<39:31,  7.58s/it] 92%|█████████▏| 3525/3837 [7:46:02<40:20,  7.76s/it] 92%|█████████▏| 3526/3837 [7:46:09<39:08,  7.55s/it] 92%|█████████▏| 3527/3837 [7:46:17<39:56,  7.73s/it] 92%|█████████▏| 3528/3837 [7:46:27<42:32,  8.26s/it] 92%|█████████▏| 3529/3837 [7:46:34<40:46,  7.94s/it] 92%|█████████▏| 3530/3837 [7:46:42<41:00,  8.01s/it] 92%|█████████▏| 3531/3837 [7:46:50<41:10,  8.07s/it] 92%|█████████▏| 3532/3837 [7:46:58<41:17,  8.12s/it] 92%|█████████▏| 3533/3837 [7:47:07<41:28,  8.19s/it] 92%|█████████▏| 3534/3837 [7:47:15<41:22,  8.19s/it] 92%|█████████▏| 3535/3837 [7:47:23<41:17,  8.20s/it] 92%|█████████▏| 3536/3837 [7:47:31<41:11,  8.21s/it] 92%|█████████▏| 3537/3837 [7:47:40<41:03,  8.21s/it] 92%|█████████▏| 3538/3837 [7:47:48<40:57,  8.22s/it] 92%|█████████▏| 3539/3837 [7:47:55<38:50,  7.82s/it] 92%|█████████▏| 3540/3837 [7:48:03<39:17,  7.94s/it]                                                     {'loss': 3.3947, 'grad_norm': 10.16189193725586, 'learning_rate': 3.1274221838384577e-07, 'epoch': 0.92}
 92%|█████████▏| 3540/3837 [7:48:03<39:17,  7.94s/it] 92%|█████████▏| 3541/3837 [7:48:11<39:30,  8.01s/it] 92%|█████████▏| 3542/3837 [7:48:19<39:49,  8.10s/it] 92%|█████████▏| 3543/3837 [7:48:28<39:55,  8.15s/it] 92%|█████████▏| 3544/3837 [7:48:36<39:52,  8.17s/it] 92%|█████████▏| 3545/3837 [7:48:44<39:50,  8.19s/it] 92%|█████████▏| 3546/3837 [7:48:51<37:54,  7.82s/it] 92%|█████████▏| 3547/3837 [7:49:01<40:11,  8.32s/it] 92%|█████████▏| 3548/3837 [7:49:09<39:57,  8.29s/it] 92%|█████████▏| 3549/3837 [7:49:17<39:43,  8.28s/it] 93%|█████████▎| 3550/3837 [7:49:24<37:45,  7.89s/it] 93%|█████████▎| 3551/3837 [7:49:31<36:13,  7.60s/it] 93%|█████████▎| 3552/3837 [7:49:38<35:08,  7.40s/it] 93%|█████████▎| 3553/3837 [7:49:45<34:28,  7.28s/it] 93%|█████████▎| 3554/3837 [7:49:53<35:44,  7.58s/it] 93%|█████████▎| 3555/3837 [7:50:00<34:52,  7.42s/it] 93%|█████████▎| 3556/3837 [7:50:09<36:03,  7.70s/it] 93%|█████████▎| 3557/3837 [7:50:17<36:40,  7.86s/it] 93%|█████████▎| 3558/3837 [7:50:25<37:00,  7.96s/it] 93%|█████████▎| 3559/3837 [7:50:32<35:29,  7.66s/it] 93%|█████████▎| 3560/3837 [7:50:40<36:14,  7.85s/it]                                                     {'loss': 3.6105, 'grad_norm': 11.637459754943848, 'learning_rate': 2.7222599997674735e-07, 'epoch': 0.93}
 93%|█████████▎| 3560/3837 [7:50:40<36:14,  7.85s/it] 93%|█████████▎| 3561/3837 [7:50:48<36:35,  7.95s/it] 93%|█████████▎| 3562/3837 [7:50:57<36:51,  8.04s/it] 93%|█████████▎| 3563/3837 [7:51:05<36:56,  8.09s/it] 93%|█████████▎| 3564/3837 [7:51:14<38:41,  8.50s/it] 93%|█████████▎| 3565/3837 [7:51:21<36:29,  8.05s/it] 93%|█████████▎| 3566/3837 [7:51:30<36:35,  8.10s/it] 93%|█████████▎| 3567/3837 [7:51:39<38:18,  8.51s/it] 93%|█████████▎| 3568/3837 [7:51:46<36:02,  8.04s/it] 93%|█████████▎| 3569/3837 [7:51:53<34:22,  7.69s/it] 93%|█████████▎| 3570/3837 [7:52:02<36:40,  8.24s/it] 93%|█████████▎| 3571/3837 [7:52:09<34:54,  7.87s/it] 93%|█████████▎| 3572/3837 [7:52:18<35:11,  7.97s/it] 93%|█████████▎| 3573/3837 [7:52:25<34:05,  7.75s/it] 93%|█████████▎| 3574/3837 [7:52:33<34:30,  7.87s/it] 93%|█████████▎| 3575/3837 [7:52:41<34:50,  7.98s/it] 93%|█████████▎| 3576/3837 [7:52:49<35:02,  8.06s/it] 93%|█████████▎| 3577/3837 [7:52:58<35:05,  8.10s/it] 93%|█████████▎| 3578/3837 [7:53:05<33:31,  7.77s/it] 93%|█████████▎| 3579/3837 [7:53:12<32:18,  7.51s/it] 93%|█████████▎| 3580/3837 [7:53:20<33:10,  7.75s/it]                                                     {'loss': 3.5187, 'grad_norm': 10.827197074890137, 'learning_rate': 2.3448337978900782e-07, 'epoch': 0.93}
 93%|█████████▎| 3580/3837 [7:53:20<33:10,  7.75s/it] 93%|█████████▎| 3581/3837 [7:53:28<33:38,  7.88s/it] 93%|█████████▎| 3582/3837 [7:53:38<35:40,  8.39s/it] 93%|█████████▎| 3583/3837 [7:53:45<33:43,  7.97s/it] 93%|█████████▎| 3584/3837 [7:53:53<34:01,  8.07s/it] 93%|█████████▎| 3585/3837 [7:54:01<34:04,  8.11s/it] 93%|█████████▎| 3586/3837 [7:54:09<34:04,  8.14s/it] 93%|█████████▎| 3587/3837 [7:54:18<34:07,  8.19s/it] 94%|█████████▎| 3588/3837 [7:54:25<32:21,  7.80s/it] 94%|█████████▎| 3589/3837 [7:54:33<32:51,  7.95s/it] 94%|█████████▎| 3590/3837 [7:54:41<33:04,  8.04s/it] 94%|█████████▎| 3591/3837 [7:54:48<31:35,  7.71s/it] 94%|█████████▎| 3592/3837 [7:54:55<30:31,  7.48s/it] 94%|█████████▎| 3593/3837 [7:55:02<29:44,  7.31s/it] 94%|█████████▎| 3594/3837 [7:55:09<29:14,  7.22s/it] 94%|█████████▎| 3595/3837 [7:55:17<30:16,  7.51s/it] 94%|█████████▎| 3596/3837 [7:55:24<29:27,  7.34s/it] 94%|█████████▎| 3597/3837 [7:55:31<28:58,  7.24s/it] 94%|█████████▍| 3598/3837 [7:55:39<30:02,  7.54s/it] 94%|█████████▍| 3599/3837 [7:55:49<32:15,  8.13s/it] 94%|█████████▍| 3600/3837 [7:55:57<32:16,  8.17s/it]                                                     {'loss': 3.6053, 'grad_norm': 12.07294750213623, 'learning_rate': 1.9952511905584336e-07, 'epoch': 0.94}
 94%|█████████▍| 3600/3837 [7:55:57<32:16,  8.17s/it] 94%|█████████▍| 3601/3837 [7:56:04<30:45,  7.82s/it] 94%|█████████▍| 3602/3837 [7:56:12<31:05,  7.94s/it] 94%|█████████▍| 3603/3837 [7:56:21<31:21,  8.04s/it] 94%|█████████▍| 3604/3837 [7:56:30<32:55,  8.48s/it] 94%|█████████▍| 3605/3837 [7:56:37<31:01,  8.02s/it] 94%|█████████▍| 3606/3837 [7:56:45<31:09,  8.09s/it] 94%|█████████▍| 3607/3837 [7:56:54<31:16,  8.16s/it] 94%|█████████▍| 3608/3837 [7:57:02<31:12,  8.18s/it] 94%|█████████▍| 3609/3837 [7:57:09<29:39,  7.81s/it] 94%|█████████▍| 3610/3837 [7:57:16<28:33,  7.55s/it] 94%|█████████▍| 3611/3837 [7:57:24<29:10,  7.74s/it] 94%|█████████▍| 3612/3837 [7:57:32<29:37,  7.90s/it] 94%|█████████▍| 3613/3837 [7:57:40<29:52,  8.00s/it] 94%|█████████▍| 3614/3837 [7:57:49<30:00,  8.07s/it] 94%|█████████▍| 3615/3837 [7:57:56<28:37,  7.74s/it] 94%|█████████▍| 3616/3837 [7:58:04<29:05,  7.90s/it] 94%|█████████▍| 3617/3837 [7:58:11<28:02,  7.65s/it] 94%|█████████▍| 3618/3837 [7:58:19<28:28,  7.80s/it] 94%|█████████▍| 3619/3837 [7:58:26<27:28,  7.56s/it] 94%|█████████▍| 3620/3837 [7:58:33<26:36,  7.36s/it]                                                     {'loss': 3.512, 'grad_norm': 11.44652271270752, 'learning_rate': 1.673611851315249e-07, 'epoch': 0.94}
 94%|█████████▍| 3620/3837 [7:58:33<26:36,  7.36s/it] 94%|█████████▍| 3621/3837 [7:58:40<25:59,  7.22s/it] 94%|█████████▍| 3622/3837 [7:58:48<26:56,  7.52s/it] 94%|█████████▍| 3623/3837 [7:58:55<26:14,  7.36s/it] 94%|█████████▍| 3624/3837 [7:59:03<27:04,  7.63s/it] 94%|█████████▍| 3625/3837 [7:59:10<26:14,  7.43s/it] 95%|█████████▍| 3626/3837 [7:59:17<25:36,  7.28s/it] 95%|█████████▍| 3627/3837 [7:59:24<25:13,  7.21s/it] 95%|█████████▍| 3628/3837 [7:59:33<26:11,  7.52s/it] 95%|█████████▍| 3629/3837 [7:59:42<28:06,  8.11s/it] 95%|█████████▍| 3630/3837 [7:59:49<26:50,  7.78s/it] 95%|█████████▍| 3631/3837 [7:59:57<27:12,  7.93s/it] 95%|█████████▍| 3632/3837 [8:00:04<26:07,  7.65s/it] 95%|█████████▍| 3633/3837 [8:00:14<27:53,  8.20s/it] 95%|█████████▍| 3634/3837 [8:00:23<29:06,  8.60s/it] 95%|█████████▍| 3635/3837 [8:00:30<27:18,  8.11s/it] 95%|█████████▍| 3636/3837 [8:00:39<27:18,  8.15s/it] 95%|█████████▍| 3637/3837 [8:00:45<25:59,  7.80s/it] 95%|█████████▍| 3638/3837 [8:00:52<25:02,  7.55s/it] 95%|█████████▍| 3639/3837 [8:01:01<25:32,  7.74s/it] 95%|█████████▍| 3640/3837 [8:01:08<24:42,  7.53s/it]                                                     {'loss': 3.4737, 'grad_norm': 8.97884750366211, 'learning_rate': 1.3800074864746881e-07, 'epoch': 0.95}
 95%|█████████▍| 3640/3837 [8:01:08<24:42,  7.53s/it] 95%|█████████▍| 3641/3837 [8:01:16<25:20,  7.76s/it] 95%|█████████▍| 3642/3837 [8:01:23<24:28,  7.53s/it] 95%|█████████▍| 3643/3837 [8:01:31<24:56,  7.71s/it] 95%|█████████▍| 3644/3837 [8:01:38<24:11,  7.52s/it] 95%|█████████▍| 3645/3837 [8:01:46<24:48,  7.75s/it] 95%|█████████▌| 3646/3837 [8:01:55<25:11,  7.91s/it] 95%|█████████▌| 3647/3837 [8:02:03<25:23,  8.02s/it] 95%|█████████▌| 3648/3837 [8:02:11<25:32,  8.11s/it] 95%|█████████▌| 3649/3837 [8:02:20<25:33,  8.16s/it] 95%|█████████▌| 3650/3837 [8:02:27<24:21,  7.81s/it] 95%|█████████▌| 3651/3837 [8:02:35<24:38,  7.95s/it] 95%|█████████▌| 3652/3837 [8:02:43<24:45,  8.03s/it] 95%|█████████▌| 3653/3837 [8:02:50<23:40,  7.72s/it] 95%|█████████▌| 3654/3837 [8:02:57<22:49,  7.48s/it] 95%|█████████▌| 3655/3837 [8:03:05<23:29,  7.74s/it] 95%|█████████▌| 3656/3837 [8:03:14<23:43,  7.87s/it] 95%|█████████▌| 3657/3837 [8:03:22<23:56,  7.98s/it] 95%|█████████▌| 3658/3837 [8:03:30<23:59,  8.04s/it] 95%|█████████▌| 3659/3837 [8:03:38<23:58,  8.08s/it] 95%|█████████▌| 3660/3837 [8:03:46<24:00,  8.14s/it]                                                     {'loss': 3.425, 'grad_norm': 13.180213928222656, 'learning_rate': 1.1145218089749332e-07, 'epoch': 0.95}
 95%|█████████▌| 3660/3837 [8:03:46<24:00,  8.14s/it] 95%|█████████▌| 3661/3837 [8:03:55<23:55,  8.16s/it] 95%|█████████▌| 3662/3837 [8:04:03<23:49,  8.17s/it] 95%|█████████▌| 3663/3837 [8:04:11<23:43,  8.18s/it] 95%|█████████▌| 3664/3837 [8:04:18<22:37,  7.84s/it] 96%|█████████▌| 3665/3837 [8:04:26<22:50,  7.97s/it] 96%|█████████▌| 3666/3837 [8:04:35<22:53,  8.03s/it] 96%|█████████▌| 3667/3837 [8:04:41<21:49,  7.70s/it] 96%|█████████▌| 3668/3837 [8:04:50<22:09,  7.87s/it] 96%|█████████▌| 3669/3837 [8:04:57<21:17,  7.61s/it] 96%|█████████▌| 3670/3837 [8:05:05<21:40,  7.79s/it] 96%|█████████▌| 3671/3837 [8:05:13<21:58,  7.95s/it] 96%|█████████▌| 3672/3837 [8:05:21<22:03,  8.02s/it] 96%|█████████▌| 3673/3837 [8:05:30<22:06,  8.09s/it] 96%|█████████▌| 3674/3837 [8:05:38<22:06,  8.14s/it] 96%|█████████▌| 3675/3837 [8:05:45<20:57,  7.76s/it] 96%|█████████▌| 3676/3837 [8:05:53<21:07,  7.87s/it] 96%|█████████▌| 3677/3837 [8:06:01<21:15,  7.97s/it] 96%|█████████▌| 3678/3837 [8:06:09<21:22,  8.06s/it] 96%|█████████▌| 3679/3837 [8:06:18<21:19,  8.10s/it] 96%|█████████▌| 3680/3837 [8:06:26<21:17,  8.14s/it]                                                     {'loss': 3.5283, 'grad_norm': 10.776013374328613, 'learning_rate': 8.772305145098081e-08, 'epoch': 0.96}
 96%|█████████▌| 3680/3837 [8:06:26<21:17,  8.14s/it] 96%|█████████▌| 3681/3837 [8:06:34<21:11,  8.15s/it] 96%|█████████▌| 3682/3837 [8:06:41<20:08,  7.79s/it] 96%|█████████▌| 3683/3837 [8:06:49<20:21,  7.93s/it] 96%|█████████▌| 3684/3837 [8:06:57<20:26,  8.01s/it] 96%|█████████▌| 3685/3837 [8:07:04<19:31,  7.71s/it] 96%|█████████▌| 3686/3837 [8:07:11<18:48,  7.48s/it] 96%|█████████▌| 3687/3837 [8:07:20<19:14,  7.70s/it] 96%|█████████▌| 3688/3837 [8:07:28<19:32,  7.87s/it] 96%|█████████▌| 3689/3837 [8:07:35<18:44,  7.60s/it] 96%|█████████▌| 3690/3837 [8:07:42<18:07,  7.40s/it] 96%|█████████▌| 3691/3837 [8:07:49<17:38,  7.25s/it] 96%|█████████▌| 3692/3837 [8:07:56<17:21,  7.18s/it] 96%|█████████▌| 3693/3837 [8:08:04<18:00,  7.50s/it] 96%|█████████▋| 3694/3837 [8:08:12<18:23,  7.71s/it] 96%|█████████▋| 3695/3837 [8:08:19<17:46,  7.51s/it] 96%|█████████▋| 3696/3837 [8:08:26<17:18,  7.36s/it] 96%|█████████▋| 3697/3837 [8:08:34<17:49,  7.64s/it] 96%|█████████▋| 3698/3837 [8:08:43<18:07,  7.82s/it] 96%|█████████▋| 3699/3837 [8:08:51<18:13,  7.93s/it] 96%|█████████▋| 3700/3837 [8:08:59<18:17,  8.01s/it]                                                     {'loss': 3.5118, 'grad_norm': 10.651464462280273, 'learning_rate': 6.682012599463328e-08, 'epoch': 0.96}
 96%|█████████▋| 3700/3837 [8:08:59<18:17,  8.01s/it] 96%|█████████▋| 3701/3837 [8:09:07<18:19,  8.09s/it] 96%|█████████▋| 3702/3837 [8:09:16<18:16,  8.12s/it] 97%|█████████▋| 3703/3837 [8:09:24<18:12,  8.15s/it] 97%|█████████▋| 3704/3837 [8:09:32<18:07,  8.18s/it] 97%|█████████▋| 3705/3837 [8:09:40<18:00,  8.19s/it] 97%|█████████▋| 3706/3837 [8:09:49<17:56,  8.22s/it] 97%|█████████▋| 3707/3837 [8:09:57<17:51,  8.24s/it] 97%|█████████▋| 3708/3837 [8:10:05<17:42,  8.24s/it] 97%|█████████▋| 3709/3837 [8:10:12<16:42,  7.83s/it] 97%|█████████▋| 3710/3837 [8:10:20<16:49,  7.95s/it] 97%|█████████▋| 3711/3837 [8:10:28<16:51,  8.03s/it] 97%|█████████▋| 3712/3837 [8:10:35<16:02,  7.70s/it] 97%|█████████▋| 3713/3837 [8:10:44<16:14,  7.86s/it] 97%|█████████▋| 3714/3837 [8:10:52<16:20,  7.97s/it] 97%|█████████▋| 3715/3837 [8:10:59<15:34,  7.66s/it] 97%|█████████▋| 3716/3837 [8:11:07<15:45,  7.82s/it] 97%|█████████▋| 3717/3837 [8:11:15<15:52,  7.93s/it] 97%|█████████▋| 3718/3837 [8:11:23<15:54,  8.02s/it] 97%|█████████▋| 3719/3837 [8:11:32<15:54,  8.09s/it] 97%|█████████▋| 3720/3837 [8:11:40<15:53,  8.15s/it]                                                     {'loss': 3.5686, 'grad_norm': 11.11864185333252, 'learning_rate': 4.874936440342648e-08, 'epoch': 0.97}
 97%|█████████▋| 3720/3837 [8:11:40<15:53,  8.15s/it] 97%|█████████▋| 3721/3837 [8:11:48<15:46,  8.16s/it] 97%|█████████▋| 3722/3837 [8:11:55<14:56,  7.80s/it] 97%|█████████▋| 3723/3837 [8:12:03<15:01,  7.91s/it] 97%|█████████▋| 3724/3837 [8:12:10<14:21,  7.62s/it] 97%|█████████▋| 3725/3837 [8:12:18<14:37,  7.84s/it] 97%|█████████▋| 3726/3837 [8:12:27<14:42,  7.95s/it] 97%|█████████▋| 3727/3837 [8:12:35<14:45,  8.05s/it] 97%|█████████▋| 3728/3837 [8:12:43<14:44,  8.11s/it] 97%|█████████▋| 3729/3837 [8:12:51<14:40,  8.15s/it] 97%|█████████▋| 3730/3837 [8:13:00<14:33,  8.17s/it] 97%|█████████▋| 3731/3837 [8:13:07<13:45,  7.79s/it] 97%|█████████▋| 3732/3837 [8:13:15<13:49,  7.90s/it] 97%|█████████▋| 3733/3837 [8:13:22<13:11,  7.61s/it] 97%|█████████▋| 3734/3837 [8:13:30<13:23,  7.80s/it] 97%|█████████▋| 3735/3837 [8:13:37<12:54,  7.59s/it] 97%|█████████▋| 3736/3837 [8:13:45<13:05,  7.78s/it] 97%|█████████▋| 3737/3837 [8:13:53<13:12,  7.93s/it] 97%|█████████▋| 3738/3837 [8:14:02<13:17,  8.06s/it] 97%|█████████▋| 3739/3837 [8:14:10<13:16,  8.13s/it] 97%|█████████▋| 3740/3837 [8:14:18<13:09,  8.14s/it]                                                     {'loss': 3.6153, 'grad_norm': 11.73697280883789, 'learning_rate': 3.351591904131923e-08, 'epoch': 0.97}
 97%|█████████▋| 3740/3837 [8:14:18<13:09,  8.14s/it] 97%|█████████▋| 3741/3837 [8:14:27<13:04,  8.18s/it] 98%|█████████▊| 3742/3837 [8:14:34<12:21,  7.81s/it] 98%|█████████▊| 3743/3837 [8:14:42<12:27,  7.95s/it] 98%|█████████▊| 3744/3837 [8:14:50<12:26,  8.03s/it] 98%|█████████▊| 3745/3837 [8:14:58<12:23,  8.08s/it] 98%|█████████▊| 3746/3837 [8:15:05<11:46,  7.77s/it] 98%|█████████▊| 3747/3837 [8:15:13<11:50,  7.90s/it] 98%|█████████▊| 3748/3837 [8:15:20<11:18,  7.62s/it] 98%|█████████▊| 3749/3837 [8:15:30<12:00,  8.18s/it] 98%|█████████▊| 3750/3837 [8:15:37<11:20,  7.83s/it] 98%|█████████▊| 3751/3837 [8:15:45<11:22,  7.93s/it] 98%|█████████▊| 3752/3837 [8:15:55<11:53,  8.39s/it] 98%|█████████▊| 3753/3837 [8:16:02<11:32,  8.25s/it] 98%|█████████▊| 3754/3837 [8:16:11<11:23,  8.24s/it] 98%|█████████▊| 3755/3837 [8:16:20<11:39,  8.53s/it] 98%|█████████▊| 3756/3837 [8:16:27<10:52,  8.05s/it] 98%|█████████▊| 3757/3837 [8:16:36<11:19,  8.50s/it] 98%|█████████▊| 3758/3837 [8:16:43<10:33,  8.02s/it] 98%|█████████▊| 3759/3837 [8:16:52<10:30,  8.09s/it] 98%|█████████▊| 3760/3837 [8:17:00<10:26,  8.13s/it]                                                     {'loss': 3.5107, 'grad_norm': 11.967141151428223, 'learning_rate': 2.1124133292207415e-08, 'epoch': 0.98}
 98%|█████████▊| 3760/3837 [8:17:00<10:26,  8.13s/it] 98%|█████████▊| 3761/3837 [8:17:08<10:20,  8.17s/it] 98%|█████████▊| 3762/3837 [8:17:15<09:46,  7.82s/it] 98%|█████████▊| 3763/3837 [8:17:23<09:45,  7.92s/it] 98%|█████████▊| 3764/3837 [8:17:30<09:16,  7.62s/it] 98%|█████████▊| 3765/3837 [8:17:38<09:21,  7.80s/it] 98%|█████████▊| 3766/3837 [8:17:47<09:22,  7.92s/it] 98%|█████████▊| 3767/3837 [8:17:53<08:54,  7.63s/it] 98%|█████████▊| 3768/3837 [8:18:02<08:58,  7.80s/it] 98%|█████████▊| 3769/3837 [8:18:10<08:59,  7.94s/it] 98%|█████████▊| 3770/3837 [8:18:17<08:32,  7.64s/it] 98%|█████████▊| 3771/3837 [8:18:24<08:12,  7.46s/it] 98%|█████████▊| 3772/3837 [8:18:32<08:19,  7.69s/it] 98%|█████████▊| 3773/3837 [8:18:40<08:23,  7.86s/it] 98%|█████████▊| 3774/3837 [8:18:49<08:21,  7.97s/it] 98%|█████████▊| 3775/3837 [8:18:56<07:55,  7.68s/it] 98%|█████████▊| 3776/3837 [8:19:04<07:59,  7.85s/it] 98%|█████████▊| 3777/3837 [8:19:11<07:36,  7.60s/it] 98%|█████████▊| 3778/3837 [8:19:19<07:40,  7.81s/it] 98%|█████████▊| 3779/3837 [8:19:26<07:18,  7.55s/it] 99%|█████████▊| 3780/3837 [8:19:34<07:22,  7.76s/it]                                                     {'loss': 3.455, 'grad_norm': 11.444239616394043, 'learning_rate': 1.1577540321529023e-08, 'epoch': 0.98}
 99%|█████████▊| 3780/3837 [8:19:34<07:22,  7.76s/it] 99%|█████████▊| 3781/3837 [8:19:41<07:02,  7.55s/it] 99%|█████████▊| 3782/3837 [8:19:50<07:06,  7.75s/it] 99%|█████████▊| 3783/3837 [8:19:57<06:45,  7.51s/it] 99%|█████████▊| 3784/3837 [8:20:05<06:49,  7.73s/it] 99%|█████████▊| 3785/3837 [8:20:12<06:31,  7.52s/it] 99%|█████████▊| 3786/3837 [8:20:20<06:35,  7.75s/it] 99%|█████████▊| 3787/3837 [8:20:27<06:14,  7.49s/it] 99%|█████████▊| 3788/3837 [8:20:35<06:17,  7.70s/it] 99%|█████████▊| 3789/3837 [8:20:42<05:58,  7.48s/it] 99%|█████████▉| 3790/3837 [8:20:50<06:01,  7.69s/it] 99%|█████████▉| 3791/3837 [8:20:57<05:44,  7.49s/it] 99%|█████████▉| 3792/3837 [8:21:06<05:46,  7.70s/it] 99%|█████████▉| 3793/3837 [8:21:14<05:45,  7.85s/it] 99%|█████████▉| 3794/3837 [8:21:22<05:41,  7.95s/it] 99%|█████████▉| 3795/3837 [8:21:29<05:22,  7.69s/it] 99%|█████████▉| 3796/3837 [8:21:36<05:06,  7.48s/it] 99%|█████████▉| 3797/3837 [8:21:43<04:53,  7.33s/it] 99%|█████████▉| 3798/3837 [8:21:51<04:57,  7.63s/it] 99%|█████████▉| 3799/3837 [8:22:00<04:57,  7.82s/it] 99%|█████████▉| 3800/3837 [8:22:08<04:55,  7.98s/it]                                                     {'loss': 3.4873, 'grad_norm': 10.531210899353027, 'learning_rate': 4.8788620688844375e-09, 'epoch': 0.99}
 99%|█████████▉| 3800/3837 [8:22:08<04:55,  7.98s/it] 99%|█████████▉| 3801/3837 [8:22:16<04:50,  8.06s/it] 99%|█████████▉| 3802/3837 [8:22:24<04:43,  8.09s/it] 99%|█████████▉| 3803/3837 [8:22:34<04:49,  8.51s/it] 99%|█████████▉| 3804/3837 [8:22:42<04:38,  8.45s/it] 99%|█████████▉| 3805/3837 [8:22:50<04:28,  8.38s/it] 99%|█████████▉| 3806/3837 [8:22:57<04:06,  7.95s/it] 99%|█████████▉| 3807/3837 [8:23:07<04:12,  8.41s/it] 99%|█████████▉| 3808/3837 [8:23:15<04:02,  8.35s/it] 99%|█████████▉| 3809/3837 [8:23:25<04:03,  8.71s/it] 99%|█████████▉| 3810/3837 [8:23:33<03:50,  8.55s/it] 99%|█████████▉| 3811/3837 [8:23:41<03:39,  8.45s/it] 99%|█████████▉| 3812/3837 [8:23:49<03:29,  8.38s/it] 99%|█████████▉| 3813/3837 [8:23:58<03:20,  8.36s/it] 99%|█████████▉| 3814/3837 [8:24:06<03:11,  8.32s/it] 99%|█████████▉| 3815/3837 [8:24:14<03:02,  8.30s/it] 99%|█████████▉| 3816/3837 [8:24:21<02:46,  7.93s/it] 99%|█████████▉| 3817/3837 [8:24:29<02:40,  8.02s/it]100%|█████████▉| 3818/3837 [8:24:38<02:33,  8.07s/it]100%|█████████▉| 3819/3837 [8:24:44<02:19,  7.73s/it]100%|█████████▉| 3820/3837 [8:24:53<02:13,  7.87s/it]                                                     {'loss': 3.6354, 'grad_norm': 9.609341621398926, 'learning_rate': 1.030008471950561e-09, 'epoch': 1.0}
100%|█████████▉| 3820/3837 [8:24:53<02:13,  7.87s/it]100%|█████████▉| 3821/3837 [8:25:01<02:07,  7.95s/it]100%|█████████▉| 3822/3837 [8:25:09<02:00,  8.03s/it]100%|█████████▉| 3823/3837 [8:25:17<01:53,  8.10s/it]100%|█████████▉| 3824/3837 [8:25:25<01:45,  8.14s/it]100%|█████████▉| 3825/3837 [8:25:34<01:37,  8.14s/it]100%|█████████▉| 3826/3837 [8:25:42<01:29,  8.17s/it]100%|█████████▉| 3827/3837 [8:25:51<01:25,  8.50s/it]100%|█████████▉| 3828/3837 [8:25:58<01:12,  8.04s/it]100%|█████████▉| 3829/3837 [8:26:06<01:04,  8.10s/it]100%|█████████▉| 3830/3837 [8:26:13<00:54,  7.77s/it]100%|█████████▉| 3831/3837 [8:26:22<00:47,  7.90s/it]100%|█████████▉| 3832/3837 [8:26:28<00:38,  7.60s/it]100%|█████████▉| 3833/3837 [8:26:37<00:31,  7.81s/it]100%|█████████▉| 3834/3837 [8:26:44<00:22,  7.54s/it]100%|█████████▉| 3835/3837 [8:26:51<00:14,  7.36s/it]100%|█████████▉| 3836/3837 [8:26:59<00:07,  7.61s/it]100%|██████████| 3837/3837 [8:27:07<00:00,  7.84s/it]                                                     {'train_runtime': 30467.0064, 'train_samples_per_second': 8.062, 'train_steps_per_second': 0.126, 'train_loss': 4.347950845638351, 'epoch': 1.0}
100%|██████████| 3837/3837 [8:27:47<00:00,  7.84s/it]100%|██████████| 3837/3837 [8:27:47<00:00,  7.94s/it]
[rank0]:[W1128 04:27:21.732457719 ProcessGroupNCCL.cpp:1250] Warning: WARNING: process group has NOT been destroyed before we destruct ProcessGroupNCCL. On normal program exit, the application should call destroy_process_group to ensure that any pending NCCL operations have finished in this process. In rare cases this process can exit before this point and block the progress of another member of the process group. This constraint has always been present,  but this warning has only been added since PyTorch 2.4 (function operator())