Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2412.03187

A LoRA-Based Approach to Fine-Tuning LLMs for Educational Guidance in Resource-Constrained Settings

Paper • 2504.15610 • Published Apr 22 • 1
Train Small, Infer Large: Memory-Efficient LoRA Training for Large Language Models

Paper • 2502.13533 • Published Feb 19 • 12
LoRA-SP: Streamlined Partial Parameter Adaptation for Resource-Efficient Fine-Tuning of Large Language Models

Paper • 2403.08822 • Published Feb 28, 2024
LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

Paper • 2407.18242 • Published Jul 25, 2024

Weighted-Reward Preference Optimization for Implicit Model Fusion

Paper • 2412.03187 • Published Dec 4, 2024 • 12

Preference Optimization for Implicit Model Fusion

Weighted-Reward Preference Optimization for Implicit Model Fusion

Paper • 2412.03187 • Published Dec 4, 2024 • 12
FuseAI/FuseChat-Llama-3.1-8B-Instruct

Text Generation • 8B • Updated Mar 8 • 33 • 12
FuseAI/FuseChat-Llama-3.2-3B-Instruct

3B • Updated Feb 7 • 405 • 7
FuseAI/FuseChat-Llama-3.2-1B-Instruct

1B • Updated Feb 7 • 28 • 6

Search, Verify and Feedback: Towards Next Generation Post-training Paradigm of Foundation Models via Verifier Engineering

Paper • 2411.11504 • Published Nov 18, 2024 • 23
Top-nσ: Not All Logits Are You Need

Paper • 2411.07641 • Published Nov 12, 2024 • 23
Adaptive Decoding via Latent Preference Optimization

Paper • 2411.09661 • Published Nov 14, 2024 • 10
When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training

Paper • 2411.13476 • Published Nov 20, 2024 • 16

Badllama 3: removing safety finetuning from Llama 3 in minutes

Paper • 2407.01376 • Published Jul 1, 2024
Weighted-Reward Preference Optimization for Implicit Model Fusion

Paper • 2412.03187 • Published Dec 4, 2024 • 12
Sparse Matrix in Large Language Model Fine-tuning

Paper • 2405.15525 • Published May 24, 2024

Preference Optimization for Implicit Model Fusion

Weighted-Reward Preference Optimization for Implicit Model Fusion

Paper • 2412.03187 • Published Dec 4, 2024 • 12
FuseAI/FuseChat-Llama-3.1-8B-Instruct

Text Generation • 8B • Updated Mar 8 • 33 • 12
FuseAI/FuseChat-Llama-3.2-3B-Instruct

3B • Updated Feb 7 • 405 • 7
FuseAI/FuseChat-Llama-3.2-1B-Instruct

1B • Updated Feb 7 • 28 • 6

bitext/Bitext-travel-llm-chatbot-training-dataset

Viewer • Updated Aug 22, 2024 • 31.7k • 168 • 2
alexlawtengyi/travel_agentv1

Viewer • Updated Nov 22, 2024 • 691 • 29 • 1
yananchen/travelplanner_faft_filter_label45_pos517_neg1959

Viewer • Updated Nov 18, 2024 • 2k • 10
osunlp/TravelPlanner

Viewer • Updated Jul 14, 2024 • 1.23k • 21.2k • 73

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 151
Orion-14B: Open-source Multilingual Large Language Models

Paper • 2401.12246 • Published Jan 20, 2024 • 14
MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24, 2024 • 60
MM-LLMs: Recent Advances in MultiModal Large Language Models

Paper • 2401.13601 • Published Jan 24, 2024 • 48

A LoRA-Based Approach to Fine-Tuning LLMs for Educational Guidance in Resource-Constrained Settings

Paper • 2504.15610 • Published Apr 22 • 1
Train Small, Infer Large: Memory-Efficient LoRA Training for Large Language Models

Paper • 2502.13533 • Published Feb 19 • 12
LoRA-SP: Streamlined Partial Parameter Adaptation for Resource-Efficient Fine-Tuning of Large Language Models

Paper • 2403.08822 • Published Feb 28, 2024
LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

Paper • 2407.18242 • Published Jul 25, 2024

Badllama 3: removing safety finetuning from Llama 3 in minutes

Paper • 2407.01376 • Published Jul 1, 2024
Weighted-Reward Preference Optimization for Implicit Model Fusion

Paper • 2412.03187 • Published Dec 4, 2024 • 12
Sparse Matrix in Large Language Model Fine-tuning

Paper • 2405.15525 • Published May 24, 2024

Weighted-Reward Preference Optimization for Implicit Model Fusion

Paper • 2412.03187 • Published Dec 4, 2024 • 12

Preference Optimization for Implicit Model Fusion

Weighted-Reward Preference Optimization for Implicit Model Fusion

Paper • 2412.03187 • Published Dec 4, 2024 • 12
FuseAI/FuseChat-Llama-3.1-8B-Instruct

Text Generation • 8B • Updated Mar 8 • 33 • 12
FuseAI/FuseChat-Llama-3.2-3B-Instruct

3B • Updated Feb 7 • 405 • 7
FuseAI/FuseChat-Llama-3.2-1B-Instruct

1B • Updated Feb 7 • 28 • 6

Preference Optimization for Implicit Model Fusion

Weighted-Reward Preference Optimization for Implicit Model Fusion

Paper • 2412.03187 • Published Dec 4, 2024 • 12
FuseAI/FuseChat-Llama-3.1-8B-Instruct

Text Generation • 8B • Updated Mar 8 • 33 • 12
FuseAI/FuseChat-Llama-3.2-3B-Instruct

3B • Updated Feb 7 • 405 • 7
FuseAI/FuseChat-Llama-3.2-1B-Instruct

1B • Updated Feb 7 • 28 • 6

bitext/Bitext-travel-llm-chatbot-training-dataset

Viewer • Updated Aug 22, 2024 • 31.7k • 168 • 2
alexlawtengyi/travel_agentv1

Viewer • Updated Nov 22, 2024 • 691 • 29 • 1
yananchen/travelplanner_faft_filter_label45_pos517_neg1959

Viewer • Updated Nov 18, 2024 • 2k • 10
osunlp/TravelPlanner

Viewer • Updated Jul 14, 2024 • 1.23k • 21.2k • 73

Search, Verify and Feedback: Towards Next Generation Post-training Paradigm of Foundation Models via Verifier Engineering

Paper • 2411.11504 • Published Nov 18, 2024 • 23
Top-nσ: Not All Logits Are You Need

Paper • 2411.07641 • Published Nov 12, 2024 • 23
Adaptive Decoding via Latent Preference Optimization

Paper • 2411.09661 • Published Nov 14, 2024 • 10
When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training

Paper • 2411.13476 • Published Nov 20, 2024 • 16

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 151
Orion-14B: Open-source Multilingual Large Language Models

Paper • 2401.12246 • Published Jan 20, 2024 • 14
MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24, 2024 • 60
MM-LLMs: Recent Advances in MultiModal Large Language Models

Paper • 2401.13601 • Published Jan 24, 2024 • 48

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs