MZ's picture

MZ

Shahradmz

·

https://emzedi.github.io/website/#

EMZEDI

AI & ML interests

LLMs, Graph Learning, Temporal Graph Learning, RL, Continual RL, Optimization

Organizations

Papers 2

arxiv:2410.15460

arxiv:2401.17574

models 115

Shahradmz/Qwen2.5-0.5B-Instruct_cppo-reward_REWARD_1

0.5B • Updated May 12, 2025

Shahradmz/Qwen2.5-0.5B-Instruct_cppo-reward_REWARD_0

0.5B • Updated May 12, 2025

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_CPPO_1

Updated May 1, 2025

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_CPPO_0

Updated May 1, 2025

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_PPO_1

Updated Apr 28, 2025

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_PPO_0

Updated Apr 28, 2025

Shahradmz/Qwen2-1.5B-Instruct_cppo-reward_REWARD_0

2B • Updated Mar 25, 2025 • 1

Shahradmz/Qwen2-1.5B-Instruct_cppo-reward_REWARD_1

Updated Mar 25, 2025

Shahradmz/Qwen2-0.5B-Reward_debug_mas

Text Classification • 0.5B • Updated Mar 19, 2025

Shahradmz/Qwen2-0.5B-Reward

Updated Mar 19, 2025

View 115 models

datasets 12

Shahradmz/education_qna_hinted_qwen05

Viewer • Updated Mar 28, 2025 • 1 • 9

Shahradmz/education_qna_hinted

Viewer • Updated Mar 27, 2025 • 1 • 13

Shahradmz/education_summary_expert

Viewer • Updated Mar 27, 2025 • 1 • 13

Shahradmz/education_qna_hinted_static

Viewer • Updated Mar 26, 2025 • 1 • 14

Shahradmz/cppo_continual_dataset_rl_others

Viewer • Updated Mar 10, 2025 • 75.7k • 5

Shahradmz/cppo_continual_dataset_rl_relationships

Viewer • Updated Mar 10, 2025 • 93.9k • 7

Shahradmz/cppo_continual_dataset_reward_others

Viewer • Updated Mar 10, 2025 • 78.5k • 5

Shahradmz/cppo_continual_dataset_reward_relationships

Viewer • Updated Mar 10, 2025 • 97.4k • 7

Shahradmz/ca_constitution_1

Viewer • Updated Nov 25, 2024 • 33.7k • 6

Shahradmz/ca_constitution_2

Viewer • Updated Nov 23, 2024 • 35.8k • 5

View 12 datasets