2/17/2026 | USA | technology | ✓ Verified - arxiv.org

ProMoral-Bench: Evaluating Prompting Strategies for Moral Reasoning and Safety in LLMs

#ProMoral-Bench #LLM prompting #moral reasoning #ethical alignment #ETHICS dataset #Scruples #WildJailbreak #ETHICS-Contrast #Unified Moral Safety Score #benchmarking AI safety

📌 Key Takeaways

Launch of ProMoral-Bench on arXiv (id: 2602.13274v1) dated 26 February 2026.
Benchmark evaluates 11 prompting strategies across four major LLM families.
Datasets used: ETHICS, Scruples, WildJailbreak, and the custom ETHICS-Contrast robustness test.
Introduces Unified Moral Safety Score (UMSS) as a single metric for performance comparison.
Aims to clarify the impact of prompt design on moral reasoning and safety alignment of LLMs.

📖 Full Retelling

ProMoral-Bench: Evaluating Prompting Strategies for Moral Reasoning and Safety in LLMs is a new benchmark introduced on February 26, 2026, to systematically assess how different prompting designs influence the moral competence and safety alignment of large language models (LLMs). It brings together 11 prompting paradigms and evaluates them across four LLM families using datasets such as ETHICS, Scruples, and WildJailbreak, plus a newly created robustness test called ETHICS-Contrast. The goal is to provide a unified, reproducible measurement framework that highlights which prompting strategies best mitigate undesirable or unsafe behavior in LLMs.

🏷️ Themes

Artificial Intelligence Ethics, Natural Language Processing Evaluation, Robustness Testing in LLMs, Prompt Engineering, Model Safety & Alignment

Entity Intersection Graph

No entity connections available yet for this article.

Original Source

              arXiv:2602.13274v1 Announce Type: new 
Abstract: Prompt design significantly impacts the moral competence and safety alignment of large language models (LLMs), yet empirical comparisons remain fragmented across datasets and models.We introduce ProMoral-Bench, a unified benchmark evaluating 11 prompting paradigms across four LLM families. Using ETHICS, Scruples, WildJailbreak, and our new robustness test, ETHICS-Contrast, we measure performance via our proposed Unified Moral Safety Score (UMSS), 
            

Read full article at source

Source

arxiv.org

ProMoral-Bench: Evaluating Prompting Strategies for Moral Reasoning and Safety in LLMs

📌 Key Takeaways

📖 Full Retelling

🏷️ Themes

Entity Intersection Graph

Source

More from USA

News from Other Countries

🇬🇧 United Kingdom

🇺🇦 Ukraine