Improving instruction hierarchy in frontier LLMs

OpenAI Blog·March 10, 2026 at 11:00 AM·

Trusted Source

IH-Challenge trains models to prioritize trusted instructions, improving instruction hierarchy, safety steerability, and resistance to prompt injection attacks.

Improving instruction hierarchy in frontier LLMs | AI News | AIventa