Inlay

Measuring values is key for aligning systems with people’s values, but value expression is fundamentally subjective, leading to divergent labels from different people. We find meaningful disagreement in value annotations across raters. See for yourself, do you think the example contains humility?