Agenten werden zunehmend zu eigenständigen Softwaresystemen. Doch wie vergleicht man sie fair?
Dieses Paper schlägt einen offenen Standard vor, bei dem nicht nur die getesteten Agenten, sondern auch die Evaluatoren selbst als Agenten agieren. Ziel sind reproduzierbare, interoperable und […]