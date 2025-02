Chatbot Arena ist eine offene Benchmark-Plattform, auf der zwei anonyme Chatbots gegeneinander antreten. Die Benutzer führen zufällige Gespräche in der realen Welt mit beiden Chatbots in einer „Arena“ und stimmen dann ab, welchen sie bevorzugen, woraufhin die Identitäten der Models enthüllt werden. Diese paarweisen Vergleichsdaten aus Crowdsourcing werden in statistische Methoden eingespeist, die Scores schätzen und ungefähre Rankings für verschiedene LLMs erstellen. Sampling-Algorithmen werden auch zur Kopplung von Modellen verwendet.1