Explore Help

Register Sign In

hailin

/

evalscope

1

0

You've already forked evalscope

Code Issues Pull Requests Packages Projects Releases Wiki Activity

evalscope/docs/en/experiments/benchmark/index.md

107 B

Raw Blame History

Benchmarking

Here are the benchmarking results for some models:

:::{toctree} :maxdepth: 1

mmlu.md :::

Powered by Gitea Version: 1.21.11 Page: 7ms Template: 1ms

English

Bahasa Indonesia Deutsch English Español Français Italiano Latviešu Magyar nyelv Nederlands Polski Português de Portugal Português do Brasil Suomi Svenska Türkçe Čeština Ελληνικά Български Русский Українська فارسی മലയാളം 日本語简体中文繁體中文（台灣）繁體中文（香港） 한국어

Licenses API