tinyBenchmarks

community

https://github.com/felipemaiapolo/tinyBenchmarks

AI & ML interests

None defined yet.

Recent Activity

borgr submitted a paper 20 days ago

General Agent Evaluation

moonfolk authored a paper 9 months ago

Revisiting Reinforcement Learning for LLM Reasoning from A Cross-Domain Perspective

borgr authored a paper 11 months ago

Pretraining Language Models for Diachronic Linguistic Change Discovery

View all activity

models 0

None public yet

datasets 7

tinyBenchmarks/tinyMMLU

Viewer • Updated Jul 8, 2024 • 385 • 14k • 24

tinyBenchmarks/tinyHellaswag

Viewer • Updated May 25, 2024 • 50k • 2.48k • 5

tinyBenchmarks/tinyTruthfulQA

Preview • Updated May 25, 2024 • 1.6k • 4

tinyBenchmarks/tinyWinogrande

Preview • Updated May 25, 2024 • 2.1k • 5

tinyBenchmarks/tinyGSM8k

Preview • Updated May 25, 2024 • 6.97k • 9

tinyBenchmarks/tinyAI2_arc

Preview • Updated May 25, 2024 • 2.24k • 4

tinyBenchmarks/tinyAlpacaEval

Viewer • Updated Apr 19, 2024 • 100 • 147 • 7