SideKick
SideKick
Workspace
Service
Analysis
Kaufen
News
Blog
Roadmap
Events
KI-Podcast
On-Premise
Downloads
Mehr...
Tobit.Software
Parallelstraße 41
48683 Ahaus
mail@tobit.com
Kaufen
On-Premise
Downloads
SideKick
SideKick
Workspace
Service
Analysis
News
Blog
Roadmap
Events
SideKick On The Road: data:unplugged Deep Dive
Bekommt SideKick jetzt ein Gedächnis?
Sommer, Sonne, SideKick!
Ki verstehen ohne Tech-Bubble
Agent Voice Calling
Full Self-Answering
So baust du deinen eigenen KI-Agenten
KI-Fails
Die KI-Start-up-Welle
KI vs. Mediziner
Wo liegen deine Daten?
Warum KI deine Daten braucht
#quitGPT
Vibe Coding
KI-Strategien für Unternehmen
Tobit.Software
Parallelstraße 41
48683 Ahaus
mail@tobit.com
Kaufen
On-Premise
Downloads
SideKick
SideKick
Workspace
Service
Analysis
News
Blog
Roadmap
Events
SideKick On The Road: data:unplugged Deep Dive
Bekommt SideKick jetzt ein Gedächnis?
Sommer, Sonne, SideKick!
Ki verstehen ohne Tech-Bubble
Agent Voice Calling
Full Self-Answering
So baust du deinen eigenen KI-Agenten
KI-Fails
Die KI-Start-up-Welle
KI vs. Mediziner
Wo liegen deine Daten?
Warum KI deine Daten braucht
#quitGPT
Vibe Coding
KI-Strategien für Unternehmen

Leaderboard der AI-Modelle in SideKick

= Dateiupload

= Web-Zugriff

= Bildupload

= Denkprozesse

 

 


Das Leaderboard basiert auf dem Intelligence Index v4.0 und vergleicht die aktuellsten Large Language Models in SideKick anhand standardisierter Benchmarks in vier Kompetenzbereichen:
Agentenfähigkeit (GDPval-AA, τ²-Bench Telecom),
Programmieren (Terminal-Bench Hard, SciCode),
Sprache & Wissen (AA-LCR, AA-Omniscience, IFBench),
Logisches Denken (HLE, GPQA Diamond, CritPt).

Zusätzlich wird die Geschwindigkeit und Geschwindigkeit Reasoning auf Basis der Kennzahl Time to First Token (TTFT) bewertet. Die zugrunde liegenden Performance-Daten stammen aus den aggregierten Messungen von artificialanalysis.ai.

Die Gesamtbewertung erfolgt auf Grundlage klar definierter Aufgabenformate, automatisierter Auswertungssysteme und reproduzierbarer Scoring-Methodiken.

Claude Haiku 4.5

Anthropic | USA

Preis  ·  €€

Sprache & Wissen

5,4

Logisches Denken

2,9

Agentenfähigkeit

4,0

Programmieren

3,2

Geschwindigkeit

8,5

Geschwindigkeit Reasoning

3,3

Funktionen

       

200k Token Kontext
Wissenstand bis Juli 2025

Claude 4 Opus   

Anthropic | USA

Preis  ·  €€€€€

Sprache & Wissen

4,4

Logisches Denken

3,4

Agentenfähigkeit

7,1

Programmieren

3,4

Geschwindigkeit

7,1

Geschwindigkeit Reasoning

1,7

Funktionen

        

200k Token Kontext
Wissenstand bis August 2024
 

Claude Opus 4.1    

Anthropic | USA

Preis  ·  €€€€€

Sprache & Wissen

5,2

Logisches Denken

3,5

Agentenfähigkeit

7,1

Programmieren

3,6

Geschwindigkeit

7,1

Geschwindigkeit Reasoning

1,9

Funktionen

        

200k Token Kontext  
Wissenstand bis August 2024

Claude 4.5 Opus   

Anthropic | USA

Preis  ·  €€€€

Sprache & Wissen

5,2

Logisches Denken

3,7

Agentenfähigkeit

7,1

Programmieren

3,6

Geschwindigkeit

6,9

Geschwindigkeit Reasoning

2,7

Funktionen

        

200k Token Kontext
Wissenstand bis August 2025

Claude 4.6 Opus   

Anthropic | USA

Preis  ·  €€€€€

Sprache & Wissen

5,2

Logisches Denken

4,4

Agentenfähigkeit

6,7

Programmieren

4,8

Geschwindigkeit

6,8

Geschwindigkeit Reasoning

2,4

Funktionen

        

1m Token Kontext
Wissenstand bis August 2025
 

Claude 4 Sonnet  

Anthropic | USA

Preis  ·  €€€€

Sprache & Wissen

5,3

Logisches Denken

2,4

Agentenfähigkeit

4,4

Programmieren

3,4

Geschwindigkeit

7,3

Geschwindigkeit Reasoning

2,7

Funktionen

        

1m Token Kontext
Wissenstand bis August 2024
 

Claude 4.5 Sonnet  

Anthropic | USA

Preis  ·  €€€€

Sprache & Wissen

5,2

Logisches Denken

3,0

Agentenfähigkeit

4,4

Programmieren

3,9

Geschwindigkeit

7,0

Geschwindigkeit Reasoning

2,1

Funktionen

        

1m Token Kontext
Wissenstand bis Juli 2025

Claude 4.6 Sonnet  

Anthropic | USA

Preis  ·  €€€€

Sprache & Wissen

5,4

Logisches Denken

3,8

Agentenfähigkeit

6,3

Programmieren

5,1

Geschwindigkeit

8,1

Geschwindigkeit Reasoning

2,1

Funktionen

        

1m Token Kontext
Wissenstand bis August 2025
 

DeepSeek R1

DeepSeek AI | China

Preis  ·  €€€

Sprache & Wissen

3,3

Logisches Denken

2,3

Agentenfähigkeit

0,4

Programmieren

1,6

Geschwindigkeit

N/A

Geschwindigkeit Reasoning

N/A

Funktionen

         

128k Token Kontext  
Wissenstand bis Juli 2024

DeepSeek v3.2

DeepSeek AI | China

Preis  ·  €€

Sprache & Wissen

4,4

Logisches Denken

3,3

Agentenfähigkeit

5,4

Programmieren

3,7

Geschwindigkeit

7,4

Geschwindigkeit Reasoning

1,4

Funktionen+

         

128k Token Kontext  
Wissenstand bis Januar 2024

Gemini 2.5 Flash  

Google | USA

Preis  ·  €€

Sprache & Wissen

4,1

Logisches Denken

2,6

Agentenfähigkeit

1,8

Programmieren

2,2

Geschwindigkeit

9,1

Geschwindigkeit Reasoning

N/A

Funktionen

              

1m Token Kontext

Wissenstand bis Januar 2025

Gemini 2.5 Flash-Lite

Google | USA

Preis  ·  €

Sprache & Wissen

3,6

Logisches Denken

2,1 

Agentenfähigkeit

1,0

Programmieren

1,8

Geschwindigkeit

8,8

Geschwindigkeit Reasoning

4,3

Funktionen

                

1m Token Kontext
Wissenstand bis Januar 2025

Gemini 2.5 Pro  

Google | USA

Preis  ·  €€€

Sprache & Wissen

4,1

Logisches Denken

3,2

Agentenfähigkeit

3,3

Programmieren

3,2

Geschwindigkeit

N/A

Geschwindigkeit Reasoning

2,1

Funktionen

            

1m Token Kontext
Wissenstand bis Januar 2025

Gemini 3 Flash  

Google | USA

Preis  ·  €€

Sprache & Wissen

5,1

Logisches Denken

4,2

Agentenfähigkeit

5,0

Programmieren

4,3

Geschwindigkeit

7,3

Geschwindigkeit Reasoning

3,8

Funktionen

            

1m Token Kontext
Wissenstand bis Januar 2025

Gemini 3.1 Flash Lite  

Google | USA

Preis  ·  €€

Sprache & Wissen

4,9

Logisches Denken

2,9

Agentenfähigkeit

2,6

Programmieren

3,0

Geschwindigkeit

N/A

Geschwindigkeit Reasoning

5,0

Funktionen

            

1m Token Kontext
Wissenstand bis Januar 2025

Gemini 3.1 Pro  

Google | USA

Preis  ·  €€€

Sprache & Wissen

5,2

Logisches Denken

4,4

Agentenfähigkeit

5,2

Programmieren

4,7

Geschwindigkeit

N/A

Geschwindigkeit Reasoning

2,3

Funktionen

            

1m Token Kontext
Wissenstand bis Januar 2025

GLM-4.5    

Zai-Org | China

Preis  ·  €€

Sprache & Wissen

5,7

Logisches Denken

3,4

Agentenfähigkeit

6,3

Programmieren

4,4

Geschwindigkeit

N/A

Geschwindigkeit Reasoning

1,7

Funktionen

            

128k Token Kontext

Wissenstand bis Oktober 2023

GLM-4.5 Air

Zai-Org | China

Preis  ·  €

Sprache & Wissen

2,6

Logisches Denken

2,2

Agentenfähigkeit

2,0

Programmieren

2,4

Geschwindigkeit

N/A

Geschwindigkeit Reasoning

3,3

Funktionen

            

128k Token Kontext 
Wissenstand bis Oktober 2023

GLM-4.7   

Zai-Org | China

Preis  ·  €

Sprache & Wissen

4,3

Logisches Denken

3,5

Agentenfähigkeit

5,5

Programmieren

3,6

Geschwindigkeit

8,5

Geschwindigkeit
Reasoning

3,5

Funktionen

       

200k Token Kontext
Wissenstand bis Oktober 2023

GPT OSS 120b

Telekom | Deutschland

Preis  ·  €€€

Sprache & Wissen

3,8

Logisches Denken

2,9

Agentenfähigkeit

3,8

Programmieren

2,9

Geschwindigkeit  

N/A

Geschwindigkeit Reasoning

4,6

Funktionen

        

131k Token Kontext
Wissenstand bis September 2024

 

GPT-4.1  

OpenAI | USA

Preis  ·  €€€€

Sprache & Wissen

3,5

Logisches Denken

1,9

Agentenfähigkeit

2,6

Programmieren

2,2

Geschwindigkeit  

8,7

Geschwindigkeit
Reasoning

N/A

Funktionen

         

1m Token Kontext
Wissenstand bis Juni 2024


GPT-4.1 mini

OpenAI | USA

Preis  ·  €€€

Sprache & Wissen

2,7

Logisches Denken

1,9

Agentenfähigkeit

2,4

Programmieren

1,9

Geschwindigkeit  

8,6

Geschwindigkeit
Reasoning

N/A

Funktionen

         

1m Token Kontext
Wissenstand bis Juni 2024

GPT-4.1 nano

OpenAI | USA

Preis  ·  €

Sprache & Wissen

2,0

Logisches Denken

1,5

Agentenfähigkeit

0,6

Programmieren

1,1

Geschwindigkeit  

9,1

Geschwindigkeit
Reasoning

N/A

Funktionen

         

1m Token Kontext

Wissenstand bis Juni 2024

GPT-4o

OpenAI | USA

Preis  ·  €€€€

Sprache & Wissen

3,5

Logisches Denken

1,4

Agentenfähigkeit

1,0

Programmieren

1,6

Geschwindigkeit

8,5

Geschwindigkeit
Reasoning

N/A

Funktionen

         

128k Token Kontext
Wissenstand bis Juni 2024

GPT-4o mini 

OpenAI | USA

Preis  ·  €€€

Sprache & Wissen

3,1

Logisches Denken

1,7

Agentenfähigkeit

N/A

Programmieren

2,3

Geschwindigkeit

8,4

Geschwindigkeit Reasoning

N/A

Funktionen

         

128k Token Kontext  
Wissenstand bis Juni 2024

GPT-5   

OpenAI | USA

Preis  ·  €€€

Sprache & Wissen

5,2

Logisches Denken

3,6

Agentenfähigkeit

5,5

Programmieren

3,6

Geschwindigkeit  

7,0

Geschwindigkeit Reasoning

N/A

Funktionen

           

400k Token Kontext  
Wissenstand bis September 2024

GPT-5 (EU)   

Azure Cloud I Schweden

Preis  ·  €€€

Sprache & Wissen

5,2

Logisches Denken

3,6

Agentenfähigkeit

5,5

Programmieren

3,6

Geschwindigkeit  

7,0

Geschwindigkeit Reasoning

N/A

Funktionen

           

400k Token Kontext  

Wissenstand bis September 2024

GPT-5 mini

OpenAI | USA

Preis  ·  €€

Sprache & Wissen

5,3

Logisches Denken

3,1

Agentenfähigkeit

4,6

Programmieren

3,5

Geschwindigkeit  

8,3

Geschwindigkeit
Reasoning

1,9

Funktionen

           

400k Token Kontext
Wissenstand bis Mai 2024

GPT-5 mini (EU)

Azure Cloud I Schweden

Preis  ·  €

Sprache & Wissen

5,3

Logisches Denken

3,1

BerechAgentenfähigkeitnungen

4,6

Programmieren

3,5

Geschwindigkeit  

8,3

Geschwindigkeit
Reasoning

1,9

Funktionen

           

400k Token Kontext

Wissenstand bis Mai 2024

GPT-5 nano

OpenAI | USA

Preis  ·  €

Sprache & Wissen

4,2

Logisches Denken

2,1

Agentenfähigkeit

2,2

Programmieren

2,0

Geschwindigkeit

8,3

Geschwindigkeit
Reasoning

1,7

Funktionen

           

400k Token Kontext
Wissenstand bis Mai 2024

GPT-5.1  

OpenAI | USA

Preis  ·  €€€

Sprache & Wissen

5,8

Logisches Denken

3,6

Agentenfähigkeit

5,1

Programmieren

4,5

Geschwindigkeit  

8,0

Geschwindigkeit
Reasoning

1,9

Funktionen

           

400k Token Kontext
Wissenstand bis September2024

GPT-5.1(EU)  

Azure Cloud I Schweden

Preis  ·  €€€

Sprache & Wissen

5,8

Logisches Denken

3,6

Agentenfähigkeit

5,1

Programmieren

4,5

Geschwindigkeit  

8,0

Geschwindigkeit Reasoning

1,9

Funktionen

           

400k Token Kontext
Wissenstand bis September 2024

GPT-5.2  

OpenAI | USA

Preis  ·  €€€€

Sprache & Wissen

5,3

Logisches Denken

4,3

Agentenfähigkeit

6,0

Programmieren

4,9

Geschwindigkeit  

8,4

Geschwindigkeit
Reasoning

2,0

Funktionen

           

400k Token Kontext
Wissenstand bis August 2025

GPT-5.2 Pro   

OpenAI | USA

Preis  ·  €€€€€

Sprache & Wissen

5,3

Logisches Denken

4,3

Agentenfähigkeit

6,0

Programmieren

4,9

Geschwindigkeit  

8,4

Geschwindigkeit
Reasoning


2,0

Funktionen

           

400k Token Kontext  
Wissenstand bis August 2025

GPT-5.4  

OpenAI | USA

Preis  ·  €€€€

Sprache & Wissen

5,4

Logisches Denken

4,9

Agentenfähigkeit

6,9

Programmieren

5,8

Geschwindigkeit  

N/A

Geschwindigkeit
Reasoning

0,2

Funktionen

           

1m Token Kontext
Wissenstand bis August 2025

GPT-5.4 Pro   

OpenAI | USA

Preis  ·  €€€€€

Sprache & Wissen

5,4

Logisches Denken

4,9

Agentenfähigkeit

6,9

Programmieren

4,9

Geschwindigkeit  

N/A

Geschwindigkeit
Reasoning

0,2

Funktionen

           

1m Token Kontext
Wissenstand bis August 2025

Grok 3   

xAI | USA

Preis  ·  €€€€

Sprache & Wissen

3,6

Logisches Denken

2,0

Agentenfähigkeit

2,3

Programmieren


2,0

Geschwindigkeit

8,0

Geschwindigkeit
Reasoning

N/A

Funktionen

         

1m Token Kontext

Wissenstand bis Februar 2025

Grok 3 mini   

xAI | USA

Preis  ·  €€€

Sprache & Wissen

4,6

Logisches Denken

2,6

Agentenfähigkeit

3,0

Programmieren

2,5

Geschwindigkeit

N/A

Geschwindigkeit
Reasoning

3,5

Funktionen

                   

1m Token Kontext
Wissenstand bis Februar 2025

Grok 4   

xAI | USA

Preis  ·  €€€€

Sprache & Wissen

5,1

Logisches Denken

3,4

Agentenfähigkeit

4,2

Programmieren

4,1

Geschwindigkeit

N/A

Geschwindigkeit Reasoning

4,4

Funktionen

                   

256k Token Kontext  
Wissenstand bis August 2023

Grok 4 Fast  

xAI | USA

Preis  ·  €€€

Sprache & Wissen

4,3

Logisches Denken

3,1

Agentenfähigkeit

3,9

Programmieren

2,7

Geschwindigkeit

8,1

Geschwindigkeit
Reasoning

4,3

Funktionen

                   

2m Token Kontext
Wissenstand bis November 2024


Grok 4.1 Fast

xAI | USA

Preis  ·  €€

Sprache & Wissen

4,3

Logisches Denken

3,1

Agentenfähigkeit

4,9

Programmieren

3,1

Geschwindigkeit

7,9

Geschwindigkeit
Reasoning

4,0

Funktionen

                   

2m Token Kontext
Wissenstand bis November 2024


Hermes 4 405B

NousResearch | USA

Preis  ·  €€

Sprache & Wissen

2,2

Logisches Denken

2,3

Agentenfähigkeit

1,1

Programmieren

1,6

Geschwindigkeit

8,1

Geschwindigkeit
Reasoning

N/A

Funktionen

            

128k Token Kontext 

Wissenstand bis Dezember 2023

Hermes 4 70B

NousResearch | USA

Preis  ·  €

Sprache & Wissen

1,7

Logisches Denken

2,1

Agentenfähigkeit

1,0

Programmieren

1,5

Geschwindigkeit

8,3

Geschwindigkeit
Reasoning

N/A

Funktionen

              

128k Token Kontext 
Wissenstand bis Dezember 2023

Kimi K2   

Moonshot | China

Preis  ·  €€

Sprache & Wissen

4,7

Logisches Denken

3,3

Agentenfähigkeit

4,8

Programmieren

3,5

Geschwindigkeit

8,4

Geschwindigkeit
Reasoning

N/A

Funktionen

           

128k Token Kontext 
Wissenstand bis Januar 2025

Kimi K2.5   

Moonshot | China

Preis  ·  €€

Sprache & Wissen

5,1

Logisches Denken

3,7

Agentenfähigkeit

5,8

Programmieren

4,0

Geschwindigkeit

7,1

Geschwindigkeit
Reasoning

N/A

Funktionen

           

256k Token Kontext
Wissenstand bis November 2025

Kimi K2.5(EU)   

Moonshot | China

Preis  ·  €€

Sprache & Wissen

5,1

Logisches Denken

3,7

Agentenfähigkeit

5,8

Programmieren

4,0

Geschwindigkeit

7,1

Geschwindigkeit Reasoning

N/A

Funktionen

           

256k Token Kontext
Wissenstand bis November 2025
 

Llama 4 Maverick  

Meta | USA

Preis  ·  €

Sprache & Wissen

3,1

Logisches Denken

1,9

Agentenfähigkeit

0,6

Programmieren

1,6

Geschwindigkeit

8,6

Geschwindigkeit
Reasoning

N/A

Funktionen

         

1m Token Kontext
Wissenstand bis August 2024

Llama 4 Scout

Meta | USA

Preis  ·  €

Sprache & Wissen

1,9

Logisches Denken

1,7

Agentenfähigkeit

0,5

Programmieren

0,8

Geschwindigkeit

8,7

Geschwindigkeit
Reasoning

N/A

Funktionen

         

10m Token Kontext
Wissenstand bis August 2024

Magistral Medium 

Mistral AI | Frankreich

Preis  ·  €€€

Sprache & Wissen

3,9

Logisches Denken

2,3

Agentenfähigkeit

0,7

Programmieren

2,2

Geschwindigkeit

N/A

Geschwindigkeit
Reasoning

N/A

Funktionen

         

40k Token Kontext

Wissenstand bis Januar 2021

Magistral Small

Mistral AI | Frankreich

Preis  ·  €

Sprache & Wissen

2,1

Logisches Denken

2,0

Agentenfähigkeit

0,7

Programmieren

2,2

Geschwindigkeit

N/A

Geschwindigkeit
Reasoning

N/A

Funktionen

         

40k Token Kontext
Wissenstand bis Januar 2021

Mistral Large 3

Mistral AI | Frankreich

Preis  ·  €

Sprache & Wissen

2,8

Logisches Denken

1,9

Agentenfähigkeit

2,2

Programmieren

2,3

Geschwindigkeit

8,4

Geschwindigkeit
Reasoning

N/A

Funktionen

         

Wissenstand bis März 2025

Mistral Medium 3

Mistral AI | Frankreich

Preis  ·  €

Sprache & Wissen

3,1

Logisches Denken

1,7

Agentenfähigkeit

1,3

Programmieren

1,4

Geschwindigkeit

8,7

Geschwindigkeit
Reasoning

N/A

Funktionen

         

128k Token Kontext

Wissenstand bis Januar 2021

Mistral Small 3

Mistral AI | Frankreich

Preis  ·  €

Sprache & Wissen

2,2

Logisches Denken

1.4

Agentenfähigkeit

0,8

Programmieren

1,4

Geschwindigkeit

9,1

Geschwindigkeit
Reasoning

N/A

Funktionen

         

32k Token Kontext
Wissenstand bis Oktober 2023

o3  

OpenAI | USA

Preis  ·  €€€

Sprache & Wissen

4,8

Logisches Denken

3,1

Agentenfähigkeit

3,5

Programmieren

3,8

Geschwindigkeit

N/A

Geschwindigkeit
Reasoning

2,8

Funktionen

               

200k Token Kontext
Wissenstand bis Juni 2024

o3 Pro

OpenAI | USA

Preis  ·  €€€€€

Sprache & Wissen

N/A

Logisches Denken

N/A

Agentenfähigkeit

N/A

Programmieren

N/A

Geschwindigkeit

N/A

Geschwindigkeit
Reasoning

N/A

Funktionen

               

200k Token Kontext
Wissenstand bis Juni 2024

o4 mini  

OpenAI | USA

Preis  ·  €€

Sprache & Wissen

4,2

Logisches Denken

2,9

Agentenfähigkeit

3,6

Programmieren

2,6

Geschwindigkeit

N/A

Geschwindigkeit
Reasoning

1,3

Funktionen

               

200k Token Kontext

Wissenstand bis Juni 2024

Sonar Pro  

Perplexity AI | USA

Preis  ·  €€€€

Sprache & Wissen

N/A

Logisches Denken

1,5

Agentenfähigkeit

N/A

Programmieren

N/A

Geschwindigkeit

7,1

Geschwindigkeit
Reasoning

N/A

Funktionen

        

200k Token Kontext
Wissenstand aktuell

Qwen 2.5 14B 1M

Alibaba | China

Preis  ·  €

Sprache & Wissen

2,7

Logisches Denken

1,7

Agentenfähigkeit

1,2

Programmieren

1,3

Geschwindigkeit

N/A

Geschwindigkeit
Reasoning

N/A

Funktionen

         

1m Token Kontext
Wissenstand bis Oktober 2023
 

Qwen 3 30B A3B   

Alibaba | China

Preis  ·  €

Sprache & Wissen

2,6

Logisches Denken

1,9

Agentenfähigkeit

1,0

Programmieren

1,1

Geschwindigkeit

7,6

Geschwindigkeit
Reasoning

3,5

Funktionen

           

33k Token Kontext
Wissenstand bis Dezember 2024

QwQ 3 Next 80B (EU)   

Telekom | Deutschland

Preis  ·  €€€

Sprache & Wissen

2,9

Logisches Denken

2,2

Agentenfähigkeit

1,3

Programmieren

1,6

Geschwindigkeit

7,5

Geschwindigkeit
Reasoning

3,4

Funktionen

             

262k Token Kontext
Wissenstand bis Januar 2024