Вы когда-нибудь задумывались, почему в официальных тестах каждая вторая нейросеть — «убийца GPT-4», а на деле она не может связать двух слов в коде? Ответ прост: современные бенчмарки превратились в маркетинговую шелуху, под которую разработчики просто подгоняют ответы своих моделей.
Если вы устали от дутых цифр и хотите знать, какие модели