NVIDIA представи нова линия локални модели на изкуствен интелект OpenReasoning-Nemotron, които могат да решават проблеми на ниво OpenAI.
Серията включва четири модела с 1,5, 7, 14 и 32 милиарда параметри. Всички те са базирани на големия модел DeepSeek с 671 милиарда параметри, но в много по-компактна форма, която им позволява да работят на обикновени геймърски графични карти.
За обучението NVIDIA използва 5 милиона математически, научни и програмни предизвикателства, създадени с помощта на платформата NeMo Skills.
Моделите са обучени изключително с помощта на контролирано обучение – без използване на RLHF – което ги прави удобна основа за по-нататъшни изследвания.
TechPowerUp TechPowerUp
Според бенчмарковете най-големият 32B модел постига 89,2 точки на олимпиадата AIME24 и 73,8 точки на HMMT, докато по-малкият 1,5B модел получава съответно 55,5 и 31,5 точки. В режим GenSelect, при който се генерират паралелно няколко отговора и се избира най-добрият, представянето на модела 32B е сравнимо или дори по-добро от модела o3-high на OpenAI.
И четирите модела на NVIDIA вече са достъпни в Hugging Face за изтегляне и локално използване.