В чем именно обвиняют модель Solar-100B?

Solar-100B обвиняют в плагиате китайской модели GLM-Air-4.5. Обвинения включают копирование архитектуры, совпадения в весах модели и возможное использование тех же тренировочных данных без должного указания.

Как проводились тесты на оригинальность Solar-100B?

Независимые исследователи провели сравнение архитектуры, анализ весов модели и тесты на производительность на стандартных бенчмарках. Результаты показали минимальные различия между Solar-100B и GLM-Air-4.5.

Как отреагировала компания Upstage на обвинения?

Upstage отрицает обвинения в плагиате, утверждая о самостоятельной разработке. Компания предложила провести публичную валидацию модели и пригрозила юридическими действиями против распространителей обвинений.

Solar-100B плагиат: обвинения Upstage и тесты оригинальности

Введение: скандал, который потряс AI-сообщество

В мире искусственного интеллекта разразился новый скандал, связанный с южнокорейской компанией Upstage и её флагманской моделью Solar-100B. Модель, позиционировавшаяся как прорыв в области "суверенного ИИ", была обвинена в плагиате китайской модели GLM-Air-4.5. Это обвинение ставит под вопрос не только оригинальность Solar-100B, но и прозрачность разработки больших языковых моделей. Подробнее о том, как разворачивалось расследование, можно прочитать в нашей предыдущей статье.

Что такое Solar-100B и почему это важно

Solar-100B — это 102-миллиардная языковая модель, разработанная компанией Upstage. Она была представлена как первая полностью корейская модель такого масштаба, способная конкурировать с международными аналогами. Проект получил значительную государственную поддержку в рамках стратегии Южной Кореи по созданию технологического суверенитета в области ИИ.

💡

Solar-100B была выпущена с открытой лицензией, что сделало её доступной для исследователей и разработчиков. Подробнее о модели можно прочитать в нашей статье Solar-Open-100B: 102-миллиардная модель с коммерческой лицензией от Upstage.

Обвинения в плагиате: Solar-100B vs GLM-Air-4.5

Исследователи обнаружили, что Solar-100B имеет поразительное сходство с китайской моделью GLM-Air-4.5, разработанной компанией Zhipu AI. Обвинения включают в себя копирование архитектуры, весов и даже тренировочных данных.

Архитектурные сходства: одинаковое количество параметров, слоев и механизмов внимания.
Совпадения в весах: технический анализ показал, что многие веса моделей идентичны или имеют минимальные различия.
Данные обучения: возникли подозрения на использование тех же проприетарных датасетов без должного указания источников.

Тесты оригинальности: как проверяли модель

Для проверки оригинальности Solar-100B были проведены независимые тесты, включая сравнение производительности, анализ выходных данных и проверку на плагиат кода. Вот ключевые этапы этой проверки:

1Сравнение архитектуры

Исследователи сравнили архитектуру Solar-100B и GLM-Air-4.5, обнаружив минимальные различия в структуре слоев, механизмах внимания и эмбеддингах. Это стало первым красным флагом.

2Анализ весов модели

С помощью инструментов для сравнения весов (например, анализа расстояний между векторами) были выявлены значительные совпадения. В некоторых случаях различия были на уровне статистической погрешности.

3Тесты на производительность

Модели показали практически одинаковые результаты на стандартных бенчмарках (MMLU, HellaSwag, GSM8K), что крайне маловероятно для независимо разработанных систем. Этот феномен часто указывает на прямое копирование или дообучение без существенных изменений.

Важно отметить, что подобные тесты оригинальности становятся новым стандартом для проверки open-source моделей, особенно после серии скандалов, подобных истории с Apriel v1.6.

Контрстрайк Upstage: отрицание и публичная валидация

В ответ на обвинения, Upstage опубликовала заявление, отрицающее плагиат и предлагающее провести публичную валидацию модели. Компания утверждает, что Solar-100B была разработана самостоятельно, а сходства объясняются использованием общих открытых датасетов и лучших практик в области обучения больших моделей.

Upstage пригрозила юридическими действиями против распространителей обвинений, но также предложила открыть доступ к модели для независимой проверки, что само по себе является редким шагом в индустрии.

Последствия для сообщества AI: прозрачность и доверие

Этот скандал поднимает важные вопросы о прозрачности в разработке AI-моделей, особенно когда речь идет о государственном финансировании и национальных проектах. Доверие к компаниям, заявляющим о "суверенном ИИ", может быть подорвано, если не будут внедрены строгие механизмы проверки оригинальности. Этот случай перекликается с более широкой дискуссией о том, является ли "суверенный ИИ" мифом.

Кроме того, скандал может повлиять на восприятие других открытых моделей. Сообщество теперь будет более пристально scrutinize заявления таких проектов, как MiniMax-M2.1 или будущих претендентов на звание SOTA.

Заключение: уроки скандала и будущее Solar-100B

Скандал с Solar-100B показывает, что сообщество AI становится все более бдительным к плагиату и требует большей прозрачности. Будущее модели зависит от результатов независимой публичной валидации и дальнейших действий Upstage. Этот случай может привести к ужесточению стандартов для open-source моделей и к более строгой проверке заявлений о "национальных достижениях" в области ИИ. В конечном счете, честность и открытость остаются краеугольными камнями для доверия в быстро развивающейся отрасли искусственного интеллекта.

Скандал с Solar-100B: разбор обвинений в плагиате и тесты оригинальности модели