← Все новости

DeepSeek предложила новый метод обучения ИИ для экономии ресурсов

DeepSeek представила стратегию по пересмотру основ обучения базовых моделей ИИ. Глава компании Лян Вэньфэн предложил архитектурные изменения для снижения вычислительных затрат.

DeepSeek предложила новый метод обучения ИИ для экономии ресурсов

Китайский технологический сектор завершил 2024 год громким анонсом в области фундаментальных исследований искусственного интеллекта. Команда DeepSeek опубликовала научный труд, в котором ставится под сомнение эффективность текущих стандартов построения нейросетевых систем. В подготовке документа принимал личное участие основатель организации Лян Вэньфэн, что подчеркивает стратегическую значимость предложенных идей для индустрии.

Технологический барьер и поиск альтернатив

На сегодняшний день большинство крупных языковых моделей (LLM) базируются на архитектуре Transformer. Несмотря на успех, этот подход требует колоссальных вычислительных мощностей, что делает процесс создания ИИ доступным лишь для узкого круга корпораций с неограниченными бюджетами. Предложенная концепция предполагает глубокую трансформацию внутренних механизмов обработки данных, позволяя снизить нагрузку на аппаратную часть без потери качества итогового результата. Инженеры из Поднебесной сфокусировались на оптимизации алгоритмов, которые лежат в основе обучения базовых систем, стремясь сделать технологию более демократичной.

Контекст: почему это важно

Ранее этот разработчик уже всколыхнул рынок, представив решения серий V3 и R1. Тесты показали, что их продукты способны конкурировать с лидерами отрасли от OpenAI и Google, при этом затраты на их тренировку оказались в разы ниже рыночных показателей. Новый манифест компании фактически закрепляет за ней статус инноватора, который делает ставку не на «грубую силу» видеокарт NVIDIA, а на изящество математических моделей. В условиях дефицита полупроводников и торговых ограничений такой путь становится единственно верным для сохранения конкурентоспособности.

Что это значит для индустрии

Пересмотр основ проектирования нейросетей может привести к смене парадигмы во всем мире. Если индустрия примет предложенные изменения, порог входа для стартапов значительно снизится. Это откроет путь к созданию специализированных локальных систем, работающих на менее мощном оборудовании. Аналитики полагают, что инициатива Ляна Вэньфэна станет катализатором для появления нового поколения энергоэффективных алгоритмов, способных функционировать в условиях ограниченных ресурсов, что критически важно для мобильных устройств и периферийных вычислений.

Источник: 3DNews