Cryptocurrency news

Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель

Forklog / 27.12.2024 / 14:09
Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель

Китайский ИИ-стартап DeepSeek представил собственную большую языковую модель, которая превзошла по тестам конкурентов от Meta и OpenAI.

🚀 Introducing DeepSeek-V3!

Biggest leap forward yet:
⚡ 60 tokens/second (3x faster than V2!)
💪 Enhanced capabilities
🛠 API compatibility intact
🌍 Fully open-source models & papers

🐋 1/n pic.twitter.com/p1dV9gJ2Sd

— DeepSeek (@deepseek_ai) December 26, 2024

DeepSeek V3 имеет 671 млрд параметров. Для сравнения, у Llama 3.1 405B показатель 405 млрд. Число отражает способность ИИ адаптироваться к более сложным вариантам применения и давать ответы точнее.  

Сравнение DeepSeek V3 с конкурентами. Данные: DeepSeek.

Компания из Ханчжоу обучила нейросеть за два месяца и $5,58 млн, используя значительно меньше вычислительных ресурсов (2048 графических процессоров) по сравнению с более крупными технологическими компаниями. Она обещает предоставление лучшего соотношения цена/качество на рынке.

💰 API Pricing Update

🎉 Until Feb 8: same as V2!
🤯 From Feb 8 onwards:
Input: $0.27/million tokens ($0.07/million tokens with cache hits)
Output: $1.10/million tokens

🔥 Still the best value in the market!

🐋 3/n pic.twitter.com/OjZaB81Yrh

— DeepSeek (@deepseek_ai) December 26, 2024

В будущем запланировано добавление мультимодальности и «других передовых функций».

Член команды OpenAI Андрей Карпати отметил, что DeepSeek продемонстрировала весьма впечатляющие исследования и разработки в условиях ограниченных ресурсов.

DeepSeek (Chinese AI co) making it look easy today with an open weights release of a frontier-grade LLM trained on a joke of a budget (2048 GPUs for 2 months, $6M).

For reference, this level of capability is supposed to require clusters of closer to 16K GPUs, the ones being… https://t.co/EW7q2pQ94B

— Andrej Karpathy (@karpathy) December 26, 2024

«Означает ли это, что вам не нужны большие кластеры GPU для пограничных LLM? Нет, но вы должны быть уверены, что не растрачиваете то, что у вас есть. Это выглядит как хорошая демонстрация того, что еще многое предстоит сделать как с данными, так и с алгоритмами», — добавил он.

Ранее DeepSeek представила «конкурента o1 от OpenAI» — думающую «сверхмощную» ИИ-модель DeepSeek-R1-Lite-Preview.

Напомним, в июле китайская компания Kuaishou открыла ИИ-модель для генерации видео Kling для всех желающих.

Source
Recently News

© Token Radar 2024. All Rights Reserved.
IMPORTANT DISCLAIMER: All content provided herein our website, hyperlinked sites, associated applications, forums, blogs, social media accounts and other platforms (“Site”) is for your general information only, procured from third party sources. We make no warranties of any kind in relation to our content, including but not limited to accuracy and updatedness. No part of the content that we provide constitutes financial advice, legal advice or any other form of advice meant for your specific reliance for any purpose. Any use or reliance on our content is solely at your own risk and discretion. You should conduct your own research, review, analyse and verify our content before relying on them. Trading is a highly risky activity that can lead to major losses, please therefore consult your financial advisor before making any decision. No content on our Site is meant to be a solicitation or offer.