DeepSeek
DeepSeek | |
---|---|
кит. упр. 杭州深度求索人工智能基础技术研究有限公司 англ. Hangzhou DeepSeek Artificial Intelligence Co., Ltd. | |
![]() | |
Тип | стартап и технологическая компания |
Основание | май 2023 |
Расположение | Ханчжоу, Чжэцзян, Китай |
Ключевые фигуры | Лян Вэньфэн[англ.] |
Отрасль | информационные технологии |
Материнская компания | High-Flyer[вд] |
Сайт | deepseek.com (англ.) (кит.) |
![]() |
DeepSeek (
Выход модели DeepSeek-R1 в январе 2025 года вызвал кратковременное, но резкое снижение курсов акций мировых технологических компаний и дискуссии о переоценке инвестиций в ИИ.
История
В 2015 году три инженера из Чжэцзянского университета основали компанию High-Flyer. Она использовала машинное обучение для торговли акциями[1]. В 2019 году создана компания High-Flyer AI, которая занималась исследованиями алгоритмов искусственного интеллекта[2]. К 2021 году все стратегии High-Flyer использовали ИИ, её сравнивали с Renaissance Technologies[3].
В апреле 2023 года High-Flyer объявила о новом проекте для исследования
Выпуск DeepSeek-V2 в мае 2024 года спровоцировал ценовую войну моделей искусственного интеллекта в Китае, так как предлагалась высокая производительность по низкой цене. Её окрестили «Pinduoduo ИИ», а другим крупным технологическим гигантам, таким как ByteDance, Tencent, Baidu и Alibaba, пришлось начать снижать цены на свои модели ИИ. Несмотря на низкую цену DeepSeek, компания отчиталась о прибыли по сравнению с конкурентами, которые, по-видимому, несли убытки[6].
На конец 2024 года DeepSeek занимается исследованиями и не заявляет подробных планов коммерциализации[6].
Китайская газета South China Morning Post пишет, что при найме новых сотрудников компания DeepSeek отдавала предпочтение способностям, а не опыту, поэтому большинство разработчиков — это либо недавние выпускники, либо находящиеся на ранней стадии своей карьеры в сфере ИИ[5].
К 2025 году DeepSeek смогла создать ИИ с возможностями как у ведущих технологических компаний США, но, как заявлено, на менее мощных чипах и за малую часть стоимости. Сотрудники DeepSeek пишут, что обучали модель V3Nvidia H800, а они значительно менее мощны, чем новые Nvidia Blackwell[англ.][7][8]. Независимые наблюдатели отмечают, что DeepSeek и другие китайские компании имеют преимущество, так как на китайском рынке доступ к ChatGPT и ряду других моделей заблокирован Великим китайским файерволом. DeepSeek, вероятно, цензурирует выдачу. При этом не все деликатные для Китая темы этому подвержены[9][10].
на чипах
Реакция рынков 27 января 2025
Запуск новой модели R1, предположительно разработанной многократно дешевле стоимости конкурентов, спровоцировал резкое снижение курсов
По словам Вей-Серна Линга (Union Bancaire Privée), «DeepSeek показывает, что можно разрабатывать мощные модели ИИ, которые стоят дешевле»[12]. Акции корпорации Nvidia упали за день на 17 %, что привело к потере около 600 млрд $ капитализации. Такое падение стало крупнейшим за историю американского фондового рынка[14][15]. Многие эксперты прогнозируют сокращение закупок чипов Nvidia и рост недоверия инвесторов к ведущим технологическим компаниям, в то время как некоторые надеются на то, что вырастет доступность ИИ и расширится их использование, что поддержит спрос на чипы[16][17]. 500 самых богатых людей мира потеряли в общей сложности 108 млрд $ из-за распродаж в технологическом секторе[18].
Общая капитализация криптовалют, связанных с ИИ, сократилась на 22 % за сутки[19].
При этом по состоянию на 27 января мобильное приложение «DeepSeek — AI Assistant» занимало первое место в App Store в США, ОАЭ, Южной Корее, Японии, Великобритании и Китае, потеснив ChatGPT[12][20]. DeepSeek стал самым популярным ИИ в России в январе 2025 года.[21]
Президент США Дональд Трамп назвал DeepSeek «тревожным звонком» для американских технокомпаний[22].
Дальнейшие последствия
Потрясения на мировых рынках из-за DeepSeek продлились короткое время[23]. При этом аналитики Huaxi Securities сочли произошедшее переломным моментом, когда у китайских инвесторов вырос интерес к местным компаниям, работающим с ИИ[24]. 12 февраля 2025 года Financial Times сообщила, что на фоне успеха DeepSeek в Гонконге индекс китайских технологических акций вырос более чем на 20 % за месяц[25].
Таоша Ван (Fidelity International[англ.]) в феврале 2025 года пишет, что стоимость разработки ведущих моделей ИИ уже упала примерно на 80 % за последние два года, а DeepSeek, возможно, ускорит эту тенденцию. По её мнению, «DeepSeek является напоминанием, как быстро всё может измениться и, скорее всего, изменится в эпоху ИИ»[23].
Релизы
2 ноября 2023 года DeepSeek представила свою первую модель DeepSeek Coder, которая была бесплатной, в том числе для коммерческого использования
29 ноября 2023 года DeepSeek запустила DeepSeek LLM (большую языковую модель) с 67 млрд параметров. Она была разработана, чтобы конкурировать с другими LLM того времени, и по производительности приближалась к GPT-4. У неё возникли проблемы с вычислительной эффективностью и масштабируемостью[26]. Также была выпущена чат-версия модели под названием DeepSeek Chat[29].
V2 и V3
В мае 2024 года вышла DeepSeek-V2. Financial Times сообщила, что она была дешевле аналогов, стоила 2 юаня за каждый миллион выпущенных токенов. В рейтинге LLM лаборатории Tiger Lab университета Ватерлоо DeepSeek-V2 заняла седьмое место[3].
В декабре 2024 года запущена DeepSeek-V3. Тесты производительности показали, что версия превзошла Llama 3.1 и Qwen 2.5, а также соответствовала GPT-4o и Claude 3.5 Sonnet[5][30][31][32]. На январь 2025 года независимые проверки продолжаются[9]. Случай с DeepSeek показал, что санкции США в отношении развития искусственного интеллекта в Китае, вероятно, не очень эффективны[5][33]. Американский аналитик Рэй Ванг предположил, что из-за отсутствия у Китая свободного доступа к передовым чипам ИИ китайские учёные внедряют инновации при ограниченных ресурсах[9]. По данным производителя, общая стоимость обучения модели — около 5,58 млн долларов США, а само обучение заняло около двух месяцев[5].
DeepSeek-V3 имеет 685 миллиардов параметров и мультиэкспертную архитектуру[англ.] (MoE) с 256 экспертами, из которых 8 активируются для каждого токена. Каждый токен активирует 37 миллиардов параметров[34].
Этап | Затраты (тыс. GPU-часов) | Стоимость (млн $) |
---|---|---|
предварительная подготовка | 2664 | 5,328 |
расширение контекста | 119 | 0,24 |
тонкая настройка | 5 | 0,01 |
общий | 2788 | 5,576 |
R1
В ноябре 2024 года появилась DeepSeek-R1-Lite-Preview для решения задач, требующих логического вывода, математических рассуждений и решения проблем в реальном времени. DeepSeek утверждала, что производительность превзошла OpenAI o1 в таких тестах, как AIME[англ.] и MATH[35]. Однако The Wall Street Journal отметила, что при использовании 15 задач из тестов AIME 2024 года OpenAI o1 нашёл решения быстрее, чем DeepSeek R1-Lite-Preview[36].
В январе 2025 года вышли DeepSeek-R1 и DeepSeek-R1-Zero, основанные на V3. Эти модели более продвинутые, чем ранние. Они генерируют ответы шаг за шагом, аналогично рассуждению человека. По первым тестам, при выполнении определённых задач по математике, химии и программированию производительность R1 находится на одном уровне с o1[27][37][38].
В мае 2025 года была выпущена улучшенная версия DeepSeek-R1, количество параметров которой выросло с 671 млрд до 685 млрд[39]. Также вышла более легкая версия нейросети - DeepSeek-R1-0528-Qwen3-8B, созданная методом дистилляции с использованием языковой модели Qwen3-8B в качестве основы[40].
Критика и цензура


Наблюдается, что официальная API-версия модели R1 использует механизмы цензуры для чувствительных тем, особенно тех, которые считаются политически значимыми в Китае. Например, модель отказывается отвечать на вопросы о событиях на площади Тяньаньмэнь в 1989 году. Иногда ИИ изначально генерирует ответ, но вскоре удаляет его и заменяет сообщением: «Sorry, that’s beyond my current scope. Let’s talk about something else.» (рус. «Извините, это выходит за рамки моих возможностей. Давайте поговорим о чём-нибудь другом.»)[41][42]
Интегрированные механизмы цензуры и ограничения можно частично обойти только в открытой версии модели R1. Как только затрагиваются «основные социалистические ценности», определённые китайскими интернет-регуляторами, или поднимаются вопросы, связанные с Тайванем, дискуссии прекращаются[43].
Журналист Энтони Кимери пишет, что система искусственного интеллекта потенциально может быть использована для влияния за границей: дезинформации, наблюдения и разработки кибероружия для китайских спецслужб. Или что приложение может передавать персональные данные пользователей в Китай[44].
Газета The Indian Express отмечает, что распространены опасения по поводу времени запуска DeepSeek-R1 как сигнала Китая об уровне развития его ИИ. R1 появилась именно в тот момент, когда Дональд Трамп стал президентом США[7].
Аналитики брокерской компании Bernstein предполагают, что общие затраты на обучение V3 намного выше, чем заявленные 5,58 млн $, и не считают модели DeepSeek чудом. Также они обращают внимание на то, что DeepSeek не раскрыла затраты на обучение R1. Генеральный директор компании Scale AI[англ.] Александр Ван сказал в интервью, что якобы у DeepSeek есть 50 000 чипов Nvidia H100, но не привёл доказательств[45][46]. OpenAI и Дэвид Сакс, спецпредставитель президента США по искусственному интеллекту, заподозрили, что DeepSeek использовала модели конкурента для обучения[47][48].
См. также
- The Stargate Project
- OpenAI
- Холодная война за искусственный интеллект
Примечания
- ↑ Billions Going to China's Quants Takes Fight to Global Funds. Bloomberg (англ.). 2020-05-31. Архивировано 25 мая 2022. Дата обращения: 2024-12-28.
- ↑ 1 2 Ottinger, Lily. Deepseek: From Hedge Fund to Frontier Model Maker (англ.). ChinaTalk (9 декабря 2024). Дата обращения: 28 декабря 2024. Архивировано 28 декабря 2024 года.
- ↑ 1 2 3 McMorrow, Ryan; Olcott, Eleanor (9 июня 2024). The Chinese quant fund-turned-AI pioneer. Financial Times. Архивировано 17 июля 2024. Дата обращения: 28 декабря 2024.
- ↑ Yu, Xu. [Exclusive] Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says (англ.). Yicai Global (17 апреля 2023). Дата обращения: 28 декабря 2024. Архивировано 31 декабря 2023 года.
- ↑ 1 2 3 4 5 6 7 Perezi, Bien; Jiang, Ben. Meet DeepSeek: the Chinese start-up that is changing how AI models are trained (англ.). South China Morning Post (1 января 2025).
- ↑ 1 2 Schneider, Jordan. Deepseek: The Quiet Giant Leading China's AI Race (англ.). ChinaTalk (27 ноября 2024). Дата обращения: 28 декабря 2024.
- ↑ 1 2 Liang Wenfeng: The force behind Chinese AI startup DeepSeek that has made US tech giants nervous and put India on edge (англ.). The Indian Express (28 января 2025).
- Reuters(27 января 2025).
- ↑ .
- ↑ DeepSeek: новая языковая модель балансирует между прогрессом и цензурой . SecurityLab.ru (28 декабря 2024).
- ↑ Запуск ИИ-чат-бота DeepSeek привел к панике на биржах в ЕС . Deutsche Welle (28 января 2025). Дата обращения: 29 января 2025.
- ↑ 1 2 3 AI-Fueled Stock Rally Dealt $1 Trillion Blow by Chinese Upstart (англ.). www.bloomberg.com (27 января 2025).
- ↑ China's DeepSeek sets off AI market rout (англ.). Reuters (27 января 2025).
- ↑ Акции Nvidia теряют в цене более 11% из-за китайской DeepSeek . Ведомости (27 января 2025). Дата обращения: 27 января 2025.
- ↑ Китай наносит сокрушительный удар в самое сердце корпоративной Америки . ProFinance.Ru (27 января 2025). Дата обращения: 27 января 2025.
- ↑ «Рынки ошибаются»: DeepSeek не угрожает NVIDIA и другим американским IT-гигантам . ServerNews (28 января 2025).
- ↑ Kahn, Jeremy. Why DeepSeek's R1 may not be the bad news for Nvidia and U.S. export controls that many assume (англ.). Fortune (28 января 2025).
- ↑ World’s Richest People Lose $108 Billion After DeepSeek Selloff . www.bloomberg.com (28 января 2025).
- ↑ ИИ-криптовалюты резко подешевели. При чем здесь китайская нейросеть . РБК Крипто (27 января 2025). Дата обращения: 27 января 2025.
- ↑ Чат-бот DeepSeek обогнал ChatGPT и возглавил рейтинг приложений в ряде стран . Российская газета (27 января 2025).
- ↑ Гришанков, Вячеслав. DeepSeek — самая популярная нейросеть в России в январе 2025 года . AndroidLime.ru (11 февраля 2025). Дата обращения: 3 марта 2025.
- ↑ MarketScreener. Trump: DeepSeek's AI should be a wakeup call to US industry - 2025-01-27 | MarketScreener (амер. англ.). www.marketscreener.com (28 января 2025). Дата обращения: 28 января 2025.
- ↑ 1 2 Taosha Wang. Four ways DeepSeek could change everything (англ.). Reuters (12 февраля 2025).
- ↑ DeepSeek fever fuels patriotic bets on Chinese AI stocks (англ.). Reuters (6 февраля 2025).
- ↑ Технологические акции Китая перешли в фазу бычьего рынка после успеха DeepSeek . Forbes.ru (12 февраля 2025).
- ↑ 1 2 Se, Ksenia. Inside DeepSeek Models (англ.). Turing Post (28 августа 2024). Дата обращения: 28 декабря 2024. Архивировано 18 сентября 2024 года.
- ↑ .
- Github. — 2023-10-23.
- ↑ Sharma, Shubham. Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model (амер. англ.). VentureBeat (1 декабря 2023). Дата обращения: 28 декабря 2024. Архивировано 23 декабря 2024 года.
- ↑ Jiang, Ben. Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products (англ.). South China Morning Post (27 декабря 2024). Дата обращения: 28 декабря 2024. Архивировано 27 декабря 2024 года.
- ↑ Sharma, Shubham. DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch (амер. англ.). VentureBeat (26 декабря 2024). Дата обращения: 28 декабря 2024. Архивировано 27 декабря 2024 года.
- ↑ Wiggers, Kyle. DeepSeek's new AI model appears to be one of the best 'open' challengers yet . TechCrunch (26 декабря 2024).
- ↑ Shilov, Anton. Chinese AI company's AI model breakthrough highlights limits of US sanctions (англ.). Tom's Hardware (27 декабря 2024). Дата обращения: 28 декабря 2024. Архивировано 28 декабря 2024 года.
- ↑ DeepSeek-AI; Liu, Aixin; Feng, Bei; Xue, Bing; Wang, Bingxuan; Wu, Bochao; Lu, Chengda; Zhao, Chenggang; Deng, Chengqi (27 декабря 2024), DeepSeek-V3 Technical Report, arXiv:2412.19437, Дата обращения: 30 декабря 2024
- ↑ Franzen, Carl. DeepSeek's first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance (амер. англ.). VentureBeat (20 ноября 2024). Дата обращения: 28 декабря 2024. Архивировано 22 ноября 2024 года.
- ↑ Huang, Raffaele. Don't Look Now, but China's AI Is Catching Up Fast (амер. англ.). The Wall Street Journal (24 декабря 2024). Дата обращения: 28 декабря 2024. Архивировано 27 декабря 2024 года.
- ↑ Chowdhury, Hasan. KI aus China: Überholt dieses Startup jetzt OpenAI? (нем.). Business Insider (25 января 2025).
- ↑ Sharma, Shubham. Open-source DeepSeek-R1 uses pure reinforcement learning to match OpenAI o1 — at 95% less cost (амер. англ.). VentureBeat (20 января 2025).
- Hi-tech Mail.ru(29 мая 2025). Дата обращения: 29 мая 2025.
- 3dnews.ru(29 мая 2025). Дата обращения: 29 мая 2025.
- ↑ Steinschaden, Jakob. DeepSeek: This is what live censorship looks like in the Chinese AI chatbot (англ.). Trending Topics (27 января 2025). Дата обращения: 27 января 2025.
- ↑ Field, Matthew; Titcomb, James (27 января 2025). Chinese AI has sparked a $1 trillion panic – and it doesn't care about free speech. The Daily Telegraph (англ.). ISSN 0307-1235. Дата обращения: 27 января 2025.
- ↑ The Guardian view on a global AI race: geopolitics, innovation and the rise of chaos. The Guardian (англ.). 26 января 2025. ISSN 0261-3077. Дата обращения: 27 января 2025.
- ↑ China’s DeepSeek AI poses formidable cyber, data privacy threats (амер. англ.). Biometric Update (26 января 2025). Дата обращения: 27 января 2025.
- Reuters(28 января 2025). Дата обращения: 29 января 2025.
- ↑ Singh, Manish. DeepSeek 'punctures' AI leaders' spending plans, and what analysts are saying (амер. англ.). TechCrunch (27 января 2025). Дата обращения: 29 января 2025.
- ↑ DeepSeek заподозрили в использовании разработок OpenAI для обучения ИИ . Интерфакс (29 января 2025).
- ↑ Olcott, Eleanor (29 января 2025). OpenAI says it has evidence China's DeepSeek used its model to train competitor. Financial Times.
Ссылки
- deepseek.com — официальный сайт DeepSeek (англ.) (кит.)
- chat.deepseek.com — чат-бот от DeepSeek
- Nvidia потеряла более $600 млрд капитализации на фоне успеха китайского DeepSeek. Форбс.
- DeepSeek R1: модель с производительностью o1 от OpenAI. Хабра.
- Anthology of DeepSeek papers (англ.)
- Рассуждающие модели первого поколения DeepSeek-R1-Zero и DeepSeek-R1 (англ.)