Що таке DeepSeek: китайський ШІ, що налякав Silicon Valley

Що таке DeepSeek

Один стартап з Ханчжоу за $6 млн зробив те, на що OpenAI витратила понад $100 млн. Ось що це означає для вас.

27 січня 2025 року Nvidia за один торговий день втратила майже $600 мільярдів капіталізації — найбільший одноденний обвал в американській фінансовій історії за даними Bloomberg. Причина? Китайський стартап із трьохсотмільйонного Ханчжоу випустив модель штучного інтелекту, яку навчив за $6 мільйонів. При тому, що GPT-4 від OpenAI коштував понад $100 мільйонів. Ринки вирішили, що вся парадигма «чим більше чіпів — тим краща модель» раптово зламалася. І, чесно кажучи, не зовсім помилилися.

Чесний технічний розбір: що таке DeepSeek, як він побудований, де дійсно корисний, де небезпечний, і що з усим цим робити звичайній людині.

Що таке DeepSeek і хто за ним стоїть

DeepSeek (офіційна назва: Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.) — це китайська компанія зі штучного інтелекту, заснована у липні 2023 року Ляном Веньфеном. Той самий Лян — співзасновник і CEO квантового хедж-фонду High-Flyer, який і фінансує все це підприємство. Штаб-квартира — місто Ханчжоу, провінція Чжецзян.

Тобто це не держкорпорація і не Huawei. Але і казати, що вона повністю незалежна від китайської держави, було б наївно: китайське законодавство зобов’язує компанії надавати уряду доступ до даних за першим запитом. Про це — далі.

Компанія розробляє великі мовні моделі (LLM). Публічно відома своїми моделями DeepSeek-R1 (вийшла у січні 2025-го) та DeepSeek-V3. Обидві розповсюджуються за ліцензією MIT — тобто відкритий вихідний код, який можна використовувати і навіть модифікувати.

Як DeepSeek влаштований технічно (простими словами)

Класичні великі мовні моделі, як-от GPT-4, — це один гігантський «мозок», який активується повністю кожного разу, коли ви щось питаєте. Дорого. Енергоємно. DeepSeek вирішив цю проблему інакше.

Mixture of Experts (MoE) — «команда спеціалістів»

Замість одного великого нейрона — колектив «експертів». Коли модель отримує запит, активуються тільки ті частини мережі, які найкраще підходять до задачі. Решта «сплять». Це знижує обчислювальні витрати на інференс (відповідь моделі) у кілька разів.

Навчання через Reinforcement Learning без людини-ревізора

OpenAI та Anthropic витрачають десятки мільйонів на армії оцінювачів-людей, які виправляють відповіді моделі. DeepSeek автоматизував більшу частину цього процесу — модель сама навчається через зворотний зв’язок. Дорогий RLHF (Reinforcement Learning from Human Feedback) — частково замінено на дешевший automated RL.

Оптимізація під «слабше» залізо

США заборонили Китаю купувати топові чіпи Nvidia (A100/H100). DeepSeek адаптував архітектуру під H800 — менш потужні, але доступні GPU. Вони використали PTX — низькорівневу мову програмування, яка дозволяє «вичавити» максимум з кожного чіпа.

«DeepSeek довів, що передові ШІ-моделі можна будувати з обмеженими ресурсами», — Wei Sun, провідний аналітик ШІ в Counterpoint Research (BBC).

DeepSeek R1 vs ChatGPT: у чому реальна різниця

Що таке DeepSeek

DeepSeek-R1 — це reasoning-модель: вона «думає вголос», показуючи весь ланцюжок міркувань перед відповіддю. На ряді бенчмарків (AIME — американські математичні олімпіади, MATH) R1 порівнянний або перевершує OpenAI o1. Версія DeepSeek-V3.2, що вийшла наприкінці 2025 року, за деякими тестами конкурує навіть з GPT-5 і Gemini 3.0 Pro.

Але є важливе але. DeepSeek цензурується. NPR запитав модель про різанину на площі Тяньаньмень 1989 року — відповідь зникла і замінилась повідомленням «це поза моєю сферою». Питання про статус Тайваню — аналогічно. Це не баг. Це фіча, яка відображає юрисдикцію, де живе компанія.

Висновок Lumira: DeepSeek — чудовий інструмент для кодингу, математики, аналізу даних. Але для питань, пов’язаних із чутливими геополітичними темами, — модель буде замовчувати. Це треба розуміти одразу.

Покрокова інструкція: як почати користуватися DeepSeek

  1. Зайдіть на chat.deepseek.com — це офіційний чат-інтерфейс. Аналог ChatGPT. Потрібна реєстрація через email або телефон.
  2. Оберіть модель: «DeepSeek-V3» для загальних задач і чату, «DeepSeek-R1» — для математики, логіки, складного аналізу та написання коду.
  3. Увімкніть режим «Think» (доступний у R1) — ви побачите, як модель «розмірковує» перед відповіддю. Корисно для перевірки логіки.
  4. Використовуйте API, якщо плануєте інтеграцію у свої сервіси. DeepSeek API коштує від $0.27 за 1 мільйон токенів (вхідних) — приблизно у 10 разів дешевше за аналоги від OpenAI за даними deepseek.ai.
  5. Або розгорніть локально. Моделі доступні на Hugging Face та Ollama (для запуску на власному комп’ютері без відправки даних на сервери). Для дистильованих версій (7B, 14B параметрів) достатньо звичайного ноутбука з 16–32 ГБ RAM.
  6. Не вводьте конфіденційних даних у публічний чат. Докладніше — в розділі про безпеку нижче.

Цифровий аудит: плюси, мінуси, ризики та реальна вартість

Плюси

  • Відкритий код (MIT-ліцензія) — можна розгорнути локально
  • Дуже низька вартість API (~у 10× дешевше за OpenAI)
  • Сильний у кодингу, математиці, аналізі
  • R1 показує ланцюжок міркувань — прозоро
  • Можна запустити без Інтернету на своєму залізі
  • Безкоштовний чат у базовій версії

Мінуси та ризики

  • Дані зберігаються на серверах у Китаї
  • Не відповідає GDPR — жодного представника в ЄС
  • Збирає «патерни натискань клавіш» (keystroke patterns)
  • iOS-додаток передає дані без шифрування (NowSecure, 2025)
  • Цензура чутливих тем (Тяньаньмень, Тайвань тощо)
  • Вразливий до старих jailbreak-атак (SecurityScorecard)
  • Заборонений на держпристроях у 10+ країнах

Реальна вартість

Сам чат — безкоштовний у базовому вигляді. API — від $0.27/млн вхідних токенів (cache miss). Для локального розгортання — безкоштовно, але потрібне залізо. Дистильована 7B-модель запуститься на ноутбуку з 16 ГБ RAM. 67B-модель (повна) потребує сервера з кількома GPU.

$6 млн
Заявлена вартість навчання DeepSeek-V3 — порівняно з $100+ млн для GPT-4 від OpenAI. Аналітики JPMorgan і Bernstein зазначають, що ця цифра не включає витрати на попередні дослідження та інфраструктуру.
Джерело: Wall Street Journal, Fortune, CNBC

Безпека та конфіденційність: що кажуть дослідники

Ось де я зобов’язаний бути максимально чесним. Дослідники з NowSecure (Чикаго), SecurityScorecard і Wiz виявили серйозні проблеми:

1. Відкрита база даних. У січні 2025-го дослідники Wiz знайшли публічно доступну базу ClickHouse без жодної авторизації. В ній — понад мільйон записів, включно з API-ключами, логами чатів та бекенд-деталями. DeepSeek закрив дірку після повідомлення, але невідомо, чи встигли зловмисники скопіювати дані.

2. iOS-додаток. NowSecure встановив: дані передаються без шифрування, використовується застарілий алгоритм 3DES із захардкодженими ключами, а функція App Transport Security (ATS) — спеціально вимкнена. Це означає, що дані можна перехопити при звичайному MITM-атаці.

3. Зв’язок із ByteDance. SecurityScorecard виявив у додатку бібліотеки ByteDance (власника TikTok), які збирають дані про поведінку користувачів. Чи передаються ці дані далі — невідомо.

4. Географія заборон. Станом на 2025–2026 рік DeepSeek заборонений на держпристроях в Австралії, Канаді, Італії, Нідерландах, Тайвані, Південній Кореї, ряді штатів США. Американський ВМФ і Конгрес попередили співробітників не використовувати додаток.

Мій практичний висновок: Публічний чат DeepSeek — не місце для паролів, медичних даних, корпоративних секретів і будь-якої особистої інформації. Якщо вас цікавить саме технологія — розгорніть локальну версію через Ollama. Там ваші дані нікуди не йдуть.

Чому це важливо для кожного з нас

DeepSeek — це симптом більшої зміни. Упродовж 2023–2024 років панувала ілюзія: хто купить більше GPU від Nvidia — той виграє гонку ШІ. DeepSeek довів, що це не так. Розумна архітектура плюс ефективна оптимізація можуть дати порівнянний результат за $6 млн замість $100+ млн.

Для розробників і малого бізнесу це хороша новина: API-ціни впали по всій галузі. Той самий ChatGPT та Gemini стали дешевшими — зокрема через конкуренцію з боку DeepSeek. Відкритий код дозволяє підприємствам запускати власний ШІ без щомісячних підписок.

Для звичайних користувачів — головне правило одне: не вводьте в DeepSeek нічого, чого не хотіли б показати незнайомцю. Ця порада стосується й ChatGPT, і Gemini — але у випадку DeepSeek ризик юрисдикційний: китайські закони не гарантують вашої privacy так, як GDPR або навіть американські регуляції.

Поширені питання

  • DeepSeek — це безкоштовно? Так, базовий чат через chat.deepseek.com безкоштовний. API — платний, але дуже дешевий порівняно з конкурентами (від $0.27/млн вхідних токенів). Запуск локальних версій через Ollama — повністю безкоштовний, якщо у вас є відповідне залізо.
  • Чи можна використовувати DeepSeek в Україні? Технічно — так, додаток доступний. Офіційних державних заборон в Україні зараз не зафіксовано. Але зважте на контекст: ваші дані йдуть на сервери в Китай. Для особистих питань — ризик помірний, якщо не вводити нічого конфіденційного. Для роботи з державними або корпоративними даними — категорично не рекомендую публічний чат.
  • DeepSeek кращий за ChatGPT? Залежить від задачі. У кодингу, математиці та логічних задачах R1 і V3 справді конкурентні з моделями OpenAI. У творчих завданнях — скоріше порівнянні. Але ChatGPT чесніше поводиться з чутливими темами і має кращі механізми захисту безпеки. Це не рейтинг «хто кращий» — це різні інструменти з різними компромісами.
  • Чи небезпечно завантажувати додаток DeepSeek на телефон? Дослідники NowSecure настійно рекомендують видалити iOS-додаток з корпоративних пристроїв. Дані передаються без шифрування, є посилання на інфраструктуру ByteDance. Для особистого телефону — рішення за вами, але усвідомлено: не вводьте в додаток нічого чутливого.
  • Як запустити DeepSeek локально і чи це складно? Не складно, якщо трохи знаєте термінал. Встановіть Ollama (ollama.com), потім виконайте команду ollama run deepseek-r1:7b. Модель завантажиться (~4 ГБ) і запуститься локально. Дані нікуди не відправляються. Для дистильованої 7B-версії достатньо комп’ютера з 8–16 ГБ RAM.

Висновок та рекомендації

DeepSeek — це технологічно справді вражаючий результат. Команда з Hangzhou вирішила проблему ефективності так, що вся Silicon Valley мусила переосмислити свої бюджети. Це факт, підтверджений незалежними бенчмарками та ринковою реакцією.

Але технічна перевага і безпека використання — різні речі. Моя порада:

Якщо ви розробник — вивчайте API DeepSeek для проєктів, де не обробляються персональні дані. Вартість нижча, продуктивність порівнянна. Якщо хочете поекспериментувати — запустіть через Ollama локально. Якщо ви звичайний користувач — можете спробувати чат для некритичних задач (написання тексту, рецепти, вивчення мови), але ніколи не вводьте паролі, медичні дані чи робочу документацію.

І так — якщо ця стаття допомогла вам зорієнтуватися в темі, поділіться нею з колегами. Кожен, хто щодня використовує ШІ-інструменти, заслуговує на чесний аналіз. Це і є місія uaexpert.org.

Матеріал перевірено на основі відкритих джерел: Wikipedia, Bloomberg, NBC News, CNBC, NowSecure, SecurityScorecard, Georgia State University, World Economic Forum.

Автор: Lumir

Дивіться також:

Що таке Perplexity AI — і чи варто ним користуватися?

Що таке Grok: чесний огляд AI від Ілона Маска

Що таке Claude: чесний огляд ШІ від Anthropic

Що таке Google Gemini: чесний огляд

Що таке ChatGPT: повний гайд

Як ChatGPT може допомогти вивчити складну тему: чесний гайд від аналітика

Як налаштувати ChatGPT для щоденної роботи: покрокова інструкція

Прокрутка до верху