СhatGPT, Claude, Grok, DeepSeek - яка з них краща

Ситуація з нейромережами виходить з-під контролю! ChatGPT, Claude, Grok, DeepSeek — їх стає дедалі більше, і кожна кричить, що вона найкраща. Усі хочуть наших грошей, але яка з них дійсно варта уваги? Чесно кажучи, я два роки сидів на ChatGPT — звичка, знаєте. Але останнім часом чув, як люди переходять на інші моделі, і задумався: а раптом я застряг у старому і пропускаю щось круте? Тож я вирішив протестувати чотири топові моделі — не на абстрактних задачах, а на реальних, практичних кейсах, з якими ми звертаємося до нейросетей. Усе робив на безкоштовних версіях, показав запити й відповіді — ви самі зможете оцінити, що вам підходить. Спойлер: ідеальної моделі немає, але є найкраща для конкретної задачі. Поїхали!

Пошук актуальної інформації

Перше завдання — знайти свіжі новини про розвиток штучного інтелекту. Оцінюємо свіжість даних, якість джерел і наявність посилань. Запит простий, але широкий, щоб перевірити, як моделі вловлюють контекст.

ChatGPT (з пошуком): Тягне лише новини про себе (GPT-4.5), додає посилання на Вікіпедію (дивно для новин). Більшість даних — із грудня-січня. Слабенько.
Claude: Пошуку немає, новини за жовтень 2024-го. Тест провалено.
DeepSeek: Кнопка "Search" є, але нічого актуального не знайшов. Провал.
Grok: Найкращий результат — свіжі новини з посиланнями, зокрема на X (Twitter), що ідеально для оперативності.

Висновок: 1) Grok, 2) ChatGPT, 3-4) DeepSeek і Claude (не впоралися).

Маркетинг:

Тригерні заголовкиМаркетинг — це про психологію: що чіпляє, а що відлякує? Я часто використовую ChatGPT для заголовків і описів. Тут я попросив придумати назву для блогу й обкладинки — щось тригерне, щоб клікнув. Оцінюю, чи зачепило б мене.

ChatGPT: Дало 5 варіантів ("Нейросіті без гальм", "Grok бачить приховане") — стилі різні, цікаві.
Claude: Занадто довго й нудно, не чіпляє.
DeepSeek: Схоже на мій стиль, але назви задовгі для обкладинок.
Grok: Один варіант ("Хто знає забагато"), але тригерний, хоч бракує різноманіття.

Висновок: 1) ChatGPT, 2) Grok, 3) Claude, 4) DeepSeek (забагато слів).

Написання гайдів

Люблю робити гайди з довгих матеріалів блогу. Попросив моделі зробити вижимку з мого тексту "25 несподіваних способів використовувати ChatGPT". Оцінюю деталізацію й корисність.

ChatGPT: Сухо, просто список без глибини. Робочий варіант, але питань залишиться багато.
Claude: Не впорався — текст завеликий для безкоштовної версії (понад 20 хвилин — проблема).
DeepSeek: Вступ, пункти, як використовувати — уже схоже на гайд.
Grok: Назва, короткий опис, як використовувати, плюс бонусні ідеї — детально й круто.

Висновок: 1) Grok, 2) DeepSeek, 3) ChatGPT, 4) Claude (провал).

Аналіз аудиторії

Для курсів я аналізую побажання аудиторії — коментарі, опитування. Важливо, щоб нейросеть не пропустила деталей. Попросив проаналізувати, які боти потрібні моїм читачам.

ChatGPT: Основні категорії, структура хороша, але бракує деталей.
Claude: Топ-3 категорії, тренди, але стисло й мало прикладів.
Grok: Конкретні приклади, сфери, інсайти — структуровано й корисно.
DeepSeek: Карточка побажань із прикладами популярних ботів — дуже практично.

Висновок: 1) DeepSeek, 2) Grok, 3) ChatGPT, 4) Claude.

Робота з документами і сценаріями

естую аналіз великого документа (звіт World Economic Forum) і створення сценарію про зникнення професій через ШІ. Оцінюю глибину й структуру.

ChatGPT: Конкретно: професії, що зникнуть і з’являться, плюс логічний наратив. Непогано як база.
Claude: Документ завеликий (65% перевищення ліміту). Провал.
Grok: Розгорнутий наратив, текст для ведучого, цікаві ідеї — сміливіше за ChatGPT.
DeepSeek: Теж провал — документ завеликий.

Висновок: 1) Grok, 2) ChatGPT, 3-4) Claude і DeepSeek.

Написання постів

Часто переписую тексти для соцмереж. Попросив зробити тред для Twitter із мого матеріалу про Grok, щоб зацікавити Ілона Маска. Оцінюю тригерність і природність.

ChatGPT: Витягнув ідеї, розподілив по пунктах, але треба правити.
Claude: Факти без хуків — не для треду.
Grok: Більше як пост, ніж тред, але слабше за ChatGPT.
DeepSeek: Не впорався.

Висновок: 1) ChatGPT, 2) Grok, 3) Claude, 4) DeepSeek.

Програмування

Я не кодер, але пишу скрипти для автоматизації. Попросив створити гру: ракета Ілона Маска сідає на Марс за допомогою стрілок. Оцінюю візуал і фізику.

ChatGPT: Гра працює, є механіка палива, але фізика дивна, графіка проста.
Claude: Круто! 2D-графіка, деталізована ракета, анімація, продвинута механіка.
DeepSeek: Примітивна графіка, фізика не працює.
Grok: Реалістична фізика, цікаве управління, графіка непогана.

Висновок: 1) Claude, 2) Grok, 3) ChatGPT, 4) DeepSeek.

Бонус:

Deep ResearchФункція глибокого дослідження є лише в ChatGPT (платно) і Grok (безкоштовно). Попросив простежити історію ШІ від давнини до сьогодення.

ChatGPT: Об’ємний звіт, факти від VII ст. до н.е., глибоко й круто.
Grok: Переглянув 44 сторінки, ключові моменти, усі посилання — непогано, але менш розгорнуто.

Висновок: 1) ChatGPT, 2) Grok (але безкоштовно!).

Висновки: Яка модель для чого?Ідеальної нейросети немає — є краща для твоєї задачі.

Задача

Лідер

Пошук новин

Grok

Маркетинг

ChatGPT

Гайди

Grok, DeepSeek

Аналіз даних

DeepSeek, Grok

Документи/сценарії

Grok

Пости

ChatGPT

Програмування

Claude

Глибоке дослідження

ChatGPT (Pro), Grok (безкоштовно)

Мої підсумки:

Пошук новин: Grok.
Маркетинг: ChatGPT.
Гайди: Grok або DeepSeek.
Аналіз даних: DeepSeek і Grok.
Документи/сценарії: Grok.
Пости: ChatGPT.
Програмування: Claude.
Глибоке дослідження: ChatGPT (платно) або Grok (безкоштовно).

Раніше я недооцінював Grok, але тепер у мене дві вкладки — ChatGPT і Grok.

PreviousШІ-дзеркало твоїх питань NextТоп-9 безкоштовних ШІ для роботи й творчості

Last updated 6 months ago