СhatGPT, Claude, Grok, DeepSeek - яка з них краща
Ситуація з нейромережами виходить з-під контролю! ChatGPT, Claude, Grok, DeepSeek — їх стає дедалі більше, і кожна кричить, що вона найкраща. Усі хочуть наших грошей, але яка з них дійсно варта уваги? Чесно кажучи, я два роки сидів на ChatGPT — звичка, знаєте. Але останнім часом чув, як люди переходять на інші моделі, і задумався: а раптом я застряг у старому і пропускаю щось круте? Тож я вирішив протестувати чотири топові моделі — не на абстрактних задачах, а на реальних, практичних кейсах, з якими ми звертаємося до нейросетей. Усе робив на безкоштовних версіях, показав запити й відповіді — ви самі зможете оцінити, що вам підходить. Спойлер: ідеальної моделі немає, але є найкраща для конкретної задачі. Поїхали!
Пошук актуальної інформації
Перше завдання — знайти свіжі новини про розвиток штучного інтелекту. Оцінюємо свіжість даних, якість джерел і наявність посилань. Запит простий, але широкий, щоб перевірити, як моделі вловлюють контекст.
ChatGPT (з пошуком): Тягне лише новини про себе (GPT-4.5), додає посилання на Вікіпедію (дивно для новин). Більшість даних — із грудня-січня. Слабенько.
Claude: Пошуку немає, новини за жовтень 2024-го. Тест провалено.
DeepSeek: Кнопка "Search" є, але нічого актуального не знайшов. Провал.
Grok: Найкращий результат — свіжі новини з посиланнями, зокрема на X (Twitter), що ідеально для оперативності.
Висновок: 1) Grok, 2) ChatGPT, 3-4) DeepSeek і Claude (не впоралися).
Маркетинг:
Тригерні заголовкиМаркетинг — це про психологію: що чіпляє, а що відлякує? Я часто використовую ChatGPT для заголовків і описів. Тут я попросив придумати назву для блогу й обкладинки — щось тригерне, щоб клікнув. Оцінюю, чи зачепило б мене.
ChatGPT: Дало 5 варіантів ("Нейросіті без гальм", "Grok бачить приховане") — стилі різні, цікаві.
Claude: Занадто довго й нудно, не чіпляє.
DeepSeek: Схоже на мій стиль, але назви задовгі для обкладинок.
Grok: Один варіант ("Хто знає забагато"), але тригерний, хоч бракує різноманіття.
Висновок: 1) ChatGPT, 2) Grok, 3) Claude, 4) DeepSeek (забагато слів).
Написання гайдів
Люблю робити гайди з довгих матеріалів блогу. Попросив моделі зробити вижимку з мого тексту "25 несподіваних способів використовувати ChatGPT". Оцінюю деталізацію й корисність.
ChatGPT: Сухо, просто список без глибини. Робочий варіант, але питань залишиться багато.
Claude: Не впорався — текст завеликий для безкоштовної версії (понад 20 хвилин — проблема).
DeepSeek: Вступ, пункти, як використовувати — уже схоже на гайд.
Grok: Назва, короткий опис, як використовувати, плюс бонусні ідеї — детально й круто.
Висновок: 1) Grok, 2) DeepSeek, 3) ChatGPT, 4) Claude (провал).
Аналіз аудиторії
Для курсів я аналізую побажання аудиторії — коментарі, опитування. Важливо, щоб нейросеть не пропустила деталей. Попросив проаналізувати, які боти потрібні моїм читачам.
ChatGPT: Основні категорії, структура хороша, але бракує деталей.
Claude: Топ-3 категорії, тренди, але стисло й мало прикладів.
Grok: Конкретні приклади, сфери, інсайти — структуровано й корисно.
DeepSeek: Карточка побажань із прикладами популярних ботів — дуже практично.
Висновок: 1) DeepSeek, 2) Grok, 3) ChatGPT, 4) Claude.
Робота з документами і сценаріями
естую аналіз великого документа (звіт World Economic Forum) і створення сценарію про зникнення професій через ШІ. Оцінюю глибину й структуру.
ChatGPT: Конкретно: професії, що зникнуть і з’являться, плюс логічний наратив. Непогано як база.
Claude: Документ завеликий (65% перевищення ліміту). Провал.
Grok: Розгорнутий наратив, текст для ведучого, цікаві ідеї — сміливіше за ChatGPT.
DeepSeek: Теж провал — документ завеликий.
Висновок: 1) Grok, 2) ChatGPT, 3-4) Claude і DeepSeek.
Написання постів
Часто переписую тексти для соцмереж. Попросив зробити тред для Twitter із мого матеріалу про Grok, щоб зацікавити Ілона Маска. Оцінюю тригерність і природність.
ChatGPT: Витягнув ідеї, розподілив по пунктах, але треба правити.
Claude: Факти без хуків — не для треду.
Grok: Більше як пост, ніж тред, але слабше за ChatGPT.
DeepSeek: Не впорався.
Висновок: 1) ChatGPT, 2) Grok, 3) Claude, 4) DeepSeek.
Програмування
Я не кодер, але пишу скрипти для автоматизації. Попросив створити гру: ракета Ілона Маска сідає на Марс за допомогою стрілок. Оцінюю візуал і фізику.
ChatGPT: Гра працює, є механіка палива, але фізика дивна, графіка проста.
Claude: Круто! 2D-графіка, деталізована ракета, анімація, продвинута механіка.
DeepSeek: Примітивна графіка, фізика не працює.
Grok: Реалістична фізика, цікаве управління, графіка непогана.
Висновок: 1) Claude, 2) Grok, 3) ChatGPT, 4) DeepSeek.
Бонус:
Deep ResearchФункція глибокого дослідження є лише в ChatGPT (платно) і Grok (безкоштовно). Попросив простежити історію ШІ від давнини до сьогодення.
ChatGPT: Об’ємний звіт, факти від VII ст. до н.е., глибоко й круто.
Grok: Переглянув 44 сторінки, ключові моменти, усі посилання — непогано, але менш розгорнуто.
Висновок: 1) ChatGPT, 2) Grok (але безкоштовно!).
Висновки: Яка модель для чого?Ідеальної нейросети немає — є краща для твоєї задачі.
Задача
Лідер
Пошук новин
Grok
Маркетинг
ChatGPT
Гайди
Grok, DeepSeek
Аналіз даних
DeepSeek, Grok
Документи/сценарії
Grok
Пости
ChatGPT
Програмування
Claude
Глибоке дослідження
ChatGPT (Pro), Grok (безкоштовно)
Мої підсумки:
Пошук новин: Grok.
Маркетинг: ChatGPT.
Гайди: Grok або DeepSeek.
Аналіз даних: DeepSeek і Grok.
Документи/сценарії: Grok.
Пости: ChatGPT.
Програмування: Claude.
Глибоке дослідження: ChatGPT (платно) або Grok (безкоштовно).
Раніше я недооцінював Grok, але тепер у мене дві вкладки — ChatGPT і Grok.
Last updated