Как стать автором
Обновить

Практическое руководство по выбору между ChatGPT, Claude, Gemini, Grok и Perplexity

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров55K
Всего голосов 27: ↑20 и ↓7+15
Комментарии56

Комментарии 56

Чат гпт 4.5 бьёт всех

Но за умеренные деньги можно только бету, которая половину времени не работает.

Для кодирования Клава

Грок и дипсик на скамейке запасных

Для кодирования поставьте виндсерф и включите модельку Клавы))

А 4.5 как по мне проигрывает Клауд опусу во многом.

Статья устарела.

  1. У перплексити появился шикарный дип ресерч

  2. У Клауда отличный ризонинг

  3. У гемини появился хороший дип ресерч и поиск.

В статье про perplexity говорится, что deep research у них проще, я тоже это замечаю, не зря в gpt лимит на количество обращений в месяц, в perplexity нет ограничений

Про Claude не знаю, не сравнивал, может кто в комментариях напишет, интересно

Google по API много сравнивал и там они далеко от gpt и Claude

Про актуальность тут конечно не угнаться 😂 но на текущую дату с разбивкой в таком виде по кейсам использования только эту статью встретил, если у вас есть что-то новое поделитесь пожалуйста

Анализ в статье получился довольно поверхностный. Автор больше сравнивает не сами модели, а сервисы, построенные вокруг них.

От себя добавлю: для генерации кода и отладки лучше всего работают модели OpenAI – o3-mini-high для задач на потоке и o1 как тяжелая артиллерия. Но с творчеством у них слабовато – это заметно по интерфейсам, которые они предлагают. Так что их стоит использовать скорее для бэкенда. Sonnet последней версии, даже в бесплатном варианте, часто выручает там, где модели OpenAI не справляются с отладкой, плюс у него отличный вкус к интерфейсам. Недавно удивил свежий Grok 3 – пока мало тестировал его на коде, но для творческих задач и поиска он кажется лучшим вариантом на сегодня.

А что касается DeepSeek – его единственная прелесть в том, что он бесплатный и при этом практически безлимитный. Но качество хромает, и смысла в нем мало, если есть хотя бы базовая подписка на OpenAI.

Gemini?

Прошел мимо.

для генерации кода и отладки лучше всего работают модели OpenAI – o3-mini-high для задач на потоке и o1 как тяжелая артиллерия.

Прямо лучше claude 3.7 sonnet (thinking) или не сравнивали? Я пробовал gpt-4o-mini - она постоянно в именах полей путалась, хуже deepseek v3.

gpt-4o-mini для сложных задач не годится, а дипсик анонсировали как модель на уровне o1 – так что не удивително.

Claude у меня в бесплатной версии, поэтому на задачах 1-в-1 по сложности как на OpenAI моделях я ее не проверял, но в моменты когда они не справляются с отладкой, Соннет часто выручает и находит проблему с первой попытки, даже прошлая 3.5

Есть возможность получить клаву менее затратно и геморройно?

Для сложных задач не годится ни одна из генеративных моделей, ни из уже существующих, ни из потенциально осуществимых, просто по определению генеративной модели и ее принципу работы.

Судя по вашему богатому опыту, сложные задачи это что-то вроде отладки ассемблера на перфокартах. Я конечно же ничего такого не имею в виду :)

Нет, почему же. Банальный хайлоад, например, кластер, несколько сотен тысяч гринтредов.

Не соглашусь. Вон недавно Nvidia делали блогпост как с помощью ллм генерировали оптимизированные ядра под attention. Задача далеко не простая, но ллм вполне себе справилась.

Сенсация! Пчелы рекламируют мёд!

Никогда такого не было.

Было бы здорово видеть сравнения на конкретных примерах

Сравнить эти два PDF-предложения и сказать, какая сделка лучше

-- что на это сравнения сказали другие сетки?
Что именно они сравнивали и искали? Что были за пдф?

Я обнаружил, что это невероятно полезно для изучения новых вещей с моими детьми

-- например каких? Мой вот 7и летний ребенок категорически не воспринимает "железного болвана" как он сам их называет.

Я просил ChatGPT помочь с подготовкой налоговой отчетности, планированием RSU и многим другим. Похоже, он лучше разбирается в математике, чем другие модели

-- как это сравнивалось? Почему лучше? Что другие модели выдали? Фин и налоговая отчетность это не особо про математику, больше про анализ данных и простые формулы.

Глубокого исследования рынка или технической темы. Я писал о том ... лучший продукт ChatGPT. Он превосходит аналогичные предложения от Grok, Perplexity и Gemini 

-- Как? В чем? Почему?

И так вся статья. Было бы здорово видеть реальные, рабочие схемы и их работу в разных моделях.

Я вот попросил perplexity запланировать мое путешествие в Сочи на указанный диапазон дат, 75% доступной информации он просто проигнорировал, а на прямой вопрос про доступное мероприятие - развел своими виртуальными руками.
Тот же дипсик мне выдал ВСЁ, вплоть до цен на авиабилеты, актуальное расписание рейсов и мероприятий, даже отель посоветовал и цены в в нем.

Итак вопросы- по каким критериям проходили сравнения и как был сделан вывод?

Переводчику эти вопросы задавать бесполезно, они становятся риторическими.

Ну он пишет, что:

Активно изучаю AI-решения в кросс-функциональные процессы.

Так что может и личное мнение высказать.

Тут скорее вопрос к формату статьи и глубины аналитики, можно по каждому сценарию подобрать датасет/оценки/скорость и пр.. и то, в этом случае могут вопросы к деталям по датасетам.

В этой статье скорее мнение с примерами и в удобном виде структурировано, кажется тоже может быть полезно

Как-то совсем не упомянут Mistral.

У вас в списке почему-то человеческого разума нет. Я, наверное, последний человек в мире, который не пользуется чат-ботами.

@Kual, внесите пункт: "никакой".

Добавил 👌

Можно ещё добавить пункт: "пользуюсь всеми сразу пока не закончится бесплатный лимит"?

Можно есть руками, сидеть на земле вместо стульев, ногти грызть и гордиться этим.

Так пользование ИИ-ассистентами именно этим и грозит. Лень, которая была двигателем прогресса два миллиона лет человеческой истории, в эпоху ИИ-ассистентов начинает работать против вас.

Но и в реальной работе пользы немного. Вот мнение врача:

Попробовал deep research от GhatGPT. Традиционно задал вопрос, по которому сам сейчас пишу курсовую. Попросил опираться только на данные рандомизированных исследований или их синтеза. AI задал уточняющий вопрос, долго кряхтел, искал, сообщал что сейчас делает. Потом выкатил развернутый ответ. Очень обстоятельно, со ссылками. По первой же проверенной ссылке — исследование before-after. Интересно, те, кто восхищается аналитическими способностями этого продукта, не пробовали искать в той области, в которой сами разбираются? Наверное, если бы я задал вопрос по квантовой физике, тоже был бы доволен результатом.

Источник: https://www.facebook.com/share/p/18jpCrDxf4.

Откуда в данном контексте взялось слово «гордиться»? Если бы это автодополнение на стероидах действительно могло бы мне хоть как-то помочь с моими задачами — я бы с удовольствием его использовал.

Но я уже давно не занимаюсь джейсоноукладкой и перекраской кнопок, в которых написание кода отнимает заметное время в сравнении с решением самой задачи. А проблему выбора окон и подобные — делегирую профессионалам, а не пытаюсь накостылить сам.

Я тоже.

О, а я еще удивился, как так получилось, что прямо из коробки есть пункт «никакой». Спасибо.

Нет, вы не единственный. Чат-боты помогают только людям с интеллектом как у моего пылесоса, или ниже. Остальным быстрее подумать и сделать, чем писать промпты и отлавливать потом ошибки.

А если вас просят составить десяток отчётов, просто потому что так захотело начальство, как вы выкручиваетесь? И это не отменяя основную часть работы, а вас заставляют делать их одновременно

Просто мне легче скормить информацию ведроголовому нежели писать эту ерунду самому.

Я работаю только в тех местах, где начальство ценит мою способность решать сложные задачи и писать хороший код.

Не понимаю этого щенячьего восторга вокруг чат-ботов. Есть же реальные примеры хорошего применения машинного обучения. Например, AlphaFold и прочие специализированные нейросети. Но все пишут про имитацию (а вовсе не эмуляцию) человеческого мышления.

Когда чатбот умнее тебя, и лучше пишет код, который тебе надо было сдать вчера, и даже рифмует лучше твоего друга рэпера — поневоле восхитишься.

Я перешёл на grok: глубина контекста даже в бесплатной версии поражает.

Основное использование: любительское программирование (телеграм-боты, автоматизации деятельности небольшой компании на 30 человек и тому подобное), маркетинг и все с этим связанное, редко бытовые вещи типа поиска врачей.

Столкнулся с тем, что из-за этой глубины он зацикливается — просишь его изменить ответ, а он шарашит старую нить рассуждений, и отвечает так же, как отвечал, немного дополняя ответ вместо того чтобы переключиться полностью на новый подход

У меня такого не было. Бывало, что тормозил после нескольких дней разработки с выдачей сотен строк на каждой итерации. Тогда я просто создавал новую ветку, загружая туда актуальные файлы.

Потестил Грок. Попросил указать магазины одной торговой сети у нас в городе. chatgpt указал верно с первого раза. grok указал оба адреса не верно. Зашел на сайт сети, в раздел где указаны магазины, скопировал адрес гроку, сказал проанализируй и все равно грок настаивает что его первые адреса верны. Адреса уже полгода как не менялись. Пока рано пить Грок.

Остановился на связке cursor + perplexity как самое универсальное для меня. По промокоду через 3х лиц перплексити стоит смешные 800р в год(!) с доступом к моделям от Claude/openAI, их личному r1, неплохому(пусть и более слабому в сравнении с openAI) deep research и так далее. Там даже запросы к chatGPT 4.5 есть в подписке. Ещё и приложение под винду недавно сделали.

Cursor тут по похожей причине, универсальность и простота использования. Просто поспрашивать в вебе я могу и бесплатно или через perplexity, но за 20 баксов я получаю tab autocompletion + API запросы для agentic usage. Нет, я могу это всё сделать сам, поднять qwen coder на гпу и подрубить в continue.dev, туда же прокинуть ключ с opentouter для чата внутри IDE, и сверху добавить cline с тем же ключом. Проблема в цене, один запрос cline на небольшую модификацию кода у меня сожрал 30к+ токенов, ладно я запускал на v3, а если б я к sonnet делал?

А можно развернуть мысль про 800р в год?)

Ну я тоже недельки полторы назад взял перплексити на год за 750р. Другой момент, что у меня куплен клод с chatGPT Plus и не то чтобы в таком случае перплексити прям нужен. Хотя вот поставил ассистентом вместо Gemini на телефоне...

Плати.маркет, там ищите perplexity, будут продавцы продающие за 700-900, у меня через промо от O2 получилось. В целом через ту площадку заказываю все "санкционное", что cursor, что кредиты на opentouter, что spotify. p.s. не реклама, если кто знает сервис лучше - делитесь.

Использую платные Claude, ChatGPT (но не подписку за 200 долларов, а обычную plus). Так же юзаю бесплатные версии грок и гугловского генератора картинок. И локальный deepseek и другие модели.

В табличку нужно вставить параметр цензура, Grok отвечает на цензурированные вопросы, на которые Gpt никогда не ответит

Ну кстати GPT4o как замечал в какой-то недавний момент расцензурили. Да не так чтобы прям тотально, но воздуха стало больше.

Оплатил гпт, попытался написать код с о3-мини-хай - не получилось, слишком неактуальная инфа (2023 катофф инфы)
Открыл грок 3, нажал think - идеальнейший код с 1 попытки
Насколько я понимаю, у грока каким то образом катоффа нету, либо у них хорошо проделан поиск в инете

Единственный минус - он странно юзает контекст: я ему кидаю ошибку, а он не учитывает предыдущее свое и мое сообщения, и просто объясняет в чем проблема
Так что, если выбирать между ними - грок 3 легчайше побеждает, даже со своими минусами (еще и бесплатное обдумывание)

Новый Gemini не пробовали?

Не пробовал, но чекнул обрез данных - 2.5 экспериментал потесчу, спасибо

Совершенно без привязки к модели, а o3 сильно отличается от 4o у openAI

Gemini 2.0 судя по всему не рассматривали

Раньше использовал DeepSeek - он чаще дает правильные ответы. Единственно с недавнего времени сервер постоянно занят, что не дает им пользоваться как раньше, поэтому приходится пользоваться тем что описано выше. По правильности ответов они заметно уступают DeepSeek, но деваться особо некуда.

Все было бы круто, если бы не упоминание детей. Хотя это проблема изначального автора - подсадить детей на нейросети - это безалаберность полная. Да - они будут в них доками (почти наверняка). А вот собственное мышление у них будет - ту-ту...

Сам юзаю Claude. Да - в коде помогает. но иногда его заносит в такие дебри - что хоть стреляйся. Кода пишет много, но потом его надо править. Не по причине того что он плохой, а по причине того что там куча проблем заложена на будущее развитие проекта.

Я могу сказать одно, я за счет ИИ написал большое количество серьезных проектов (5-6 тыс строк кода на каждый проект). Я не общаюсь с ИИ по типу «привет, как дела» использую только когда нужно в чем-то разобраться. Так вот, лучше чем Grok3 я не видел. То, сколько я мучился с GPT (пытался нормально изучить работу тех работу трансформеров и обучить базовую модель с 0) НИЧЕГО НЕ ВЫШЛО. Все время тулила и рассказывала за CNN и другие виды Ии. Короче, бился головой об стену. И только Grok мне за 2 дня дал столько нужной инфы, что через 3 недели я уже очень не плохо разбирался в том, как технически все работает. Написал кастомную модель и обучил. Да, ИИ даже сейчас не супер и часто возня с их бредом идет. Но GPT считаю скатился. Но o1 нот бэд. Тут не чего не скажу. Cloude не плох. Но он на любой запрос - тонную текста дает. Устанешь читать:) особенно когда код пишет. Все пишут 100-150 строк. Он 400. Ужас

Если серьёзность проекта измерять количеством строк кода, то котлин проиграет джаве в 100% случаев.

Гигу от сбера и Алису Pro за 100 р/мес никто даже не упомянул) А для каких-то задач вполне себе годные решения.

Недавно задавал алисе вопрос, та которая станция с подключенным жпт про актуальную площадь стран США и России, она прям очень уворачивалась от ответов и говорила вот что я нашла в интернете при этом даже в интернете ответ был совсем не на поставленный вопрос. Очень удивился, даже не преследовал политического мусора в своем вопросе, просто хотел получить примитивный ответ, вот столько то квадратных километром.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации