ChatGPT vs DeepSeek
Страница 3 из 18
Все говорят про вайб-кодинг, но никто не говорит про вайб-аналитику
За выходные собрал себе на Metabase дашборд, который подключается к PostgreSQL базе (ее же использует Replit) и выводит разные графики и показатели.
Разумеется, я даже не знал, что такое Metabase и как им пользоваться, мне всё рассказал ChatGPT. Он же пишет мне нужные SQL запросы, когда я хочу вывести тот или иной показатель.
Раньше:
⁃ Могу анализировать данные в Google Sheets с помощью сводных таблиц ⁃ Могу использовать готовые дашборды в PowerBI/Datalens, который собрали разработчики.
Теперь:
⁃ Могу сам собрать любой дашборд, подключившись к базе напрямую ⁃ Могу запилить скрипт, который эту базу еще и пополняет внешними данными из других систем (например, из Stripe)
Это ли не фантастика?
слушайте, как люди вообще ChatGPT пользуются? я не понимаю, что за волшебную лампу с джином открыли когда-то в Anthropic, но то, насколько у них instruction-following сильнее, чем где-либо вообще в принципе - это же неописуемо. ну то есть GPT-5.1 в ChatGPT игнорирует базовые, самые элементарные требования и правила, steering совершенно нулевой, я как будто общаюсь не с instruct моделью, а с сырой фундаментальной моделью, она вообще не вдупляет что происходит. и agentic capabilities порезаны донельзя - у модели и Canvas-режим в тулах есть, и websearch она может делать, но workflow прибит гвоздями настолько, что увидеть tool call от ChatGPT не в начале диалога - это чудо какое-то.
и Gemini такой же альтернативно одарённый. сносно вывозит делать UI (именно с точки зрения визуала), но качество архитектуры и instruction following - как у пятилетнего ребёнка. вместо тулколла сделать "эмуляцию" туллколла, нагаллюцинировав его - вообще спокойно.
ну то есть, это же прям реально интересно, вам не кажется? Anthropic ещё с Sonnet 3.5 снесли всех на рынке качеством агентского поведения. я по сей день в гипер-супер-пупер-флагманских моделях от других гигантов не вижу даже трети того качества агентского поведения, какое есть у Anthropic.
отдельно в контексте day-to-day usage интересно сравнивать собственные ощущения с бенчами. по субъективным ощущениям - за год у Anthropic и китайских моделей качество выросло в разы, это реально земля и небо. а у OpenAI/Google - ваще хз, в каком таком SWE Verified они там лидируют, но я не смогу GPT-5.1 от GPT-4o отличить, в повседневных задачах интеллект как будто не вырос ни на миллиметр.
Попробовал переписать с OpenAI API SDK на LangChain (говорят это база) и... что-то не понял. Абстракции они же должны вроде как сложность скрывать, но сложности в OpenAI Chat Completions API никакой (зря что ли ребята в Open AI потратили всего одни выходные чтобы его создать). А вот приносимой боли в дебаге немало — добраться до того, что там на самом деле происходит будет уже непросто.
Самое смешное, что claude code на вопрос «давай накинем дебага и узнаем, как там залетают в апи тулы» предложил мне просто переписать на OpenAI API SDK, потому что тот объём шума, который вываливает env LANGCHAIN_VERBOSE = "true"; он переварить не способен.
Да, есть LangSmith, но это уже какой-то оверкилл подрубать внешний платный SaaS-сервис для дебага обёртки над простеньким api.
В то же время вызов OpenAI API SDK элементарно превращается в обычный curl запрос, который ты можешь приложить к тикету в саппорт, если сам не разобрался.
Поучаствовал в флешмобе "LLM, а расскажи мне про меня". Только не на основе истории чатов с GPT, а на 7 годах истории постов в этом телеграм канале (заодно научился скачивать полный дамп канала в JSON, спасибо Питону). Эксперимент по-своему интересный, так как подсвечивает публичную сторону личности, которую я тут бессознательно строю пост за постом. Итак, встречаем телеграмного Данила
Позитивные качества:
1. Профессиональная компетентность - глубокое техническое и художественное мастерство 2. Интеллектуальная честность - способность признавать сложность явлений и менять мнение 3. Целеустремленность - последовательное движение к целям несмотря на препятствия 4. Аналитическое мышление - способность глубоко анализировать ситуации и проблемы 5. Самостоятельность - умение принимать важные решения и нести за них ответственность 6. Надежность - высокий уровень ответственности перед клиентами и коллегами 7. Любознательность - постоянное стремление к новым знаниям и технологиям 8. Самоирония - способность с юмором относиться к себе и ситуациям 9. Семейные ценности - приоритет благополучия семьи 10. Эмпатия - понимание и уважение к чужим точкам зрения
Негативные качества:
1. Перфекционизм - чрезмерное стремление к идеалу в ущерб эффективности 2. Тревожность - склонность к избыточному беспокойству о будущем 3. Прокрастинация - откладывание важных решений и действий 4. Социальная замкнутость - избегание нетворкинга и социальных контактов 5. Трудоголизм - склонность к чрезмерной рабочей нагрузке 6. Сложности с делегированием - стремление все контролировать самому 7. Синдром самозванца - неуверенность в собственной компетентности 8. Избегание конфликтов - нежелание отстаивать свои интересы 9. Излишняя осторожность - чрезмерная оценка рисков 10. Самокритичность - склонность преуменьшать свои достижения
Я хз на счет позитивных, но негативные я все узнал 😅
Мы на занятии по ИИ со студентами с помощью ИИ (Composer внутри CursorAI) пишем систему, которая с помощью GPT 4o-mini будет фильтровать спам-сообщения в группах Телеграме с веб-интерфейсом, куда студенты смогут загружать свои промпты и проверять насколько хорошо они фильтруют спам, чтоб они закрепили навыки в prompt-engineering которые я им давал
So meta! :)
Сегодняшний апдейт лидерборда swe-rebench мне кажется одним из самых интересных за все время, по нескольким причинам:
1. Добавили целый ряд моделей: gpt-5.2, gpt-5.1-codex-max, Gemini 3 Pro, DeepSeek-v3.2, Devstral2. Все модели от openai теперь прогоняются через responses API с сохранением ризонинг блоков. И все модели по-своему интересны: – gpt-5.2 прыгнула на самый верх и теперь соревнуется с Sonnet/Opus 4.5. А главное посмотрите на кол-ве потраченных токенов в среднем на задачу – почти как gpt5-minimal. – gpt-5.1-codex-max сильно лучше gpt5-codex, но на фоне других моделей от openai не так уж выделяется. – Gemini 3 Pro – огромный скачок в агентских задачах по сравнению с 2.5 Pro. Оффтоп, но это моя любимая модель на текущий момент в бытовом пользовании, не могу народоваться фиче с нативной обработкой видео. – DeepSeek-v3.2 – новая сота в open-source, но также и сота по потреблению токенов 💀 – Devstral2 выглядит очень неплохо. Вроде как незаметный релиз от Mistral врывается в топ open-source моделей. – Не забывайте, что к ранжированию нужно относиться осторожно, задач не так много и доля случайности все еще большая, даже несмотря на усреднение по 5 ранам. Но общая картина думаю понятна хорошо. 2. Добавили Claude Code как reference сота агента 🎉 Режим запуска указан в инсайтах. 3. Для прозрачности Cost per Problem, добавили колонку Cached Tokens, как минимум для понимания, включен у модели кэшинг или нет.
Прилетел в Сан-Франциско. Последний раз был тут в 2019. Очень многое изменилось с тех пор, конечно.
- Энергия бурлит! OpenAI, Anthropic, Cursor, Google — все тут. AI-компаний больше, чем когда бы то ни было. В старых зданиях когда-то были склады и заводы, потом офисы корпораций типа Oracle, а теперь молодые и бордые AI-стартапы. - Поговорил с людьми буквально несколько дней, вдохновился, стало кристально понятно, что дальше делать с нашими компаниями. Магия! Осталось сделать. - Ремоут закончился: стандартное ожидание теперь в том, чтобы ходить в офис минимум 3 дня в неделю. Людей повсюду толпы, в кофейни и рестораны очереди. На набережных и в парках не протолкнуться от бегунов. - Город «разговаривает» с тобой про AI: кажется, что почти вся наружная реклама тут — AI-стартапы. Биллборды, остановки, троллейбусы — все про AI. Ну то есть понятно, что это самое важное, что сейчас происходит. Прикольно видеть знакомых: Nebius, Clickhouse, привет! Местные жалуются, что от работы не спрятаться ну вообще нигде. - Как сказал знакомый: тут ты только спишь, работаешь и занимаешься спортом. Больше делать особо нечего. - Погода на меня влияет сильно. Как-то намного приятнее работается и спортом занимается, когда вокруг солнце, сухо и тепло. - Селф-драйвинг уже настолько обыденная реальность, что даже писать об этом неловко. Очень быстро привыкаешь и перестаёшь удивляться. Роботакси стоит дороже обычного, потому что комфортнее и безопаснее. И люди охотно готовы платить. - Тост с авокадо и чашка кофе стоят $26 (с налогами и чаевыми). Проехать 20 мин на арендованном электро-самокате — $12. Дорого быть AI-стартапером.
А вы же понимаете, что обучение тоже капец как меняется?
Месяц назад я не умел собирать телеграм-ботов в n8n, а теперь умею.
Меня никто этому не учил, я не проходил никаких курсов. Я просто задавал вопросы ChatGPT и он мне по шагам рассказывал, что делать. И теперь я как-то худо-бедно это умею на уровне начинающего зеро-кодера. А чего не умею — то точно так же спрашиваю у ChatGPT и сразу же учусь.
Получается, что любые курсы «твердым» навыкам больше не нужны. Зачем мне тратить на это время и деньги, если ChatGPT научит меня чему угодно лучше любых курсов за $20 в месяц?
А вот чего ChatGPT мне пока не заменит — это мотивацию учиться, комьюнити и живое общение с людьми.
Получается, что раньше все смеялись над «инфоцыганами», которые продают мотивацию, а теперь только такое обучение и будет востребовано?
Очередной релиз OpenAI — GPT-Realtime-2.
00:40 — Риалтайм транслейт очень здорово выглядит. Понятно, что профессию переводчика уже похоронили, но просто представьте насколько эта тема облегчит работу саппорта с иностранцами
LLM как источник консолидированных знаний
Занимаясь проектом по реализации синтетических пользователей для ускорения извлечения инсайдов с помощью LLM в custdev-ах, пришел к интересному наблюдению.
В нашем мире знания распределены между различными отдельными инстансами (людьми, книгами, и т.д.), в случае с людьми - очень смещенными. Интернет – это пример первого удобного источника агрегированных знаний (до него, например, были библиотеки / энциклопедии). LLM – это новое поколение инструментов с консолидированными знаниями (для меня это еще одно объяснение, почему LLM так хорошо зашли: многие мои знакомые теперь идут в deepseek, а не гугл, чтобы понять как сделать VAT refund в поездке или понять что делать с отменой рейса).
Рассмотрим на примере custdev-ов (глубинных интервью).
Раньше: 1. Выбираешь целевой сегмент пользователей 2. Формулируешь гипотезы болей 3. Собираешь 20-30 человек 4. Проводишь интервью, спрашиваешь о том, что “болит” 5. Собираешь транскрипты, фиксируешь инсайды (субъективно относительно того, что проводит custdev) 6. Делаешь саммари 7. Формулируешь идеи / гипотезы продуктов 8. Делаешь корректировки и повторяешь процесс ** Шаги 5-6-7 – это переход от отдельных смещенных инсайтов к агрегированному “знанию”
С приходом LLM как это выглядит теперь: 1. Выбираешь целевой сегмент пользователей – через промпт 2. Формулируешь гипотезы болей – через промпт (+ задаешь контекст) 3. Получаешь инсайды уже в виде саммари и идеи
Почему так? Внутри LLM уже содержится информация по всем-всем вариантам (которые встречались при обучении конечно), и ее ответ УЖЕ агрегированная информация. Нет смысла генерировать 30-50 диалогов с пользователями (тут есть отдельный риск, какой кстати?) и потом делать саммари (через ту же GPT). В реальной жизни без LLM мы так делать не можем – надо сэмплировать знания из отдельных людей и потом агрегировать.
P.S. в этом посте я намеренно не рассуждаю на тему репрезентативности инсайдов от “синтетиков” и не говорю о том, что привычные custdev-ы больше не нужны. Мне интересно посмотреть и порассуждать в комментах на интересный кмк переход и к чему он может привести.
Потестили уже GPT 5.5?
Я начал собирать свой сайт портфолио с помощью Opus 4.7, и накопил несколько багов, с которыми опус не справлялся.
Сегодня скормил эти баги GPT 5.5 и он решил их one shot — даже не на High ризонинге, а на дефолтном медиуме.
Обсудил с друзьями, и так у всех. Модель либо помогает сдвинуться с мертвой точки, либо выдает результат получше.
Рекомендую попробовать, задумался даже о покупке ChatGPT Pro за $100. По крайней мере, на ближайший месяц — пока колесо на картинке не повернется
Прерву серию постов про Випассану важной вакансией
Ищем бизнес-ассистента к нам в Epic Web3!
Предыдущий пошел на повышение 🙂
Ниже описание задач. Удалёнка, гибкий график, все дела.
Документы
– Подготовка и ведение договоров и счетов – Отслеживание документооборота: обновление таблиц со статусами, напоминания команде и партнёрам, чтобы всё шло по плану
Поездки
– Помощь с организацией командировок и виз для команды
Операционка и разное
– Работа с дизайнерами: ставим задачи, собираем фидбэк, следим за дедлайнами (хотя вообще-то блин какие дизайнеры, ChatGPT же) – Помощь по разным рабочим вопросам – Ведение базы полезных материалов – Поиск и общение с площадками для мероприятий – Загрузка фото и видео после ивентов на нужные платформы – Помощь с онбордингом новых коллег: собираем всё нужное, создаём аккаунты
Откликайтесь напрямую Оле @olyakovalieva
А вот и запись стрима про то, как AI меняет работу продакта - enjoy!
https://www.youtube.com/watch?v=51yp8YWAYgI
В этом вебинаре Байрам разбирает, как меняется роль продакт-менеджера в эпоху LLM и агентных систем. Это не разговор про “использовать ChatGPT”, а системный разбор того, как перестраивается весь процесс работы: от прототипирования и user research до аналитики, UX-аудита и продуктовой стратегии.
Разбираем реальные кейсы: - переход от ChatGPT к кодовым ассистентам и Claude Code - прототипирование через видео и генерацию UI - AI-интервью вместо классических survey + глубинных интервью - автоматизация аналитики и “утренний автопилот” продакта - UX-аудит через best practices - generative UI и передача части бизнес-логики LLM
Отдельный блок — как думают топ-компании: LinkedIn (FullStack Builder), Shopify (Reflexive AI), Anthropic, Andrew Ng — и почему узкое место смещается из кодинга в продуктовую постановку задач.
Главный вопрос видео: Что произойдет с ролью PM, если 70% задач автоматизируется?
Это разговор про смещение фокуса — от написания документов к постановке целей, управлению агентами, формированию vision и границ системы.
Как быть в курсе новых возможностей CSS
Саша Грейф поделился списком ресурсов, откуда он узнаёт новости про CSS. В списке даже ChatGPT есть, который уже не так сильно отстаёт по свежести знаний, как это было всего полтора года назад.
https://css-tricks.com/how-to-keep-up-with-new-css-features/
А я поделюсь с вами своим списком, откуда сам беру новости.
1. Релизы браузеров. Спецификации могут долго зависать на стадии обсуждений, а вот релиз фичи в браузере — это уже повод с ней поиграться. - Chrome - Firefox - Safari
2. Социальные сети нынешних и бывших браузерных деврелов. Юна Кравец, Джен Симонс, Адам Аргайл, Томас Штайнер и другие. Часто деврелы вкидывают в обсуждение спеку ещё на этапе глубокого черновика, но уже тогда можно ознакомиться с идеей.
3. Личные блоги крутых веб-разработчиков. Подписался через Feedly на RSS-ленты блогов, раз в неделю проверяю, что новенького у них появилось.
4. Подкаст «Веб-стандарты» (@webstandards_ru). Все ведущие скидывают в редакторский чатик разные полезные ссылки, некоторые сам бы я не нашёл. Из них мы потом формируем сценарий подкаста. Некоторые вещи я приношу сюда в канал.
5. MDN. Иногда захожу в категорию CSS и начинаю листать список свойств. Нахожу новое для себя, ищу по нему информацию в интернетах, нахожу интересные статьи.
Retain - архив ваших чатиков с AI
Иногда, хочешь найти переписку с дружбаном, но не помнишь, где именно ее делал: то ли в claude, или в claude code, а может в codex, или chatgpt.
Чтобы решить это сделал небольшую программку для Мака: импортирует все ваши чатики из Claude Code/Codex/ChatGPT/Claude.ai и дает поисковик по ним - см картинки в аттаче.
В будущем, будет еще предлагать как автоматизировать повторяющиеся паттерны-задачи, что вы им даете, какие скиллы создать или скачать. Де-факто это эволюция Claude Reflect
https://github.com/BayramAnnakov/retain
enjoy! если будут пожелания - лучше создавать github issue.
Начался университет. Я сделал выводы из прошлого года и пытаюсь заставлять студентов говорить по-максимуму
Итоги пока такие: 2 курс - 6 из 6 людей "поговорили" на лекции, один даже включил камеру (БОЖЕЧКИ-КОШЕЧКИ!) 4 курс - 2 из 13 людей "поговорили".
К сожалению эту тенденцию я наблюдал еще в 2009 году - когда к 4 курсу студенты (и не важно что тогда это был ХНУРЭ) настолько теряют веру в ВУЗ как инструмент обучения, что проедпочитают "отбывать номер" и соблюдать формальности. Они просто не верят что их чему-то научат
и на 2 и на 4 курсе я в том числе задавал один очень простой вопрос "А зачем вам, во времена безлимитных туториалов на ютубе и study mode в ChatGPT собственно я в формате лекций и всего остального - почему бы мне не просто набросать роадмап, отвечать на вопросы, может даже асинхронно, зачем вот это всё?"
я наконец-то победил самый бесящий баг в ai. он преследовал меня годами (!!) что вас больше всего бесит в ai? еще пару лет назад здесь были бы ответы про галюцинации или что ну просто туповат. но в 2026 это уже неактуально — на большинство из этих вещей можно уверенно ответить — skill issue. но один бесящий баг все таки остался..
я люблю голосовой ввод. писал про него в 2023, как раз когда его добавили в chatgpt. а знаете, что туда до сих пор не добавили? стопроцентрую гарантию того, что твой поток мыслей на 5 минут в итоге не будет потерян или что он не распознается только на половину
сейчас это устроено так, что в лучшем случае тебе покажется кнопка retry, но и она не защищает от краша приложения или другой ошибки выше уровнем. но даже если речь распозналась, то whisper легко может трактовать речь с шумами на фоне за тишину и поблагодарить dimatorzok за субтитры в расшифровке, вместо твоих слов на пару минут
я столько раз на этом обжигался и искал решение: записывал войсы в телеграме и расшифровывал их ботом. неплохо, но неудобно. так, мы же все так любим claude code, они то должны были сделать хорошо? так я и подумал на выходных, когда начал описывать свое видение продукта голосом на 5 минут. на третий раз мой голосой ввод просто не отработал, время снова потеряно. за все время я пробовал macwhisper / whisprflow, но с ними тоже были проблемы, и они не спасали от бага именно на стороне расшифровки модели. я возвращался к вводу руками
и вот наконец я добрался до handy. бесплатное приложение для голосового ввода, локальные модели, один хоткей для ввода. но самое прекрасное, что каждый раз, когда ты наговариваешь что-то голосом, то аудиозапись кладется удобно в папочку на компьютере. когда модель снова забаговала, то я просто пошел и отнес это сырое аудио в гемини и попросил полноценный транскрипт, и оно сработало!
we're so back. мне снова не страшно наговаривать голосом задачи. но пока только на маке. посоветуете что-то такое же на айфоны?
Мне тут рассказали про одного предпринимателя, который запретил у себя в компании использовать AI 😅 говорит, что сотрудники вообще перестали думать сами: просто по любому вопросу идут в ChatGPT и даже не проверяют ответ.
Я понимаю, в чём проблема, но кажется, что если сотрудники не думают — дело не в ChatGPT :)
Короче, я тут подробно описал весь свой предпринимательский путь. Сделал большую-большую заметку, где все подробно расписал.
Загрузил в ChatGPT в отдельный проект. Плюс загрузил туда все свои заметки по итогам каждого года с 2017го, чтобы было больше контекста.
И спросил его, что мне мешает уже наконец заработать очень много денег 😅
И он, сука, очень точно все разложил!
1. Эмоциональная зависимость от бизнеса
Каждый кризис → депрессия, ощущение, что «всё пропало». В такие моменты ты принимаешь решения на эмоциях. Это мешает выстроить спокойную стратегию.
2. Ставки all-in и позднее признание ошибок
Ты много раз «удваивался» на гипотезах, которые потом не взлетали. У тебя нет «мясорубки гипотез» с лимитом времени/денег. Ты позволяешь экспериментам тянуться дольше, чем нужно. В итоге ты много теряешь на затяжных тестах.
3. Фокус на «громкие вещи», а не на кэш-машины
Ты силён в бренде, ивентах, комьюнити. Но эти бизнесы редко становятся по-настоящему денежными машинам. Ты часто идёшь туда, где «интересно» и «видно», а не туда, где «самый простой путь к деньгам».
4. Финансовая дисциплина и подушка
У тебя нет привычки «сначала прибыль, потом рост». Ты идёшь в рост, а прибыль подтягивается (или нет).
5. FOMO и расфокус
Успешные направления часто не доводишь «до потолка», потому что переключаешься на новое.
Жаль он пока не настолько умный, чтобы еще и пофиксить всё это за меня. Вот бы AGI, который не только пофиксит, но еще и много денег за меня сам заработает!
🧨 ChatGPT — ваш новый аналитик данных
Пару дней назад OpenAI начали раскатывать функцию интерпретатора кода на всех платных пользователей. На выходных я провел за тестами несколько часов, вижу огромный потенциал и кучу сценариев. Но сегодня сфокусируюсь только на одном — анализе данных и его на примере разберем новые возможности ChatGPT.
1. Загрузка файлов: появилась возможность загрузить документ для последующей обработки — в этом кейсе это будет датасет. Доступа к интернету у этой модели пока нет, так что это единственный способ передать данные на анализ.
2. Разные виды анализа: запрос может быть как конкретным, так и открытым. Сначала можно сам чат попросить предложить направления для анализа. А затем уже очистить данные, посчитать когорты по выгрузке из платежки, а в другой момент влить те же данные и попросить найти там паттерны или аномалии.
3. Аутпут: еще одна новая мощная функция. Если раньше результат мог быть только текстовый и его нужно было копировать, то теперь он может быть любым и его можно выкачать по прямой ссылке. Для данных это будет к примеру обработанный датасет, с которым можно будет продолжить работу в следующей сессии.
4. Рассуждения & рефлексия: обычный ChatGPT старается ответить как можно быстрее, даже если информации в вопросе недостаточно. Интерпретатор следует другой логике: он старается осмыслять задачу и в начале, и в процессе. Если данных недостаточно, то он задает уточняющие вопросы. При этом если код выдает ошибку, то он находу ее анализирует и тут же автоматически вносит изменения.
Вот мой пример анализа датасета e-commerce продукта. За счет уточняющих вопросов и «реалтайм» обработки ошибок, путь до когортного анализа занял 2 минуты и несколько строчек текста. В конце я попросил сгенерировать выводы и они получились тоже валидными (скриншот будет в комментах). Это невероятная скорость и снижение порога входа.
😎️️️️️️Анализ данных — это только один из сценариев, который сильно повысит продуктивность продактов и предпринимателей. Мне в голову пришла еще целая категория таких юзкейсов, про которые могу отдельно рассказать. Давайте так, если соберем 100 реакций, то сделаю про это отдельный пост.
@prod1337