Cursor vs Claude Code
Страница 5 из 26
Попробовал переписать с OpenAI API SDK на LangChain (говорят это база) и... что-то не понял. Абстракции они же должны вроде как сложность скрывать, но сложности в OpenAI Chat Completions API никакой (зря что ли ребята в Open AI потратили всего одни выходные чтобы его создать). А вот приносимой боли в дебаге немало — добраться до того, что там на самом деле происходит будет уже непросто.
Самое смешное, что claude code на вопрос «давай накинем дебага и узнаем, как там залетают в апи тулы» предложил мне просто переписать на OpenAI API SDK, потому что тот объём шума, который вываливает env LANGCHAIN_VERBOSE = "true"; он переварить не способен.
Да, есть LangSmith, но это уже какой-то оверкилл подрубать внешний платный SaaS-сервис для дебага обёртки над простеньким api.
В то же время вызов OpenAI API SDK элементарно превращается в обычный curl запрос, который ты можешь приложить к тикету в саппорт, если сам не разобрался.
Подъехала запись вчерашней встречи с китайским маэстро из Cursor
Swarm режим в Claude Code или как 10 агентов сделали приложение за 20 минут
Помните мой пост про число Данбара для AI-агентов? Я там делился, что чувствую себя узким местом, когда работаю с несколькими агентами параллельно, и рассуждал, как мы будем расшивать это.
Сегодня попробовал Swarm Mode - скрытая фича в Claude Code, которую мастера вскрыли и пошерили с нами. Кажется, это то, что надо, чтобы расшить нас. Я попробовал её на задачке создания маковского приложения, которое запилил до этого. Просто чтобы понять как пойдет.
Основные наблюдения: 1) Появляется "тим-лид" агент, который координирует 10 тиммейтов (в моем случае 10), каждого со своей специализацией: один делает модели, другой - UI, третий - сервисы, четвертый - скрипты сборки... см картинку в аттаче
2) И они работают параллельно. Не ждут друг друга, если только их работа не зависит друг от друга. Как в настоящем проекте. В эту тему как раз свеженький анонс таск листов от Claude Code.
3) У них есть "inbox" - система коммуникации друг с другом. На самом деле просто файлик, в который пишут и читают :)
Результат: За ~20 минут сделали то, что один Claude Code делал бы часа полтора. Все сразу завелось, НО они "воссоздавали" уже существующий продукт, еще посмотрю как будет с новыми задачами.
Ну и, конечно, токены и лимиты улетают только так - ждем новый SUPERMAX тариф в Claude Code :)
Если захотите детали - дип дайв тут + лог всей переписки с вызовами тулов и коммуникацией между агентами (ну вы же догадались с помощью какого тула я извлек его?😉) Вообще это занимательное чтиво (см. скриншот как 1 агент предлагает тимлиду, чтобы он не ждал других, и начал кодить ).
Please let me know when the blocking tasks are done, or if I should proceed with a self-contained implementation.
Кто помнит мой древний стрим, где я показывал chatdev, это вот прокачанная версия оного
P.S. В ближайшем потоке AI Productivity точно опробуем, поскольку это совершенно другой темп выполнения задач, и не только кодинговых.
AI-native инженерные команды: данные + кейсы
Год назад я писал, как в самом Anthropic используют Claude Code. Тогда это были кейсы отдельных команд, сейчас же есть больше данных и кейсов, разбираем:
1) Anthropic опубликовали исследование: - Самый частый use case: фикс багов и изучение незнакомой кодовой базы - Юзают Claude Code 60% рабочего времени, +50% в производительности (саморепортинг, не внешние замеры) - Вот это классно: 27% работы - это задачи, которые раньше просто не делались или из-за нехватки времени, или из за "недостаточного ROI". Карпатый тоже про это писал на днях как раз (см. ниже) - Вместо того, чтобы дергать коллег - особенно старших коллег - теперь задают вопросы Claude Code
2) OpenAI выпустили гайд, как строить AI-native инжиниринговые команды: - понравился фреймворк: Delegate → Review → Own —> AI делает драфты, люди - ревьюят и принимают решения, при этом опции/альтернативные решения может выдавать AI - чеклисты, как лучше стартовать внерение AI кодинг агентов для разных фаз: планирование, дизайн, кодинг, ревью, документирование, деплой и поддержка. Детально лучше посмотреть в самом гайде, но вчера Другу показывал, как подключать Claude Code к Figma, чтобы импортировать дизайн систему и по ней генерировать прототипы —> вышло очень даже найс.
3) Карпатый поделился полевыми заметками о сдвиге в использовании AI в декабре 25го (очень напоминает мои картинки тут): - за несколько недель он перешел от 80% ручного кода + 20% AI к 80% агенты + 20% его правки. Это самое большое изменение в его workflow за 20 лет программирования - модели еще делают ошибки, но теперь скорее не синтаксические, а концептуальные, делают предположения за вас и торопятся нагенерить код - поэтому важно держать ухо востро, planning режим, "dont code just yet" и тп инструкции, которые многие из нас уже изобрели и юзают - главный эффект - не ускорение, а то, что он делает вещи, которые раньше не стоило/было лень делать. Или к которым не подступился бы из-за нехватки знаний. - "feel the AGI" момент для него: как агент упорно бьется над задачей, не устает, не деморализуется, не посылает вас подальше и не выгорает. А просто продолжает пробовать и пробовать, там где человек давно бы сдался. Настоящий tinkerer :)
Но, есть и обратная сторона - недавно на звонке по корпоративному тренингу на эту же тему, лид спросил меня: не боюсь ли я что отупею (из за использования AI в кодинге)? Я не боюсь, но посоветовал тем, кто переживает, просто 3 недели писать с AI, и одну - без оного. Особенно, когда упираешься в лимиты 😉 Ну и ждем кодо-слопо-апокалипсиса, вангованного Карпатым, в 2026м - признаться, я активно в него контрибьютю, как вы могли заметить 🤡
В Claude Code появились встроенные агенты. Выглядит удобно, особенно что во время работы в стандартном режиме можно просто распределять задачи между агентами и не перезаписывать систем промпты + не мешать контекст
Как фаундеру делать контент без агентства?
Мы все знаем, что нужно делать SEO, писать статьи, thought leadership и всё такое.
Варианты: 1) Нанять SEO агентство → получаешь generic статьи "7 способов..." без твоего голоса 2) Нанять PR агентство → дорого, надо планировать созвоны, ждать пока они возьмут интервью, потом ждать контент
А что если третий вариант?
Сидишь на унитазе или уже почти засыпаешь, листая LinkedIn — и видишь статью, которая цепляет. Голос автора, подача, конкретика. И у тебя есть что сказать на эту тему из своего опыта.
Открываешь Claude Code (или любой агент, поддерживающий Agent Skills стандарт), говоришь: "вот статья которая мне нравится, у меня есть свои мысли по теме, давай сделаем свою"
И начинается интервью — как с PR агентством, но прямо сейчас: - "Какой у тебя опыт с этой темой?" - "Дай конкретные цифры" - "Что не получилось?"
При этом ты можешь параллельно попросить его: - Подтянуть данные из своей аналитики - Заресёрчить конкурентов - Проверить best practices - Залезть на сайт клиента за примером
Всё в моменте. Когда есть вдохновение и мысли — а не когда PR менеджер смог найти слот в календаре.
Сегодня оформил этот процесс в скилл: 1) Voice Calibration — показываешь статьи которые нравятся, он учится твоему стилю 2) Interview — вытаскивает твои истории и цифры 3) Drafting — пишет в твоём голосе 4) Refinement — итерируете вместе
Не обещаю, что это "взорвёт твой SEO". Но точно сделает проще достать свой голос наружу. А может и найти его — потому что первый шаг это показать, что тебе нравится.
P.S. Работает с любым агентом, поддерживающим Agent Skills стандарт — Claude Code это просто один из них.
--- Co-authored with Claude Code 🤖
Мы на занятии по ИИ со студентами с помощью ИИ (Composer внутри CursorAI) пишем систему, которая с помощью GPT 4o-mini будет фильтровать спам-сообщения в группах Телеграме с веб-интерфейсом, куда студенты смогут загружать свои промпты и проверять насколько хорошо они фильтруют спам, чтоб они закрепили навыки в prompt-engineering которые я им давал
So meta! :)
Сегодняшний апдейт лидерборда swe-rebench мне кажется одним из самых интересных за все время, по нескольким причинам:
1. Добавили целый ряд моделей: gpt-5.2, gpt-5.1-codex-max, Gemini 3 Pro, DeepSeek-v3.2, Devstral2. Все модели от openai теперь прогоняются через responses API с сохранением ризонинг блоков. И все модели по-своему интересны: – gpt-5.2 прыгнула на самый верх и теперь соревнуется с Sonnet/Opus 4.5. А главное посмотрите на кол-ве потраченных токенов в среднем на задачу – почти как gpt5-minimal. – gpt-5.1-codex-max сильно лучше gpt5-codex, но на фоне других моделей от openai не так уж выделяется. – Gemini 3 Pro – огромный скачок в агентских задачах по сравнению с 2.5 Pro. Оффтоп, но это моя любимая модель на текущий момент в бытовом пользовании, не могу народоваться фиче с нативной обработкой видео. – DeepSeek-v3.2 – новая сота в open-source, но также и сота по потреблению токенов 💀 – Devstral2 выглядит очень неплохо. Вроде как незаметный релиз от Mistral врывается в топ open-source моделей. – Не забывайте, что к ранжированию нужно относиться осторожно, задач не так много и доля случайности все еще большая, даже несмотря на усреднение по 5 ранам. Но общая картина думаю понятна хорошо. 2. Добавили Claude Code как reference сота агента 🎉 Режим запуска указан в инсайтах. 3. Для прозрачности Cost per Problem, добавили колонку Cached Tokens, как минимум для понимания, включен у модели кэшинг или нет.
привет, ребята!
я как-то писал, что принял гостевое участие на курсе по разработке с ИИ. и вот, недавно, мой блок "Продвинутая работа с Cursor" в этом курсе вышел 🙂
прежде чем залететь гостем, я отсмотрел почти все уроки, которые уже были на этом курсе, и на мой взгляд, это отличный материал для новичков: разобраны разные инструменты и сервисы, дана вся необходимая база, классные визуальные примеры, разработка учебных проектов, чат для участников с поддержкой, и так далее. если вы хотели вкатиться в разработку при помощи ИИ, и всё никак не доходили руки - это хороший способ начать.
собственно, почему я пишу сейчас: на степике Чёрная пятница, и на весь курс скидка в 25%.
⚡️ ссылочка вот: https://stepik.org/a/214391 ⚡️
P.S. если зацените - было бы интересно услышать ваш фидбек, тут или в лс. впервые залетел в обучающую историю
Ищу продакта-вайбкодера в наш AI проект!
Я писал, что мы уже много трафика льем на наш wellbeing app, но до сих пор никому его не показываем, потому что он пока слишком простенький.
Пора наконец сделать из него хороший продукт, поэтому мы ищем продакта-вайбкодера. Это гибридная роль: примерно на 30% продакт и на 70% разработчик (вайбкодер). Вам предстоит формировать продуктовые требования и самостоятельно реализовывать их через вайбкодинг.
Что надо делать:
- Разрабатывать продукт в Claude Code (мобильные и веб-приложения)
- Делать новые фичи и фиксить баги
- Формировать продуктовые требования
- Анализировать данные и поведение пользователей
- Интегрировать различные технические решения и внешние системы
- Работать в связке с Tech Lead, который отвечает за архитектуру (и тоже вайбкодит)
Требования к кандидату:
⁃ Опыт разработки IT-проектов от 3-х лет (в любой роли)
⁃ Не обязательно уметь писать код код руками. Но обязательно понимать, как работают алгоритмы, базы данных, API, JSON, SQL и прочие штуки
⁃ Хорошо, если в прошлом вы разработчик, но в этом проекте вам не надо будет писать код, только промпты
⁃ Очень желательно техническое образование. У нас слабость на физтехов, но в целом подойдет любой хороший технический универ
⁃ Это нормально, если вы чего-то из этого не умеете. Главное — голова на плечах, умение и желание учиться, и хорошая техническая база
Почему наша вакансия топ:
⁃ работа на острие технологий. Вы будете использовать самые современные решения и очень многому научитесь
⁃ ЗП в долларах, работа на зарубежном рынке, удаленка
⁃ работа в крутой команде
Откликнуться: https://airtable.com/appT9RFQxsaiPujLE/pagU0CB8E9YuWUYUJ/form
Новости Claude Code
Ultrathink no longer does anything. Thinking budget is now max by default
А какая красота была!
https://github.com/anthropics/claude-code/issues/18072
теперь значит так
// 1. Determine thinking budget let budgetTokens = 31999; // Default: max
if (process.env.MAX_THINKING_TOKENS) { budgetTokens = parseInt(process.env.MAX_THINKING_TOKENS); }
// 2. Auto-enabled for supported models const thinkingEnabled = isSupportedModel(model); // Opus 4.5, Sonnet 4/4.5, Haiku 4.5, Opus 4
// 3. Passed to Anthropic API on every request await client.messages.create({ model: "claude-sonnet-4-...", messages: [...], thinking: thinkingEnabled ? { type: "enabled", budget_tokens: budgetTokens // ← 31,999 by default } : undefined });
и, кстати, можно попробовать дать максимальный бюджет для размышлений
export MAX_THINKING_TOKENS=63999
Как предприниматели используют AI?
Продолжаем серию постов по мотивам Anthropic Interviewer - теперь о том, как и для чего владельцы бизнеса юзают AI: таких было 52, так что дажее более репрезентативно, чем было с сейлзами и продактами. Вот 10 главных кейсов с цитатами владельцев очень разнообразных малых бизнесов: 1. Контент для соцсетей - тут все понятно :) Владелец кофейни: "Ненавижу придумывать подписи к постам. Скармливаю AI примеры, которые мне нравятся, и прошу сделать похожее под наш продукт."
2. Брейнштормы - помните пост про то, как обстукивать идеи об AI? Etsy-предприниматель: "Идеи, которые выдаёт Gemini, мне бы и во сне не приснились — настолько они неожиданные и продуманные."
3. Email и деловая переписка - угу Владелец реставрационного бизнеса: "AI генерирует первый драфт, я добавляю личный touch, потом прошу проверить ещё раз."
4. Замена команды Кейтеринг-предприниматель: "AI заменяет мне потребность в большой команде — особенно в областях, где у меня понимание есть, а экспертизы нет."
На эту тему, кстати, еще на днях Sam Schillace интересно поразмышлял как раз в контексте числа Данбара, я еще напишу пост
5. Расчёты и учёт - писал про вайб-аналитику тут как раз Ювелирный дизайнер: "AI генерирует скрипты для обработки таблиц и бухгалтерии. То, на что уходили часы, теперь — минуты."
6. Подготовка к сложным разговорам - писал, как я это делаю тут, и вот тут выкладывал промпты для ролевых игр фаундера Владелец малого бизнеса: "Репетирую через AI разговоры с сотрудниками. Прошу взять роль работника и отвечать как он. Это позволяет подготовиться к неожиданным поворотам."
7. SEO и листинги - в помощь ghostwriter скилл E-commerce владелец: "Добавляю столько товаров, что идеи для описаний закончились. AI — единственный способ не выгореть."
8. Техническая помощь - я сам на днях чистил свой жесткий диск от лишнего с помощью Claude Code, так как не захотелось платить CleanMyMac Tech-консультант: "AI не источник уникального вдохновения для создания продукта с нуля. Но для написания CSS — пожалуйста!"
9. Проверка информации Владелец ethical fashion бренда: "Постоянно перепроверяю факты. Однажды AI придумал несуществующий вид плесени — 'Mustard Gas Mold'."
10. Редактирование фото Дизайнер настольных игр: "Использую AI для удаления пыли и дефектов на фото товаров. Экономит от пересъёмки."
--- И еще пара цитат про то, чего мы они AI не доверяют
Владелец дизайн-бюро: "Это как иметь младшего офис-ассистента. Я никогда не делегирую задачу целиком."
Ювелирный дизайнер: "Я хочу AI только для скучных, нерадостных задач — освободить время для важного."
Владелец киоска с мороженым: "Никогда не хочу зависеть от AI настолько, чтобы не смочь вести бизнес без него." ---
Для меня многое перекликается, как видно по количеству ссылок на мои посты - а для вас?
P.S. Кстати, в субботу стартуем 3й поток AI Founder, где будем учиться многое из вышеперечисленного делать эффективнее с помощью AI
Прилетел в Сан-Франциско. Последний раз был тут в 2019. Очень многое изменилось с тех пор, конечно.
- Энергия бурлит! OpenAI, Anthropic, Cursor, Google — все тут. AI-компаний больше, чем когда бы то ни было. В старых зданиях когда-то были склады и заводы, потом офисы корпораций типа Oracle, а теперь молодые и бордые AI-стартапы. - Поговорил с людьми буквально несколько дней, вдохновился, стало кристально понятно, что дальше делать с нашими компаниями. Магия! Осталось сделать. - Ремоут закончился: стандартное ожидание теперь в том, чтобы ходить в офис минимум 3 дня в неделю. Людей повсюду толпы, в кофейни и рестораны очереди. На набережных и в парках не протолкнуться от бегунов. - Город «разговаривает» с тобой про AI: кажется, что почти вся наружная реклама тут — AI-стартапы. Биллборды, остановки, троллейбусы — все про AI. Ну то есть понятно, что это самое важное, что сейчас происходит. Прикольно видеть знакомых: Nebius, Clickhouse, привет! Местные жалуются, что от работы не спрятаться ну вообще нигде. - Как сказал знакомый: тут ты только спишь, работаешь и занимаешься спортом. Больше делать особо нечего. - Погода на меня влияет сильно. Как-то намного приятнее работается и спортом занимается, когда вокруг солнце, сухо и тепло. - Селф-драйвинг уже настолько обыденная реальность, что даже писать об этом неловко. Очень быстро привыкаешь и перестаёшь удивляться. Роботакси стоит дороже обычного, потому что комфортнее и безопаснее. И люди охотно готовы платить. - Тост с авокадо и чашка кофе стоят $26 (с налогами и чаевыми). Проехать 20 мин на арендованном электро-самокате — $12. Дорого быть AI-стартапером.
А вот и запись встречи про Clawdbot подоспела - enjoy!
00:00 — Введение 03:53 — Что такое Clawdbot, демонстрация его работы 34:06 — Claude Code vs OpenClaw: ключевые отличия 42:46 — Система памяти: как Сlawdbot удерживает контекст 01:06:44 — Ограничения, риски и как с ними работать 01:29:03 — Итоги и следующие шаги
https://youtu.be/XDfh3_1q30U
Если вам некомфортно в Claude Code работать с кодом в терминале (я вижу, что многих это останавливает от перехода на CLI-агенты), то попробуйте включить auto-connect to IDE в настройках.
Появится и diff в IDE и проброс ошибок. СС начнёт понимать контекст открытых файлов и выделенных строк. Почти всё, что нужно.
gm! Еще одно дополнение по обновлениям Claude.
Они выпустили бета версию Chrome Remote Control и теперь задача на парсинг сайтов с Cloudflare / другой капчей решается так же за один промпт в Claude Code.
https://claude.ai/chrome
к примеру, можно парсить https://jup.ag/portfolio для информации о состоянии кошельков по всем DeFi платформам или любые другие сайты без доступного API
Claude, Codex и Gemini CLI заходят в бар...
На выходных работал с дружбанами над качеством принимаемых нами решений и сделал небольшую утилиту, которая в лучших традициях мульти-модельного мышления делает следующее: 1) На стриме я говорил, что codex зачастую ревьюит работу claude code, и наоборот. И что я делаю это руками - копипастю одно другому, и так пока не устану дойдем до совершенства
2) Собственно это и решил автоматизировать —> вместо того, чтобы самому переключаться между CC/codex/gemini cli решил скоординировать их - пусть сами обсуждают задачу и приходят к консенсусу. Убрал человека из уравнения ахахах
3) сделал 3 режима: - Deliberation: один агент генерит, другой ревьюит. Итерируют, пока не договорятся. - Council: все отвечают параллельно, потом анонимно оценивают ответы друг друга, председатель синтезирует. Похоже на Карпатовский llm council - Debate: два агента спорят (аргументы за/против), а судья - 3я модель - выносит вердикт.
Эдакое новое прочтение rubber duck debugging —> "уточек" три и они спорят между собой.
В аттаче скриншоты с примером работы —> помогло лучше спланировать архитектуру и MVP для одного проекта .
К чему я это? Как я говорил на стриме, у каждой модели свой характер, свои сильные и слабые стороны, и поэтому "триангулировать" между ними порой очень полезно.
Поэтому рекомендую брать на вооружение 🤖🤖🤖
P.S. Открыл набор на 2ю когорту AI Productivity - там мы на 4й встрече как раз разбираем принцип мульти-модельного мышления
Вчера было несколько вопросов в разрезе "а что с Курсором не так" Если кратко - то все так. Курсор - прекрасный инструмент который позволяет вам получить много-за-дешево.
И это как раз иллюстрация к моему вчерашнему тезису - он ощущается после моих экспериментов как локальный оптимум - т.е. вот до определенного объема задач и проектов он ок, а потом очень быстро становится "бесполезным" замирая на уровне автокомплита + правок в два три файла
Однако у меня есть убеждение, что с развитием и удешевлением агентов этот локальный оптимум перестанет иметь ценность, потому что им будут пользоваться все. "НО В КУРСОРЕ ЖЕ ЕСТЬ АГЕНТЫ", скажете вы. Да, и я за ними слежу. К сожалению, они применяют тот же подход что и остальные АИ-"эндпойнты" курсора, очень агрессивно оптимизируя размер контекста/эмбеддингов которые передаются, что приводит к тому, что опять же даже на средних проектах курсор становится бесполезным
Я сам начинал с курсора
поизучал чуть глубже debug-режим. на первом скрине - примерное краткое содержание системного промпта debug-режима на русском.
агент генерирует гипотезы багов, и прокидывает прямо в ваш код debug-логи через ndjson-сервачок. он пишет вам список шагов, которые надо выполнить, чтобы воспроизвести ошибку.
когда вы выполняете шаги (или он делает это сам через browser tool / terminal), то все дебаг логи летят сразу в контекст агенту, и он таким образом может проверять свои гипотезы.
бегло потестил - очень понравилось как работает, тот же Opus генерировал весьма адекватные гипотезы багов и быстро их самостоятельно тестил.
кайф 🙂
Инсайты от Claude Code
Вы же уже запустили /insights в последней версии Claude Code? По целям и подходу очень напоминает мой Claude Reflect - улучшать ваш опыт работы с CC через анализ ваших разговоров с ним.
Поскольку в понедельник я буду на митапе в Сиэттле рассказывать про reflect, то как раз решил сравнить их —> мое, немного biased, мнение: 1) Оба анализируют вашу переписку с Claude Code, чтобы дать вам обратную связь о том, как вы с ним работаете и как могли бы улучшить вашу работу.
2) Insights более дискретный имхо - за раз анализируют сразу все, claude reflect - более гранулярный (per repo), continuous, работает по ходу дела. Мне показалось, что /insights отдает слишком большое внимание недавним кейсам - см аттач по кейсу, что был вчера - и меньше ловит в моменте: /claude-reflect же наоборот - ловит ваши исправления в моменте
3) Оба советуют скиллы, которые можно создать и инструкции, что можно добавить в claude.md. Интересно, что пока /insights не предлагает прямо редактировать claude.md и сразу создавать скиллы, а просто выплевывает отчет; в то время, что как раз это делает reflect. И следит за тем, чтобы claude.md не разрастался
4) Наверное, обобщить разницу можно так: /insights скорее отвечает на вопрос "что произошло", а reflect - что надо изменить. То есть круг замыкается в действие, а не просто инсайты. Но, я думаю, это они тоже сделают :)
Если вы используете оба, то буду рад за обратную связь - поможет мне сделать доклад адекватнее