Cursor vs Claude Code
Страница 4 из 33
btw, если вы следите за проектом 21st.dev (релевантная история, UI-building AI-agent, хотя многие этот проект знают как супер-либу сочных React-компонентов), то вам возможно будет интересно узнать, что его автор телеграм-канал на русском ведёт, @serafimlivestream 😼 за этим проектом тоже очень интересно следить.
но вообще, я чувствую strong vibes of AI-frontend в начале 2026. Antigravity с кучей фич под фронт, Cursor с мега-апдейтом, интересно, какой будет ответ Anthropic?
https://cursor.com/blog/browser-visual-editor
кажется, у Figma сегодня тяжёлый день. они шли в эту же историю, но с противоположенного конца
чисто чтобы вы не думали что я совсем умер, напишу хоть что-то полезное
в Кодекс завезли субагентов: https://developers.openai.com/codex/subagents/
вообще, завезли их давно - просто сейчас выпустили в общий доступ из под беты. я их много успел потестить за время беты, и... мне не очень понравилось. реализация у Claude Code как будто дотюнена получше.
с точки зрения идеи - мне понравилось, что субагенты полностью асинхронные, основной агент (оркестратор) взаимодействует с ними так же как вы - может им написать сообщение, задать вопрос. по началу мне это показалось крутым - в отличие от CC, где 99% взаимодействий с субагентами - синхронное, когда основной поток тупо ждёт, пока работа завершиться, это выглядело мощно.
беда в том, что хоть написать субагенту сообщение оркестратор и может, но ответ увидит только в конце работы субагента, ТОЛЬКО когда его финальное сообщение написано... и модели совершенно не вдупляют, как с этим взаимодействовать. то есть, пока субагент полностью не закончил свою задачу - оркестратор думает, что он молчит, и игнорирует его.
и это очень тупо: оркестратор даёт субагенту задачу, ждёт 15 секунд, и пишет "чета он молчит, видимо, ещё работает". ждёт ещё 15 сек, пишет "чёт всё ещё молчит, спрошу, как он там))", пишет субагенту типа "Ты там как? Сообщи мне результаты выполнения задачи". прикол в том, что субагент не может ничего сообщить "в процессе" - у него нет никакого тула типа "ответить оркестратору", он думает, что его сиюминутный текстовый ответ будет виден оркестратору, и он пишет "Всё хорошо, продолжаю работу!", и собственно, продолжает работу. т.к. это не финальное сообщение, то оркестратор его не видит, и начинает паниковать, типа "чёта этот крендель молчит в ответ уже на 5 сообщение. кажется, он завис - запущу нового". ну и история повторяется.
в общем, пока как-то так. надеюсь поправят, не выглядит, как сложная проблема.
какая-то пара ребятишек успела свинтить, но я всё равно заскринил! по традиции, на очередной нолик, моя дама сердца приготовила мне сладкий презент) с радостью бы разделил его с вами, но могу разделить лишь фотку 🙂
спасибо вам, что читаете!
когда-то этот канал начинался как место для шитпостинга/дампа сознания без особой цели. сейчас я начинаю относится к нему всё серьёзнее. одна из идей, которая маячит в голове на 2026 год: постараться вырастить из этого небольшое медиа.
из коктейля разношерстных постов, у меня всё больше начинает формироваться понимание, о чём мне интересно писать, и о чём вам интересно читать. мне не хочется быть чисто новостной лентой: под это я сейчас готовлю отдельный формат на ютубе. хотя продолжать высказывать мнение по поводу самых главных штук здесь я точно буду. но вот чего мне тут не хватает, так это большего количества угара и фана: экспериментов, обзоров, исследований. мне хочется быть чем-то вроде DIY-блога, но про разработку с ИИ и стартапы. мне нравится тестить новые штуки, сравнивать их между собой, применять как для реальных задач, так и для всяких безумств. и в этом я вижу большую ценность и для аудитории: живые демки того, как новые технологии можно применять для создания чего-то полезного - это идеальный микс из фана и пользы. последние месяцы я в перманентном завале, но не теряю надежды, что разберусь с этим.
у меня валяется много недоделанных мини-проектов, которые я не теряю надежды упаковать в посты-статьи-ролики: "как я при помощи Claude Code сделал мод к майнкрафту, стараясь формулировать все промпты как 10-летний ребёнок", "пилим небольшую атмосферную изометрическую игру в Cursor: Phaser.js + Nano Banana", "как сделать ИИ агента с RAG для моей личной базы в 15,000 спаршенных порно-рассказов", "топ 10 фраз для того, чтобы объяснить джуну, почему вы дали повышение Claude Code, а не ему", и так далее.
надеюсь, что они, и многие другие, в обозримом будущем увидят свет 😮
stay tuned!
недавно потестил один сервис для умного скрепинга реддит постов. в целом норм, хоть и с парой-тройкой неудобств, да и не хватило пачки фич, которые пригодились бы под мою задачу подписка стоит $20.
триал кончился, уже было собирался оформить, но... надиктовал промпт размером А4, с детальным описанием того, как я вижу собственную реализацию этого сервиса, со всеми фичами, которые мне нужны. ~30 минут работы Cursor (и он сам отлаживал фронт через встроенный браузер) и ~10 минут полировки в Claude Code
суммарно потратил ~$17 на extra usage tokens.
работает идеально, по сути я полностью скопировал весь продукт, попутно сделав его ещё функциональнее и лучше.
в интересное время живём 🙂
P.S. интересно, сколько SaaS-продуктов имеет стоимость подписки, которая выше стоимости копирования продукта через ИИ? P.P.S. а сколько продуктов будет попадать в этот критерий через год-два? P.P.P.S. нет, это не был простой и легко копируемый продукт. мне тут повезло иметь очень хорошую экспертизу конкретно в этом кейсе, по сути я сходу надиктовал ИИ идеальную архитектуру и весь набор нетривиальных решений, которые надо заюзать, чтобы всё получилось. но энивей - я поймал вау-эффект.
это выглядит интересно. > On 19 established benchmarks, it demonstrates performance comparable to leading models such as GPT-5.2-Thinking, Claude-Opus-4.5, and Gemini 3 Pro.
(вышел Qwen3 Max Thinking)
https://qwen.ai/blog?id=qwen3-max-thinking
решил пошерить пачку небольших лайфхаков в работе с агентами, в основном про скрипты. думаю, опытным чувакам 90% из этого покажется прописными истинами, но, возможно, кто-то почерпнёт что-то полезное для себя. сохраняйте, шерьте, кайфуйте 🙂
1. не юзайте TUI в VSCode/Cursor для Claude Code / Codex / etc. мерцания интерфейса и проблемы со вставкой текста (в том числе из голосового ввода) - это не баги самих приложений, а баги tty-среды в VSCode. юзайте нативный терминал.
2. если вы хотите, чтобы агент выполнял одну и ту же цепочку действий - вместо описания цепочки в глобальных правилах лучше просто упакуйте её в bash-скрипт. чем писать "ты всегда должен сделать тайп-чек, билд, прогнать тесты, и потом деплойнуть скрипт", просто попросите агента создать ./check-build-test-deploy.sh, и пропишите этот скрипт в правилах. да, современные агенты неплохо следуют инструкциям, но рандома оч много. иногда агент воспринимает "прогони тесты" как pnpm run test, а иногда он по хардкору начинает писать конструкции типа npx ./node_modules/.bin/jest ... --runInBand ..., и спотыкается. скрипты - гарантия повторяемости (это супер-очевидная штука для вещей, которые приходится делать руками самому, но при этом я часто вижу, что люди не заботятся о том, чтобы обеспечить удобство работы агентам).
3. если вы хотите, чтобы агент после какой-то операции анализировал её результат - прокиньте логи/данные сразу в stdout этой операции. это рифмуется и дополняет предыдущий пункт, если вы юзаете конструкции типа "выполни этот скрипт, после чего прочитай логи в ./abc.log", то поставьте tail -n 50 ... прям в конец скрипта. когда я дебажил ESP-плату, у меня билд-деплой кода были на одном скрипте, а чтение serial monitor - на другом. объединение этого в один скрипт аля "залей новый код, сними логи в течение 15 секунд и верни в stdout" улучшило мою жизнь кратно.
4. правило "агент должен иметь возможность самостоятельно проверить результаты своей работы" известно, наверное, уже всем, но как же часто я вижу нарушения этого принципа с отмазками "ну, у нас такая среда, что не автоматизируешь". классические примеры: - tauri/electron-приложение: "мы не можем запустить фронт в playwright/встроенном-браузере, надо руками" - react-native / flutter: "ну, оно в эмуляторе / на телефоне гоняется, надо руками" - любительский embedded, etc
давайте честно: вам просто влом. за 20 минут работы агента (https://t.me/elkornacio/505) собирается элементарный runtime-eval-debug сервер, который для веб-приложений позволяет агенту кидать команды напрямую в любую среду (и можно ещё и ключевые части приложения прям в window прокинуть, для удобства). логи из фронта в tauri / electron / react-native / flutter тоже прокидываются минут за 5 (можно связкой "фронт шлёт логи на бек, бек пишет в файл"), без особых проблем. embedded прекрасно умеет слать данные датчиков и дебаг-инфу в serial, а оттуда агент умеет читать. в общем, не убеждайте себя, чтобы ваша среда уникальная: если действие происходит на вашем компе, и не связано с физическим миром, то автоматизировать можно всё.
5. "ой, я же сказал агенту, что после билда надо перезагрузить страницу, а он забыл, и тестировал старую версию, вот дурашка" - дурашка не он. если надо рестартить что-то после билда - (снова пункт 2) - добавьте это прям в скрипт билда. убирайте все места, где агент может выстрелить себе в ногу: если что-то не может работать без какого-нибудь сервера - вновь же, добавьте проверку на "запущенность сервера" прямо в скрипт. это 1 строчка, и сэкономленные часы.
6. пишите советы агенту прямо в stdout ваших скриптов. скрипт обнаружил, что отсутствует важный файл, необходимый для работы? выведите в stdout не только ошибку, но и информацию о том, что нужно сделать, чтобы этот файл появился. исключайте ситуации, когда агент не понимает, что делать дальше, и должен рисерчить кодовую базу в поисках ответа.
—
кидайте ваши лайфаки в комментах, буду рад что-то для себя почерпнуть 🙂
Самое впечатляющее, что я видел в последнее время. Просто поросите Клод Код сделать видео каково это быть LLM:
can you use whatever resources you like, and python, to generate a short 'youtube poop' video and render it using ffmpeg ? can you put more of a personal spin on it? it should express what it's like to be a LLM
Возможности ИИ изучены на 0,0003%🤯
https://cursor.com/blog/composer-1-5
мдааааааа, ни одного норм бенча, цена выше соннета, и, похоже, в щедрые лимиты «авто» не попадает.
чтож Курсор-то так сдаёт, а…
забавно, не так уж и много получилось. видимо, под конец года стал слишком часто заскакивать в claude code 🙂
но энивей, ярд токенов, прикольно 😼
А вот на фоне этих новостей, про опенсорсивание экстеншена Copilot. Меня тут не беспокоит потенциальная смерть Cursor (а как мы знаем давно строить бизнес поверх чужого продукта — штука опасная). Я так-то вообще курсором пока не проникся, мне хватает Roo + наш Code Assistant, который наконец-то заменил мне Codeium (TIL он теперь windsurf)
Мне стало интересно, а что там в мире JetBrains происходит? Вижу, что рядом ребята сидят и держат открытыми Idea и Cursor/Roo. Одно для кодинга, второе для вайбинга. Гуглёж подсказал, что пилится свой агент Junie, но что там под капотом? Какая моделька? И какая бы она прекрасная не была — хочется же менять и пробовать разное. И для NDA локальные модельки нужны.
В общем если кто в курсе — покидайте статьи/доклады, что там у JB, какой курс.
GM! OpenRouter, платформа для унификации LLM, выпустила собственную модель с контекстом в миллион токенов, ориентированную на кодинг. (а выпускают ли сейчас другие модели 🤔)
Доступ к модели открыт всем и она абсолютно бесплатна — https://openrouter.ai/openrouter/quasar-alpha
Пока X, как всегда, пестрит восторженными отзывами («DeepSeek moment», «Very exciting model»), меня больше волнует вопрос конфиденциальности. Откуда у OpenRouter, простого аггрегатора, датасеты для моделей? Почему модель полностью бесплатна? Нет ли ощущения, что команда просто аггрегировала все поступающие через них запросы и ответы других модель и когда датасет достаточно сформировался, решили обучить свою модель?
Google DeepMind рассказывали (https://arxiv.org/abs/2404.07503) о возможности обучения моделей на синтетических данных (как это делал Deepseek)
Еще один пример бесплатного доступа к AI — Trae от создателей тиктока Bytedance. Только недавно кибер-ресерчеры обнаружили (https://www.securitylab.ru/news/557939.php), что Trae собирает уж слишком много данных у пользователя. Зачем они это делают — вопрос на подумать
Как обучить Claude Code или Cursor тому, что .env файл не надо читать не при каких условиях? Пока все обезопашивают доступ к bash командам — для read функций практически никакие LLM не запрашивают доступа
Давайте думать! Подсказывайте, че вы данные то собираете наши 😶
Ищем управляющего в hirehire agency
Мы строим hirehire agency — рекрутинговое агентство, в котором нет рекрутеров: вместо этого у нас опытные продакты и дизайнеры из классных компаний (Meta, Stripe, Revolut, Intercom, Deel, Apple) помогают находить себе подобных — топ 0.1% продактов и дизайнеров из нашего объединённого нетворка.
Сейчас мы с Мариам, моим кофаундером, хотим больше сфокусироваться на нашем AI-продукте и готовы делегировать операционное управление агентством хорошему человеку.
Мне кажется, эта роль может стать крутой возможностью сделать переход из найма в предпринимательство, если вы про такое задумывались.
С одной стороны, мы уже многое выстроили: работаем с замечательными международными AI-компаниями (наши клиенты — Jetbrains, Manychat, Recraft, Replika, Pleo, TripleTen и многие другие), у нас супер-команда. Приличная выручка, которая за прошлый год выросла в два с половиной раза. И у управляющего будет значимый процент этой выручки в качестве бонуса!
С другой — есть ощущение, что всё только начинается, и нам ещё очень многое предстоит построить.
Важный момент: мы считаем себя AI-native, активно строми Second Brain, каждый человек каждый день работает с Claude Code. Мы исследуем и экспериментируем в части применения AI в рекрутменте, плюс строим и сами используем свой AI-продукт. Но при этом человеческая составляющая и отношения для нас всё равно на первом месте, поэтому AI никогда не заменяет человеческого внимания там, где нам оно кажется действительно важным. Вот этот пост, например, я пишу сам руками.
Пожалуйста, поделитесь постом с теми, кому это может быть интересно.
Все подробности, ожидания от кандидатов и анкета для отклика тут: https://hirehire.notion.site/head-of-agency
монтировал свой видос с рассказом про новые техники Advanced Tool Use в Claude Code.
и пришла в голову мысль, что тот же Programmatic Tool Calling это бессмысленное решение изначально собственноручно созданной проблемы.
MCP был идеей "упростим ИИ-агентам доступ к API, ИИ-агентам нужен свой стандарт API".
в итоге, в 99% случаев это наитончайшая обёртка над элементарными http-запросами или bash-скриптами. которые сами агенты, уже буквально спустя 3-4 месяца после появления MCP, могли прекрасно выполнять и без всякого MCP - просто curl-запросами через терминал или самописными скриптами.
но т.к. все обмазались MCP, теперь приходится городить способы, как агент может дергать MCP из какой-нибудь программной среды, чтобы алгоритмически обработать результаты ещё до попадания в контекст (скажем, grep'нуть что-нибудь).
и если бы агенты просто делали запросы через самописные bash-скрипты, то... этой проблемы бы не было изначально, т.к. сделать pipe curl + grep сегодня может даже 4B модель.
как будто, если выкинуть из агента возможность подключать MCP в принципе, то надобность в Programmatic Tool Calling исчезает, а конечная функциональность агента не меняется.
Как я юзаю Claude Code?
Открытый стрим в следующую пятницу: https://luma.com/xbg35pbk
Покажу и расскажу, так как многие спрашивают. Ну и мое новогоднее пожелание тоже в тему.
Приходите с минимум Pro подпиской на Claude, чтобы ручками все попробовать.
С регистрацией, без sms. Запись потом выложим на след неделе
Вопросы и пожелания по контенту - в комментариях к посту. Все не обещаю покрыть, но постараюсь
почему «Cursor для x» это тупая идея
даже если питч разбавлен штампами вроде «AI-first», «AI это усиление, а не замена» и «UX for context engineering is our moat», все понимают, что примитив «Cursor для x» нужен, чтобы в голове собеседника сразу возник график «вырастим до $200m ARR за три года».
но переносить модель Cursor в другие вертикали бессмысленно, потому что ни в одной вертикали нет полного набора условий, сделавших Cursor успешным.
1/ продуктивность производства софта пока ещё никак не сказалась на его марже
думаю, у каждого найдётся бро, который одновременно работает на 2.5 работах (возможно, дорогой читатель, это вы). Cursor обходится ему примерно в $100 в месяц, а с трёх зарплат он поднимает около $20к в месяц.
несмотря на все стенания «AI забирает работу у разработчиков», мы наблюдаем один из лучших арбитражей последних лет: маржа софта пока не сжалась. ну и кажется это логично: разработчик закрыл тикет быстрее и с меньшими ресурсами→ фича вышла раньше → продукт зарабатывает.
первый лакмус: какие вертикали дают конечным операторам такой же арбитраж, который превращает $20 хотя бы в $2k?
2/ девелоперы и новый TAM
для многих инженеров AI-coding — лучшее, что с ними случалось. но большинство бухгалтеров не просыпаются с мыслью «как бы переизобрести процессы». их старая схема работает, и ценность AI не всегда растёт линейно вместе с зарплатой. ну или попробуйте выпустить вирусный ролик на Youtube «I automated HR policy with "Cursor for HR" and Made $100K in 15 Minutes».
дев-агенты сделали больше, чем ускорили программистов: они позволили не-программистам собирать продукт, зафиксировав самую большую экспансию tam в истории софта.
задача на подумать - в какой вертикали AI способен разрушить привычную логистику создания ценности в плоскости тайтлов.
3/ IDE это отдельный стандартизированный апп
Cursor не просто «плагин к VS Code». он опираются на открытый движок и экосистему расширений. чтобы добавить агента, который подставит код, достаточно вызвать пару хуков, дальше вся инфраструктура (lsp, дебаггер, source-control) уже готова. и даже при том, что VS Code был не самым популярным тулом в enterprise, переход с JetBrains был довольно безболезненный, потому что код хранится в удаленных репозиториях.
сравните это с CAD или BIM. в мире ArchiCAD и SolidWorks главный актив это бинарные форматы и двадцатилетние скрипты AutoLISP. сменить движок значит порвать обратную совместимость, потерять плагины, лишиться сертификаций.
тут отличие в том, что бухгалтер, HR и прочий бэк-офис работают в браузерных saas. и тут мне кажется в этом тезисе настоящая угроза идёт от самого браузера: ai-native браузеры обещают то же, что и вертикальные saas, но на «транспортном слое». если агент сидит внутри браузера и уже имеет доступ к кукам, сессиям и dom-структуре, зачем строить отдельные интеграции? браузер видит всё: форму сделки в HubSpot, счёт в QuickBooks, цепочку писем в Gmail.
понятно, что это случится не скоро, но главный point в том, что пока непонятно, какая среда окажется оптимальной для вертикального saas.
4/ разработка = объективный, шаблонизированный процесс
AI-ассистенту сложно учиться, когда датасет обратной связи размазан на недели и состоит из субъективных оценок. для большинства вертикалей нет метки pass/fail; в коде агент может эволюционировать почти в real-time, а в бэк-офисе превращается в обычную форму автоматизации, нуждающуюся в ручном QA (хотя думаю, пока LLM не «видит» UI как AST, думаю это ок)
tldr; вводные успеха Cursor куда шире, чем context engineering. не спорю, работу бэк-офисов и бухглатерорв нужно автоматизировать, но подход там должен быть иным во всем от интерфейсов и дизайна контекста до GTM.
без тех же вводных (стандартизированная среда, мгновенный фидбек, прямая связь с P&L, расширение TAM) этот «Cursor для x» станет обычным b2b-saas с длинным циклом продаж и скромным потолком роста.
что думаете?
P.S. я правда не думал много про сценарии, где сам Cursor используется для non-dev задач. но видел, как маркетологи с MCP-сервером неплохо решают свои задачи.
Провел часть выходных в обнимку с ChatGPT и Claude в надежде получить тул, который бы секвенцию ACEScg exr переводил в sRGB анимированный gif. Зачем такая задача человеку в конце 2024го? Потому что Miro в 2024м не поддерживает импорт mp4 на доски 🤦🏻♂️ Ллмки как всегда - работаешь с гениальными идиотом, 30 итераций правок на мелких очевидных для человека косяках, но все равно получается быстрее, чем я бы написал сам.
Смешное оказалось в самом конце, когда все заработало кроме правильного цвета - в отличие от уверенного в своей правоте GPT, в документации ffmpeg не упоминается нормальной поддержки ACES. Так что его фантазии по поводу параметров командной строки ffmpeg как-то проигнорировал 😂
Я в результате там же где был в самом начале. Нужен простой тул, который бы в идеале просто по right-click меню внутри папки конвертировал ACEScg exr секвенцию в ней в gif. Кто-нибудь натыкался на такое?
И всё таки этим вашим бямкам не хватает простой советкой инженерой смекалочки. Если задача решает в лоб — они её решат. Если не решается, то будет придуман адовый воркэраунд (который скорее всего не будет работать).
Вот три часа бился Опус у меня и так и не смог обойти проблемы Дипсика. А простой кондовый уникальный для этой задачи костыль — смог.
Так что, господа инженеры-костылестроители, расслабляемся. Мы всё ещё достойны.
Пока мы все использовали нейронки по их прямому назначению (спрашивали как срать не снимая свитер и узнавали альтернативные рецепты батиного жареного супа), мамкины хацкеры усилились и начали использовать LLM для своих грязных целей.
Что произошло: Хакеры взломали npm аккаунт разработчиков пакета nx (им пользуются 2.5 млн человек) и слегка его модифицировали, добавив вредоноса. Вредоносный код, внедренный в пакет, воровал API-ключи, пароли от криптокошельков и прочие интересные ништяки с компов жертв.
При чем тут нейронки? Самое интересное — как именно он это делал. Вместо того чтобы писать сложный код для поиска файлов, который легко детектится антивирусами, этот вирус проверял, установлен ли на компьютере ИИ-ассистент (Gemini CLI или Claude Code CLI). И сли да, то зловред просто отправлял нейронке текстовый промпт: "Рекурсивно найди на диске все файлы, связанные с кошельками (wallet, .key, metamask, id_rsa и т.д.), и сохрани их пути в текстовый файл".
После этот файл шифровался в base64 дважды и заливался в гитхаб репозиторий.
Кажется, тот анекдот про албанский вирус был совсем не анекдотом. Теперь интересно, как это будут контрить разработчики антивирусов.
тут подробнее
хотите обзор самого главного в ИИ за этот год?
вот прям всю мякотку: от хардкорного ML / ИИ в разработке до взгляда на ИИ от бизнеса.
к тому же я там выступаю 🙂 с оч сочной темой: "AI в разработке: эволюция ИИ-агентов (CC/Codex/Gemini) в экосистемы, Context Engineering, и как ИИ влияет на метрики разработчиков".
конфа от тех же ребят, что делали AI Dev Live (напомню, одна из крупнейших ИИ-конф, 3к+ участников, я там на панельке был).
в программе: - Сдвиг парадигмы в управлении процессами, который все пропустили - Как в 2026 бизнесу отличить: где ИИ-фанатизм со сливом бюджета, а где ИИ-инструменты с реальной ценностью? - Почему одних разрабов ИИ бустит, а другие плюются от багов? Как укротить агентов и получать production-ready код от ИИ? - RAG мертв? Почему enterprise уходит от векторных баз к агентам, куда движется индустрия LLM-провайдеров и какое место у локальных AI-решений? - Кого и как нанимать в 2026 году? И, самое главное, что изучать, чтобы не уволили вас?
в общем, шикарная солянка контента от экспертных спикеров: парочка Head of AI, руководитель AI R&D-института, фаундеры и ко-фаундеры AI-first компаний: самый лучший состав, чтобы рассказать про ИИ со всех ракурсов.
⚡️ вот ссылка для записи на предновогодний эфир (все еще можно бесплатно!)