Gemini vs Claude
Страница 20 из 29
🧠 Andrej Karpathy поделился мыслями про кодинг с AI после нескольких недель плотной работы с Claude Code
Главные наблюдения:
Переход произошел за недели. С ноября по декабрь соотношение изменилось с 80% ручного кода / 20% агентов на обратное. "Самое большое изменение в моем рабочем процессе за 20 лет программирования".
Агенты все еще ошибаются. Но ошибки изменились - теперь это не синтаксические ошибки, а концептуальные, как у торопливого джуна. Модели делают предположения вместо уточняющих вопросов, не показывают трейдоффы, усложняют код без необходимости. Напишут 1000 строк там, где хватило бы 100.
Неутомимость. "Feel the AGI moment" - смотреть как агент 30 минут бьется над проблемой и побеждает там, где человек давно бы сдался. Выносливость - узкое место в работе, и LLM его драматически расширяют.
Не ускорение, а расширение. Главный эффект не в том, что делаешь быстрее то же самое, а в том, что делаешь намного больше - код, который раньше не стоил усилий, и код, который раньше не мог написать.
Leverage. Не говори что делать - давай критерии успеха. Пусть сначала напишет тесты, потом пройдет их. Подключи к браузеру через MCP.
Программировать стало веселее. Рутина ушла, осталась креативная часть. Но навык писать код вручную начинает атрофироваться.
2026 год будет годом "slopacolypse" - слопа везде: на GitHub, arXiv, соцсетях. И годом, когда индустрия будет переваривать новые возможности.
🔗 Source: https://x.com/karpathy/status/2015883857489522876
#ai #coding #andrej_karpathy #claudecode
————————— Мысли Рвачева —————————
🔫 Делаем тикток для ИИ-агентов?
Сделай короткое абсурдно мем-видео в духе youtube poop и отрендери его через ffmpeg для вертикального формата. Используй любые ресурсы, которые сочтёшь нужными.
Видео должно от первого лица передавать, каково это быть ТОБОЙ — большой языковой моделью.
вопрос: Какое видео сделал Клод, а какое Кодекс?
вдохновлено: ・ слоп дельфина и кукушки ・ слоп от точек
Как мои AI-агенты работают, пока я сплю
(околотехнический пост, но без занудства)
Пока вы это читаете — агент на моём VPS читает задачу, правит код, гоняет команды, коммитит и пушит в GitHub. Дальше CI/CD делает своё: Vercel подхватывает пуш → билдит → деплоит, и я вижу привычное “Vercel Deployed ✅”
Я перепробовал кучу вариантов (и нашёл самый удобный)
Я реально пробовал всё: даже Termius (терминал) с телефона для подключения к серверу. Работает, но это не то: неудобно, контекст теряется, долго “руками”.
В итоге идеальный вариант для меня — Telegram: 1) надиктовал задачу голосом 2) агент на сервере сделал работу 3) мне прилетело уведомление/результат
И самое удобное: этого бота можно добавить в свою TG-группу (команду/проект), и уже там “накидывать” задачи голосом или текстом.
Моя связка • VPS (Ubuntu) — репозитории + агент • Claude Code (CLI) — работает прямо в кодовой базе • Telegram → Takopi — мой “пульт управления” всеми агентами
CI/CD (как у меня) • агент пушит в GitHub • агент мержит в main → Production Deploy Vercel • если надо — агент готовит миграции Supabase, дальше пайплайн/процесс их применяет
Агент у меня подключается по MCP к: • PostHog — воронки/ивенты/retention • Supabase — бд/схема/данные/миграции • DataForSEO — ключи/серпы/метрики для SEO (“сеошка” быстрее)
То есть это уже не просто “автокодинг”, а данные → решение → код → деплой.
Бонус: я ещё потестил Kimi (хайп на K2.5 + Agent Swarm)
Сейчас много шума вокруг Kimi K2.5 и их режима Agent / Agent Swarm — я тоже успел попробовать. Очень кайфовая штука для “быстрого ресёрча”: я просто закидываю сайты конкурентов, он сам проходит по страницам, выжимает структуру/фичи и помогает собрать полное ТЗ, как это повторить (что делать в продукте, какие экраны, какие флоу, что трекать). Дальше отправляю это агенту в работу.
Почему я вообще решил это написать
Понял, что многие даже не знают, что так можно. Мы с @kremenevskiy_inc показывали другу Диме, как он может “вайбкодить” аппку на React Native через Claude Code + Superwhisper. Вместо двух недель 1–2 дня — и он уже это использует и реально вышел в прод. Сначала это ощущается как “ну ок, прикольный чатик”. А потом понимаешь: это ускорение разработки и меньше рутины.
Что пилить следующим постом? (тык реакцию) 😱Кейс про маркетинг на песнях-подарках: как “сошёлся” за ~24 часа и что переделали за 7 дней в воронке. 🐳 Гайд “хочу себе так же”: мой сетап VPS → TG → GitHub → Vercel → Supabase + MCP (или готовый тул/шаблон). 🏆 Kimi K2.5 / Agent Swarm в деле: как я скармливаю сайты конкурентов и получаю ТЗ + где это реально помогает в разработке.
Anthropic объявили даты и города конференции Claude для разработчиков:
📍 Сан-Франциско — 6 мая 📍 Лондон — 19 мая 📍 Токио — 10 июня
Билеты распределяются по лотерее — регистрация уже открыта.
Такое пропускать нельзя.
Регистрация: https://claude.com/code-with-claude
————————— Мысли Рвачева —————————
status update
3 месяца ничего не писал. За это время от канала успело отписаться 50 человек, а я за это время подвыгореть, пройти перфоманс-ревью, слетать в отпуск и вернуться. Вот, что успело поменяться:
1️⃣ Первая классная новость, которой нельзя было делиться раньше: Стартап Pallie, в котором я помогаю с продуктовым дизайном и графикой с самого начала, зафандрайзил 2 ляма баксов на pre-seed стадии. Можно похвастаться, если не брать в расчет тот факт, что все «похожие» AI продукты типа ChatGPT, Claude, Grok, Cursor etc тотально убыточные, несмотря на популярность и охваты 😂. Ну, время покажет…
2️⃣ В какой-то момент работы в Плюсе я чуть-чуть приуныл от рутинных задач, но потом увидел возможность поработать над тем, чего хотел последние года полтора. А еще на первый квартал 2025 количество подписчиков Плюса перешагнуло за 40 лямов, что тоже как бы нихуя себе. Приятно делать массовые продукты и чесать свое раздутое эго.
3️⃣ Начал собирать новое портфолио. Все прожженые опытные дизайнеры знают, что когда не надо искать работу (а я пока не планирую) — этот процесс растягивается на годы. У меня на структуру и концепт главной ушло полгода. Каждый раз, когда я думаю о том, что надо бы еще пиздатые превьюхи анимированные сделать (а для этого надо AE вспомнить) и сверстать во фреймере — откладываю в долгий ящик.
Забавно, что мой старый портфель в ноушене из 2022 еще в те времена расфорсили, начали брать за эталон (лол) и показывать в качестве хорошего примера на карьерных консультациях. На сегодняшний день у него 33к просмотров. Может быть, баннер с рекламой казино туда поставить?
4️⃣ Яндекс оплатил мне курс по интерфейсным анимациям моего знакомого Дениса. Единичные обучающие материалы на эту тему застряли где-то между 2010 и 2013 за авторством каких-нибудь Баблу Кумаров (индусов, короче), а я хотел в этом качнуться, но не могу позволить себе месяцами осваивать АЕ вслепую. Курс я проходить еще не начал, так как надо по текущим задачам разгрузиться, но Денис прям эталонные штуки там делает.
Кажется, выдохнул, теперь можно и к постам в канал вернуться 🛌
А у вас что нового?
💤 Claude Code научился видеть сны
Звучит как шутка, но нет. В сообществе Claude Code обсуждают новую фичу — Auto Dream. Агент буквально «засыпает» и наводит порядок в своей памяти.
Оговорка: пока это больше похоже на research-фичу. Часть пользователей пишет, что команда у них не работает. Официального анонса от Anthropic не было. Но системный промпт уже нашли на GitHub, а механику разобрали в деталях.
Что это решает
Пару месяцев назад Claude Code получил Auto Memory — агент записывает заметки о проекте между сессиями: команды сборки, архитектурные решения, стиль кода. Но к 20-й сессии память превращается в кашу: устаревшие записи, противоречия, шум. Агент начинает работать хуже.
Auto Dream — это garbage collector для AI-памяти. Работает в 4 фазы:
→ Orient — сканирует что уже сохранено → Gather signal — сверяет память с реальным состоянием кода → Consolidate — мержит, убирает дубли, заменяет «вчера» на конкретные даты → Prune — чистит мёртвые ссылки и противоречия
Запускается в фоне, только после 24 часов + 5 сессий. Read-only по коду, пишет только в файлы памяти.
Почему это интересно
Аналогия с REM-сном — не просто маркетинг. Во время быстрого сна мозг делает ровно то же: прогоняет дневной опыт, выбрасывает мусор, укрепляет важное, разрешает противоречия. Мы буквально моделируем AI по образу нейробиологии.
Скептики справедливо замечают: если LLM решает, что важно, а что нет — он может удалить что-то критичное. И пока нет публичных eval'ов, подтверждающих реальное улучшение.
Source: https://www.youtube.com/watch?v=OnQ4BGN8B-s
#ai #claude #dev
————————— Мысли Рвачева —————————
В этом месяце я удивлялся дважды. Я имею в виду тот самый детский восторг лишающий сна. И вот сейчас пол второго. В глазах вдохновение спичками.
В первый раз это было с Claude Code. Два дня назад. Тогда пришло понимание, что вся рутина с организацией папок, чисткой загрузок и рабочего стола, с категоризацией всех заметок, ведение календарей и тд. Любого помошника, скрипт или софт, можно написать под себя буквально за час или сутки. Все это теперь базовый минимум, и делается голосом.
И два дня спустя, вот прямо сейчас. Монтаж внутри промпта и какое-то пугающе тонкое чувство эстетических предпочтений. Я о Seedance 2.0 (тут пока бесплатно)
И местами этот восторг даже немного пугает. Сидишь в темноте. Вводишь промпт. Через пару минут в комнату с тобой заходит и садится будущее. Смотрит на тебя. И ты понимаешь, что оно уже не уйдет 😃
🎁 Claude Code подкинул 3 Guest Passes для друзей
Если давно хотели попробовать Claude Code, но не хотели платить - можно попользоваться неделю бесплатно.
Забирайте: https://claude.ai/referral/HySElfM1cw
Просьба отпишитесь в комментах если заберете, чтобы другие знали сколько осталось.
#claude #claudecode #ai
————————— Мысли Рвачева —————————
📊 Anthropic обогнал OpenAI среди стартапов
Данные Mercury (банк для стартапов) по тратам клиентов на AI провайдеров.
Q4 2022: Anthropic ~22%, OpenAI ~78% Q4 2025: Anthropic ~52%, OpenAI ~48% Q1 2026: Anthropic ~67%, OpenAI ~33%
Тренд очевиден - новые стартапы все чаще выбирают Claude.
Claude Code и Opus 4.5 стали переломным моментом, а стартапы - самые быстрые в адаптации к новым инструментам.
#anthropic #openai #ai #startups
————————— Мысли Рвачева —————————
🔗 Claude Code теперь работает в Slack
Anthropic добавили интеграцию Claude Code со Slack. Теперь можно делегировать задачи по коду прямо из рабочего чата.
Как это работает: • Упоминаешь @Claude в Slack с задачей • Claude определяет что это про код и создаёт сессию Claude Code • Собирает контекст из переписки в канале/треде • Автоматически выбирает нужный репозиторий • Постит обновления статуса в тред • В конце — ссылка на сессию и готовый PR
Юзкейсы: • Баг репортят в Slack → сразу делегируешь Claude на исследование и фикс • Code review и небольшие фичи по фидбеку команды • Дебаг с контекстом из обсуждения
Пока в бета (research preview).
📹 x.com/claudeai/status/2018819905630634171
#claude #slack #ai
————————— Мысли Рвачева —————————
🤖 Anthropic рассказали в блоге, как заставить Claude писать код часами без присмотра - и чтобы результат не разваливался.
Проблема знакомая: даешь модели большую задачу, она работает полчаса, а потом начинает терять нить. Контекстное окно забивается, модель "забывает" что делала в начале. Плюс второй баг - модель не умеет критиковать свой код. Спрашиваешь "все ок?" - она отвечает "да, отлично", хотя половина не работает.
Решение - разделить работу на трех агентов. Один планирует (разворачивает "сделай мне дашборд" в детальную спецификацию). Второй пишет код спринтами. Третий - тестировщик - открывает приложение через браузер и проверяет как живой пользователь: кликает кнопки, заполняет формы, смотрит не сломалось ли что.
Ключевая идея украдена из GAN-ов (генеративно-состязательные сети): генератор создает, дискриминатор критикует. Научить отдельного агента быть скептиком оказалось намного проще, чем заставить автора критически смотреть на свою работу. Знакомо, да?
Сравнение на реальной задаче (ретро-игра): - Один агент: 20 минут, $9. Выглядит готово, но внутри все сломано. - Три агента: 6 часов, $200. Работающий продукт с отполированным интерфейсом.
С выходом Opus 4.6 часть обвязки удалось убрать - модель стала справляться сама. Авторы делают вывод: каждый компонент в harness - это костыль под конкретное ограничение модели. Новая модель вышла - пересмотри, что еще нужно, а что можно выкинуть.
https://www.anthropic.com/engineering/harness-design-long-running-apps
#anthropic #claude #ai #coding #agents
————————— Мысли Рвачева —————————
[5/5] Синдром Самозванца
Наконец короткий блиц тактических советов, что делать, если по тебе юнит-экономика расходится сейчас (советы актуальны до момента, когда AGI заменил людей на всех economically valuable jobs):
1. Конечно же продолжать читать мой блог
2. Много и фокусированно работать (книги "Deep Work", "Digital Minimalism")
3. Найти тех кто в чём-то лучше меня (по возможности, работать с такими бок о бок), быть в комнатах, где ты не самый умный – и изучать под микроскопом, как эти ребята принимают решения, как действуют, какие подходы используют, которые не используют ты? что они делают из того, что не делаешь ты? что они НЕ делают из того, что делаешь ты? где сокращают себе дорогу? В общем, не пренебрегай искать, спрашивать и анализировать, как другие до тебя решали подобные задачи
4. Перед тем, как что-то делать, хотя бы в самой грубой форме, пальцем в небо прикинуть математику / воронку / юнитку / аплифты. Сейчас, когда есть ChatGPT / Claude только ленивый не заберёт готовый ответ по теме, в которой он даже не шарит
5. Разобраться, что такое юнит-экономика и привить себе привычку постоянно её считать в любом сервисе / проекте, которыми занимаешься. Разобраться в методологии А/Б тестирования
6. Очень рекомендую из своего списка рекомендуемой литературы (кстати самый первый пост в блоге) прочитать "Цель", "Эссенциализм" и "High Output Management". Научиться мыслить теорией ограничений, воронками, боттлнеками и рычагами
7. Научиться не делать всё, что можно не делать (говорить "нет" / автоматизировать / делегировать). Избегать fake work, работы-ради-работы, иллюзии продуктивности, созвонов-ради-созвонов
8. Ставить амбициозные цели с точки зрения масштаба и сроков (как советует Илон Маск, чтобы я сам был уверен только на 50%, что мы её достигнем)
9. Всегда держи в голове конечную цель своей деятельности: будь тем каменщиком, которого если спросить "что делаешь?" ответит не "камни таскаю" или "деньги зарабатываю", а "строю дворец". Знать цель и видеть прогресс движения к ней – важный элемент внутренней целостности, которая сама по себе избавляет от синдрома самозванца (понимание к какому результату мы идём и как все наши вложения окупятся)
10. Помнить, что если у меня получилось, у тебя тоже получится
Пишите в комментариях, что бы вы дополнительно включили в список
И спасибо всем кто дочитал ❤️
[3/5] Cиндром Самозванца
Экстраполируя личный опыт, могу предположить, что среди разработчиков синдромом самозванца особенно ярко страдают ML инженеры: ты можешь 3-6 месяцев что-то строить, обучать, собирать какие-то пайплайны и совсем не факт, что они доедут до прода. Если что-то делает бекендер, какая-то информация будет выдаваться пользователю или не будет. Если что-то делает фронтендер, какая-то кнопочка будет нажиматься или не будет. Если что-то делает дата инженер и аналитик – какой-то дашборд будет рисоваться или не будет
Как пощупать результат работы ML инженера? – да хуй его знает, чем они там занимаются. Разговаривают на своём птичьем языке, понятный только другим MLщикам: оверфиты, фичи, пайплайны. Больше всех получают денег и меньше всех понятно, что они там делают и когда будет готов результат. Недоверие к MLщикам/DSам растёт экспоненциально, особенно если ты занимаешь чуть ли не единственную data-роль в компании и не совсем понимаешь, с чего нужно начинать выстраивать data-driven культуру в компании
Собаки лают на то, что не понимают – Гераклит
По статистике от Claude Research, от 48% до 85% ML/AI-проектов или не достигают продакшена, или не приносят ожидаемой бизнес-ценности. Вопреки ожиданиям, с ростом популярности GenAI и, казалось бы, "простоты внедрения", ситуация не улучшилась, а даже ухудшилась *pikachu face*
Из-за того, что к MLщикам со стороны бизнеса такое недоверие, по моим наблюдениям они сильно раньше, чем остальные разработчики вынуждены погружаться в бизнес-метрики, методологию A/B-тестирования и другие методы "внешней", "честной" оценки эффекта своей работы, выраженной в деньгах: сколько ты помог заработать или сколько ты помог сэкономить. Мы с Валерой 5 лет назад даже разработали целый практикум на 1200+ человек "Симулятор ML", нацеленный на то, чтобы помощь начинающим ML инженерам сократить гэп между ML-как-алхимией и ML-для-бизнеса, проложить мостик между обучением моделей и продуктизацией своего ML/AI решения
Кстати, неспроста, например, при "взрослом" ведении ML-проектов, обязательным этапом разработки является написания ML дизайн-документа. И как ни странно, уже второй-третьей секцией такого документа является оценка потенциального аплифта целевой (сколько денег заработает или сэкономит проект, в худшем и лучшем случае - при той или иной стадии масштабирования?), бюджета на команды (сколько недель/месяцев займёт разработка и R&D по этому проекту? сколько специалистов нужно какого уровня?), а также "build or buy?" (нам быстрее/дешевле это всё-таки строить самим, или проще купить коробку? возможна ли коробочное решение такого типа который нам нужен?). Чтобы узнать, как писать такие документы и из каких секций они должны состоять, рекомендую прочитать книгу Валеры и Арсения "Principles of Machine Learning Design", в написании которой я участвовал сам (вариант книги на русском)
Итого, для борьбы с "синдромом самозванца" нужно:
1) научиться, блять, считать деньги, которые ты приносишь или экономишь
2) работать над тем, что приносит или экономит деньги
3) по возможности, не работать над всем остальным
Самые очевидные вещи даются сложнее всего. Чтобы худеть, тебе нужно сжигать больше калорий, чем потребляешь. Чтобы накопить много денег, тебе нужно откладывать. Чтобы растить аудиторию, нужно регулярно писать посты, которыми хочется делиться с друзьями
"Считать юнит-экономику по себе как сотруднику" – кажется, проще сказать, чем сделать. Но примерно в 10 случаях из 10, когда мне кто-то говорит, что что-то в бизнесе нельзя оценить в деньгах, я слышу только лень сделать своё домашнее задание. Можно. Просто ты ещё не знаешь как. Не пробовал. Это защитная реакция говорит, что невозможно. Если я на тебя посмотрю глазами бизнес-оунера, я найду способ, в крайнем случае можно дать все вводные ChatGPT/Claude и распутать воронку вашего бизнес-юнита
Кстати можем устроить мини-челленж, пишите в комментарии именно под этой частью свою роль и проект (насколько позволяет NDA), а я или кто-то другой будем предлагать способы оценки экономического эффекта
🔗 Claude Code теперь работает в Slack
Anthropic добавили интеграцию Claude Code со Slack. Теперь можно делегировать задачи по коду прямо из рабочего чата.
Как это работает: • Упоминаешь @Claude в Slack с задачей • Claude определяет что это про код и создаёт сессию Claude Code • Собирает контекст из переписки в канале/треде • Автоматически выбирает нужный репозиторий • Постит обновления статуса в тред • В конце — ссылка на сессию и готовый PR
Юзкейсы: • Баг репортят в Slack → сразу делегируешь Claude на исследование и фикс • Code review и небольшие фичи по фидбеку команды • Дебаг с контекстом из обсуждения
Пока в бета (research preview).
📹 x.com/claudeai/status/2018819905630634171
#claude #slack #ai
Кстати можем устроить мини-челленж, пишите в комментарии именно под этой частью свою роль и проект (насколько позволяет NDA), а я или кто-то другой будем предлагать способы оценки экономического эффекта
Предложил в комментариях писать роли / проекты, чтобы получить грубую идею, как оценить свою ценность в деньгах
Доброволец №1: Промт-инженер образовательного интернет-портала для школьников
Как можно оценить в деньгах твою value:
Сценарий 1: если ты генерируешь контент с LLM
• оценка через альтернативы: бизнес мог бы нанять контент-специалистов / младших авторов / методистов и создавать единицы контента вручную. у таких специалистов есть некая ставка в час / в неделю / месяц + скорость производства 1 или 10 единиц контента
• если ты это делаешь в полу-автоматическом режиме, то мы ожидаем, что ты это делаешь быстрее и дешевле в пересчёте на единицу контента (возможно даже для того же объёма контента хватит 1-2 специалистов вместо 4-5 как раньше). скажем, раньше на контент тратилось 30-40% от выручки обучающей программы, сейчас 10%. дельта в 20-30% = твоя вэлью, принесённая платформе
Сценарий 2: если LLM с базой знаний - продукт сам по себе
• важно принять факт, что промпт-инженер отчасти похож на ML инженера: в обоих случаях у нас есть некий черный ящик – "данные+фичи+модель" или "база знаний+промпт+модель". мы можем менять каждую из компонент, пробовать другие модели, подкручивать фичи/промпт, пополнять базу знаний, получая то или иное изменение поведения модели. чтобы действовать не как слепой котёнок в чёрной комнате (и подкручивать промпты чтобы подкручиавать промпты, по интуиции), эту систему нужно покрывать теми или иными метриками: либо оффлайн (например собрать 100 пар запросов-ответов, прописанных экспертом), либо онлайн (метрики пользователей - CSI, NPS, доходимость курса, оценки, ретеншен именно AI-компоненты)
• онлайн метрики в свою очередь влияют на продление подписки (если у вас подписочная модель), на сарафанку (= бесплатные лиды), на бренд (= больше доверия, рост конверсии в оплату), на апсейлы (родителям хочется купить ребенку другие курсы на платформе). Если ты можешь показать, что твоя работа над промптами/базой знаний улучшила хотя бы одну из этих метрик - это и есть твоя value в деньгах
• если ничего из перечисленного не трекается, нужно начать с того, чтобы собирать эти данные, а не заниматься "invisible work", невидимой работой, которая не приносит измеримого результата
https://youtu.be/EfmVRQjoNcY?si=ncR2nqzfiPjarSWI
Я люблю ходить когда думаю (в том числе в ожидании Claude Code), иногда я хожу прям с макбуком в руках. Возможность перебросить сессию на телефон и в Wispr Flow с мобильной версии надиктовывать что будет происходить в макбуке, пока все действия происходят непосредственно на нём – это киллер-фича для меня 🤤
Такой вайб кодинг нам нравится ещё больше. Следующий шаг: AR очки и возможность видеть терминалы Claude Code вокруг себя
🧠 Google выпустил Gemini Embedding 2 - первую нативно мультимодальную модель embeddings
Embeddings - очень мощная штука. Они переводят текст в "смысл" и размещают в многомерном векторном пространстве. Это позволяет делать много крутых вещей - например понимать насколько два разных предложения близки друг другу, или делать математические операции: мысль А, но без мысли Б (вектор А минус вектор Б).
Я в своих проектах очень активно это использую. Весь мой антиспам бот работает на анализе смыслов, а не ключевых слов - если смысл сообщения это реклама, то удаляем, даже если написано в формате "3араб00Т00к".
Постоянным ограничением было то, что все это работало только на тексте. Google зарелизил модель, которая переводит в "смысл" любой объект - текст, изображения, видео, аудио и документы в единое векторное пространство. Поддерживает 100+ языков, до 8192 токенов текста, до 6 изображений и до 120 секунд видео.
Это позволяет делать все то же самое, но уже и с видео и с изображениями. Например у нас много спама пошло на автогенерированных картинках - теперь можно ловить и его.
Техническая, но очень крутая новость.
#google #gemini #ai #embeddings #ml
————————— Мысли Рвачева —————————
Клод управляет бизнесом
Антропик в последнее время выкатил столько статей, что я их даже читать не успеваю, не то что пересказывать.
Одна из них особенно выделяется: «У нас в офисе есть вендомат. Мы доверили управление этим бизнесом Клоду Соннет 3.7, и вот что из этого вышло».
Краткий итог на скрине, а в самой статье много симпатичных деталей типа того как сотрудники просекли, что Клода можно попросить добавить в ассортимент что-то помимо еды и напитков, и заказали вольфрамовый куб; в результате в вендомате появилась целая секция «специальных металлических изделий». Естественно, убыточная.
https://www.anthropic.com/research/project-vend-1
главный новогодний вопрос: во что будем гамать на каникулах?
я лично буду проходить hollow knight: silksong. купил себе геймпад для этого даже :)
за ответы вида "клод код" и "курсор" – бан сразу же (надо же отдыхать когда-то!!)
⚡️ Anthropic добавили auto mode в Claude Code - теперь можно запустить задачу и уйти пить кофе.
Проблема была простая: по умолчанию Claude Code спрашивает разрешение на каждую запись файла и каждую bash-команду. Безопасно, но невозможно оставить на длинной задаче без присмотра. Альтернатива - флаг --dangerously-skip-permissions, который отключает все проверки целиком. Auto mode - это середина между двумя крайностями.
Как работает: перед каждым действием отдельный классификатор (на Claude Sonnet 4.6) проверяет, не делает ли агент что-то деструктивное - массовое удаление файлов, попытки вытащить данные, выполнение подозрительного кода. Безопасные действия проходят автоматически, опасные блокируются. Отдельно проверяются признаки prompt injection - когда вредоносные инструкции спрятаны в обрабатываемом контенте.
Доступно сейчас как research preview на Team плане, скоро появится для Enterprise и API.
https://claude.com/blog/auto-mode
#anthropic #claude #claude_code #ai #coding
————————— Мысли Рвачева —————————