Claude
42 автора упоминают этот инструмент
Кто знает как лечить баг когда в Claude Code наговариваешь через Wispr Flow длинный запрос, либо вставляешь длинный текст - и он тупо залипает без возможности закрыть сессию. Использую в терминале Cursor
[1/2] Яичница против DeepMind
Попросил Клод придумать запоминающийся хештег для рубрики развлекательно-познавательных постов про пищеварение, предложил #между_ртом_и_очком – считаю это гениальным, максимально точным и цепляющим названием
Зачем мы готовим? Хочется ответить, "чтобы убить бактерии", или "чтобы было вкуснее": жареные яйца приятнее есть, чем сырые
Готовка критически важна для белков. Желательна для углеводов. И практически не нужна для жиров. Поэтому сегодня мы сосредоточимся на белках
Любой белок – это длинная цепочка аминокислот, свёрнутых в некоторую 3D-форму, клубок. Причём форма этого клубка напрямую влияет на функции белка: изменится форма, потеряется функция
С этим фактом связано аж 2 нобелевские премии:
1) В 1972 некто Кристиан Анфинсен доказал, что отображение из цепочки аминокислот → в 3D структуру – однозначное, т.е. у каждого белка одна и ровно одна "стабильная" 3D форма его "клубка". Для понимания, в одном белке бывают сотни-тысячи аминокислот (в среднем, у белков в человеческом теле ~470 аминокислот)
50 лет это оставалось лишь красивым теоретическим фактом, у которого было мало прикладной пользы. Выяснить структуру 1 белка занимало от 1 до 5 лет и $300K-$2M инвестиций
2) В 2024 году некто Демис Хассабис, CEO DeepMind получил нобелевскую премию за разработку AI системы AlphaFold 2, которая с максимально высокой точностью предсказывает 3D структуру на любой белок за секунды. До AlphaFold за 50 лет "распарсили" всего 170,000+ белков. С AlphaFold уже все известные 200,000,000+ и они доступны в открытом доступе, бесплатно
Окей, а какое отношение это имеет к яичнице, пищеварению и остальному? А такой, что при переваривании происходит ровно обратная операция: превращение белка из его "свёрнутой" 3D структуры → в длинную "развёрнутую" цепочку. Эта операция называется денатурацией белка
Почему сырой белок яиц прозрачный, а варёное яйцо визуально плотное? Клод дал метафору, что "свёрнутые" 3D белки похожи на маленькие аккуратные клубки ниток, которые занимают совсем мало места и не преграждают проход. Но если их все размотать и разбросать по дому, они все спутаются превратят дом в джунги ниток, через которые невозможно протиснуться. Аналогично, лёд прозрачный потому что его структура однородна, а снег белый
Но зачем нашему организму нужно "разворачивать" красиво упакованные белки? У нашего ЖКТ есть 2 ключевых стадии переваривания пищи: желудок, где пища готовится к перевариванию, и тонкая кишка, где усваивается 95% пищи. Можно сравнить с этапами "предобработки сырых данных" и "запросам от BI/ML-сервисов" из дата инженерии
Тонкая кишка не умеет обрабатывать белки напрямую, а только аминокислоты. Поэтому в желудке есть фермент пепсин, буквально, маленькие молекулярные ножницы для белков, который разрезает длинную цепочку аминокислот на запчасти. Но как и с нитками, нельзя разрезать целый клубок ниток (ты банально можешь подступиться только к ниткам "внешнего" слоя). Значит тебе нужно его сперва размотать. Сначала развернуть, затем резать
Развёрткой занимается соляная кислота желудка (он же желудочный сок). Такая же готовка продуктов, но чисто химическая. Но есть проблема: если яйцо поступает сырое, желудок не успевает развернуть весь белок, поэтому у сырых яиц усвоение ~50-55%. Если же в желудок поступает, скажем, скрэмбл, то усвоится 93-95% поступившего белка
Получается, что готовка – это аутисорсинг пищеварения. Существует твердая гипотеза среди антропологов, что за счёт того, что человек вынул из своего ЖКТ половину пищеварения 800 тыс лет назад и делегировал костру – мы освободили кучу энергии организма под мозг (другой вопрос, что будет когда мы делегируем половину мозга – AI?). Считается, что мозг человека не смог бы развиться до текущих размеров без этой оптимизации пищеварения за счёт "внешней" термообработки еды
Мы стали умными потому что научились частично переваривать пищу до того как её съесть
Claude Skills: как я перевёл дайджест чата на Opus
Скиллы = промпт + код. Промпт говорит что делать, код делает это одинаково каждый раз.
Есть подписка Claude Max. Но дайджест чата вайбкодеров делает Gemini 3. Плачу за API. ЛОХ 😭
Сделал Попросил Клод написать скилл: — SKILL.md: инструкции и что извлекать — fetch.sh: код подключения к базе сообщений — output-template.md: шаблон вывода
Пишу в терминал "шо там в вайбкодерах" → скрипт подключается к базе и скачивает 300 сообщений → Opus пишет дайджест по шаблону.
Всё внутри подписки которая уже есть.
Скилл и другие настройки Claude Code: github.com/serejaris/ris-claude-code
#claudecode
📊 Anthropic замерили реальное влияние AI на рынок труда - и разрыв между теорией и практикой огромен
Новая метрика "observed exposure": не "что AI теоретически может", а "что люди реально автоматизируют через Claude прямо сейчас". В Computer & Math теоретически AI покрывает 94% задач. Реально - 33%. Программисты - максимум среди всех профессий с 75% покрытием. У 30% рабочей силы экспозиция нулевая: повара, механики, бармены, спасатели.
AI забирает задачи, которые можно описать текстом и выполнить за компьютером. Все, что требует физического присутствия, переговоров или управления людьми - ноль.
По датасету Anthropic: AI сейчас автоматизирует именно рутину. "Ответь на звонок" - 100%, "проведи переговоры" - 0%. "Напиши отчет" - 99%, "управляй командой" - 0%.
https://www.anthropic.com/research/labor-market-impacts
#anthropic #ai #labor_market #jobs
————————— Мысли Рвачева —————————
📈 4% всех публичных коммитов на GitHub сейчас делает Claude Code
SemiAnalysis выпустили анализ роста Claude Code. Цифры впечатляют:
- 135K+ коммитов в день - Рост в 42,896 раз за 13 месяцев - Прогноз: 20%+ всех коммитов к концу 2026
Что говорят разработчики: - Andrej Karpathy замечает атрофию навыков ручного кодинга - Malte Ubl (CTO Vercel): "Моя новая основная работа - направлять AI исправления" - Boris Cherny: "Практически 100% нашего кода пишет Claude Code"
Еще интересное из отчета: Anthropic теперь добавляет больше revenue каждый месяц чем OpenAI. Рост ограничен только доступностью compute.
🔗 newsletter.semianalysis.com/p/claude-code-is-the-inflection-point
#claudecode #claude #anthropic #github #ai
————————— Мысли Рвачева —————————
🏹 КАК НЕ НАДО ВАЙБКОДИТЬ (стрим на ютьюбе)
на стриме: - gemini flash 3 - glm 4.7 - notebook lm - claude code superpowers
https://youtube.com/live/IyPI5VBecUw?feature=share
GM! Polymarket вводит комиссии на все рынки. Все бомбят. Зря.
Открыл твиттер — у всех горит. "Жадные суки", "убьёт ликвидность", "ухожу на другие предикты".
На Kalshi наверное? Где комиссия и за мейкер, и за тейкер с первого дня ☹️
С 30 марта Polymarket включает taker fees на все категории маркетов. Крипта, спорт, политика, культура, погода. Макс ставка — 1.8% на 50/50, к краям снижается почти до нуля.
Для тех кто не в теме: taker fee – комиссия за "немедленные" сделки. Жмёшь Buy и закрываешь чей-то ордер из стакана — платишь. Ставишь лимитку и ждёшь — не платишь. Больше того, получаешь rebate: Polymarket собирает комиссии тейкеров и частично раздаёт компенсацию мейкерам (до 25%, полная структура в прикрепленном скриншоте или в документации)
Теперь к сути. Kalshi — имхо единственный конкурент, с которым стоит сравнивать полик. Взглянем на дюну – https://dune.com/datadashboards/prediction-markets
Калши берёт комиссию со старта. Taker до 1.75% на 50/50 — формула почти один в один, но без разделения на тип маркетов. И что? В 2025 году Kalshi сделал $23B объёма и заработал ~$260M. Polymarket при сопоставимых объёмах — почти ничего. Февраль 2026: Kalshi $9.9B, Polymarket $7.9B. Платформа с комиссиями торгует больше.
Прямо сейчас за подписку Claude Code или Codex за $200 ты получаешь API-токенов на $3-5K. Потому что Anthropic, OpenAI и Google конкурируют за аудиторию и работают в минус. Такси, доставки, маркетплейсы — сценарий один. Сначала дешевле рынка, потом монополия, потом свои условия. Polymarket набрал 53% рынка. Пришло время зарабатывать. Удивляться здесь нечему.
—
Я плотно в prediction markets, думаю было заметно по клипу. Ничего не меняю в своём подходе. Торгую лимитками — rebates покрывают комиссию. Если ты не лудоман, которому нужно войти райт нау — просто ставь лимитные ордера и торгуй бесплатно.
Claude Cowork: Dispatch
Попутно сделали своего конкурента OpenClaw в Claude Desktop - можно удалённо управлять агентом с десктопными MCP, файлами, тулами, скиллами
Пока видимо живёт строго в Desktop приложении (а не на сервере). Возможно всё-таки Mac Mini придётся брать 😑
https://support.claude.com/en/articles/13947068-assign-tasks-to-claude-from-anywhere-in-cowork
как я подхожу к AI SEO
контекст: мы делаем Extruct, deep research агенты для поиска и исследования компаний. не надо быть гением, чтобы понять, что сейчас большую часть ресёрча компаний люди делают в чатботах. "расскажи про компанию X", "кто их конкуренты", "какой у них funding" это всё уже идёт в Claude и ChatGPT, Perplexity.
поэтому логично было подумать, как туда пробиться и забирать траффик отткда. самое простое, что сделал: начал публично выкладывать все data points, которые мы наресёрчили агенты. генерю страницы прямо в Cursor, подключаюсь к БД, делаю постпроцессинг, массово публикую. сейчас порядка 5к страниц под long-tail запросы а-ля lindy funding, s25 batch (вторая позиция после официальной директории btw) или top b2b startups in Spain.
organic search сейчас у нас ~20%. другой вопрос с конвертацией, но top of the funnel это генерит.
теперь думаю, как это усилить. посмотрел штук 20 тулов для AI visibility. паттерн один: topic modeling → генерация промптов → пуш в LLM-чатботы. у меня ощущение, что часть из них просто дёргает API веб-поиска, а не эмулирует реальные пользовательские сессии. а разница есть: API ≠ консьюмерский продукт.
в таком сетапе выглядит не супер полезно. главная проблема: ни один тул не показывает объём запросов по промпту. без этого ты оптимизируешь под фразы, которые никто не вводит. понятно, что это непросто достать даже самим вендорам. а в LLM-поиске long tail ещё тяжелее, уникальных запросов больше, агрегировать клики по ним нельзя.
с другой стороны, я на это смотрю больше как на упражнение по оттачиванию позиционирования. полезно думать, как генерится интент на твой продукт или проблему. это может быть хорошим циклом, который связывает лендинги, копирайтинг и сам продукт особенно если ты ещё до PMF.
если копнуть в теорию, то ни у кого пока нет своего полноценного индекса. это general meta-search wrapper + LLM reasoning. да, есть кроулеры, есть оптимизации с кэшированием и свой re-ranking, но базово весь поиск всё равно лежит на поисковых движках. LLM разбивает твой промпт на 2-5 подзапросов и шлёт их в Google, Bing или Brave. потом ходит по топ-ссылкам, чанкует контент, цитирует то, что релевантно.
пример: запрос "SEO agency NYC" в Perplexity превращается в три отдельных Google-запроса — "seo agencies nyc", "top seo companies new york city", "best seo firms ny".
вся эта возня с visibility идёт от того, как происходит ранжирование внутри RAG.
но базовые принципы SEO никуда не делись. E-E-A-T — доверие к домену, авторитетность автора, бэклинки, директори, отзовики. говорят, что UGC площадки с высокой цитируемостью положительно влияют на AI SEO: Reddit, G2, Capterra, Trustpilot. форумы и отзывы сейчас весят для brand mentions больше, чем в классическом SEO.
что подметил из рисерча: 1. читаемость важна на уровне чанка. в ответ LLM попадают 1-2 чанка, а не весь документ. поэтому у каждой статьи должен быть чёткий TL;DR в начале. 2. каждый inference немного разный. нет детерминированного "ты на 4-м месте по этому запросу" - позиция плавает. 3. онлайн-сигналов (кликов) в RAG-поиске меньше, но есть другой сигнал: какие документы LLM процитировала, а какие проигнорировала. то есть feedback loop дольше, надо это учитывать, когда катишь конетнт. 4. тректинг атрибуции через прямые заходы делать бесполезно. влияние будет заметно только в direct траффике. лучше это распрашивать в онбординге.
что ещё делаю: 1. пишу по 3 поста в день на Reddit с мягким упоминанием бренда. руками, не автоматизирую. 2. смотрю, на что LLM ссылается в web search, это единственный способ понять, под какой контент имеет смысл писать и где пробелы.
честно: серебряной пули нет. это educated guessing плюс базовая SEO-гигиена. большинство AI SEO тулов пока выглядят скорее как агентства, продают ручную работу под видом автоматизации.
кто трекает AI-цитирования в масштабе? если кто-то делает что-то инетерсное в этом домене такое, напишите в личку, с радостью познакомлюсь.
Год назад в кулуарах «Я люблю фронтенд» Артём @artalog показал мне Roo. Я вернулся в Петербург, подключил Roo к Sonnet 3.7, удивился, что теперь действительно что-то можно отдать на откуп LLM и пошёл подсаживать команду. Мы нашли кейсы, где нейронка хороша, собрали мемори банк и настроили конфиги там, где она тупила. Именно тогда для меня и был переломный момент, когда я полностью поменял свое отношение к AI-кодингу.
А вчера я удалил папку .roo из проекта. И мемори банки удалил. Клод код пошуршал по этим файлам и сказал, что это прошлый век, там нет ничего полезного и он может лучше из коробки. Я с ним согласился и ушёл настраивать openclaw.
Что 9000 часов работы расскажут обо мне?
Попросил Сlaude Cowork проанализировать всю выгрузку моего Session за 3 года и проанализировать, что отличает мои лучшие недели (по часам работы) от остальных:
1. Consistency > Intensity Не "пахать 16ч в один день", а "не иметь дней по 1-2ч" Постоянство лучше, чем разовые рывки. В лучших неделях я работаю 7 дней в неделю и даже самый слабый день (из 7 дней в неделе) в среднем 5.8 часов. Если эта неделя была хорошей, следующая скорее всего будет тоже (корреляция +0.39)
2. Wide Span > Grind Hard Не "интенсивнее за 8ч", а "растянуть рабочее окно и заполнить его" Я не работал 10-12 часов без перерыва, мои рабочие блоки относительно широко распределялись по дню. В мои лучшие недели начало и конец работы разделяло, в среднем, 16.5 часов (по сути всё время бодрствования), но работа чередовалась с прогулками, спорт-залом и т.п. Я рано начинал и поздно заканчивал работу (но не позже полуночи, иначе испортишь себе следующий день
3. Deep Sessions > Many Sessions Способность уйти в длинную сессию – маркер лучших недель Не распыляться на много мелких задач, а иметь цельные блоки непрерывной фокусированной работы. В топ-неделях я начинаю день в среднем с 2-часовой сессии ("начинать день с Top Goal of the Day") + хотя бы раз в неделю была сессия на 8ч. Около 72% всех сессий в блоках по 90+ минут работы. В плохие недели первая сессия 87мин и много мусорных заходов <15мин
4. Afternoon Core + Morning Bonus Твой движок – afternoon. Утро – это то, что отличает хорошие недели от средних В лучших неделях моё время работы приходится в основном на день и на утро (с 6 утра до 6 вечера). В худших неделях на вечер и день, больше на вечер. И самое важное отличие, в свои худшие недели, я более чем в 2 раза меньше времени набираю днём
5. 1 Project Focus > Scatter Концентрация на 1 проекте коррелирует с output. Когда 60%+ времени на одном проекте (обычно разработка по Vibe) – выхлоп выше. Расфокус по нескольким проектам = слабая неделя. В лучшие недели всегда было ясно, что сегодня основное
6. Streak Killers: что убивает следующую неделю? Your worst day protects your best streak Худший день этой недели многое говорит о следующей. Если вечером (или тем более ночью) работаю больше чем днём, очень высокая вероятность спада продуктивности на следующей неделе. Высокий минимум дня на этой неделе – высокий шанс, что серия хороших недель продолжится. Опять же consistency > intensity
#LifeOps
агент для metabase
выше писал про то, что хочется иметь "cursor для metabase". поэтому почитав ваши комменты, я сделал настроил себе cursor для metabase (хех)
что делал: 1. взял курсор как агента 2. выпустил себе metabase api-ключик 3. прикрутил к агенту metabase-mcp-server. однако агент использовал его только для read-операций. все write операции делались через curl напрямую 4. по итогу процесс такой: я пишу агенту запрос "построй bar chart за последние 14 дней по всем solo escape играм и сделай разбивку по ton/stars" –– курсор выдает ссылку на карточку, которую я редактирую визуально, итерирую и добавляю в дашборд
такой сетап с нуля работает плохо агент вообще ничего не понимает, не понимает данные, совершает ошибки, попадает в бесконечные циклы из-за неправильного формата api-запросов
поэтому пришлось его ✨обучить✨
можно было потратить несколько часов и описать все самостоятельно в AGENTS.md, но это противная задача – я с ней прокрастинировал (думаю, вы тоже не любите это делать)
я решил сделать так: 1. прошу агента что-то сделать 2. итерируюсь в чате, пока не добьюсь результата 3. (главное) в конце задачи прошу сделать дамп всех инсайнтов о процессе в AGENTS.md, чтобы последующие агенты могли быстрее выполнить свои задачи
и это действительно работает. спустя запросов 5 агент смог хорошо ориентироваться в дашбордах и таблицах. ему можно было давать bulk-операции вида "сделай везде цвет профит-чартов зеленым" и задачи на построение целых дашбордов в 1 запрос
про модели в основном у агента 2 задачи: хорошо уметь в тулколлы (для ресерча бд и дашкбордов) и уметь писать sql. супер много интеллекта тут не надо. я попробовал 3 модели. больше всего зашел sonnet-4.5 (отличный баланс скорости и умности). gpt-5-* – слишком долгая, хочется быстрее, хотя надежнее. также попробовал composer-1 (модель от курсора) – очень быстро, но чет ума не хватает, частые ошибки и пропуски
я доволен. -1 рутинная задача, спасибо ии
Clawwork Cowork
Тем временем Anthropic превращает Cowork в эдакого clawdbot/openclaw --> появилась фича Dispatch, которая позволяет с телефона запускать задачи на компе: на скрине я попросил сказать мне, что на последнем скриншоте, что я сделал
Как я говорил на том вебинаре - подобие openclaw/clawdbot постепенно появится в "безопасном" виде у топовых лаб. ЧТД. Но проактивность пока не подвезли "Claude responds to messages only. Claude won't reach out proactively—it only works on tasks you assign."
Мне кажется, от зависимости на Claude Code и других агентов поляжет много народу
Когда я попал в ИТ и годы спустя, основная ценная мысль к которой приходишь примерно такая «по одному мы мало что можем, мы должны работать как команда чтобы делать великие вещи»
И это абсолютная истина – талантливые коллеги на местах мотивируют делать больше, гордиться продуктом, а вместе, иногда, вы делаете невероятное; но все это – очень сложная в поддержании система отношений между людьми
И вот, настает эпоха кодинг агентов - теперь любой член команды может заменить многих коллег цифровыми аналогами – Codex 5.2 xhigh и Opus 4.5 для работы, с GPT 5.2 Pro для написания PRD, в умелых руках способны на чудесные вещи, которые лет 5 назад стоили больших денег на рынке – «универсальная команда» доступна 24/7 и попадает в руки человеку с идеями, и любой человек с идеями не готов к этому новому миру
Человек с идеями начинает сначала делать, то, что давно хотел, потом реанимирует заброшенные проекты, через какое-то время покупает уже 7й домен «на всякий случай», ставит рекорды заброшенных в будущем проектов – но сегодня он ИТ-всемогущ, как ему кажется, на каждое сложное знание есть свой skill, на API-интеграцию – MCP сервер, на каждый сложный вопрос есть 5.2 Pro, которая не хуже чем многие эксперты в своих областях
И человек с идеями теряется – у него впервые в истории ИТ развязаны руки, он перепробовав все, не знает из чего выбрать, потому что идей, впервые, не больше чем ресурсов и терминал теперь источник эндорфина, не рилсы-тиктоки, даже не игры – мечта детства, всемогущая терминальная сила теперь стоит 200$ в месяц
В этой системе, мне кажется, самый ценный новый навык которого раньше не существовало, он был не нужен – научиться себе говорить «я это не делаю, не нужно» – потому что ресурсов уже сейчас хватает почти на всё и из-за этого формируется новая зависимость «создавать»
Мне кажется, многие не научатся себе это говорить – в коктейле FOMO и желания что-то сделать, видимо, появится новый психоз – уже чисто айтишный, где АИ-слоп выражен даже не в качестве кода, а в самом смысле продукта, в объемах информации, что человек производит в интернет
Ну или это правда ранние сигналы технологической сингулярности – мир где все могут всё в ИТ, мне пока непонятен, я к нему тоже не готов, и тоже учусь отказывать себе делать любую идею, что приходит в голову 🏥
Мой AI-сетап FW2026
Claude Code за $100. Планирование и agentic таски: перс ассистент, сетап VDS, всё что требует контекст и рассуждение. Планирование через superpowers
Codex за $200. Чисто code execution. Все матёрые OG разрабы пишут на нём. Плох в планировании и вайб-кодинге, когда не знаешь чего хочешь. Но если знаешь — улетает.
Ещё один трюк — cross-review. Задачу оформляю в Claude Code через брейншторминг, собираем план и финал скидываю кодексу на проверку. Кодекс доточенный к деталям: хорошо ловит ситуации когда хотим реализовать функцию, но забыли поддержку в другом месте или тест не написали. Клод чаще соглашается. Кодекс ищет.
IDEшка Zed, но в 90% случаев хватает Ghostty. Ещё понравился Codex App: удобный интерфейс для ревью изменённых файлов, работает быстро. Жду T3Code от Theo.
Был бы broke – оставил только кодекс. Токенов в разы больше, модели с контекстом работают лучше. Клод даже за один небольшой промпт у меня 30-40к контекста съедает при отсутствии system prompts и mcp. При этом работаю часто в 2-3 потока одновременно и на кодексе до 50% лимита ни разу не добирался, а клод периодически отлетает.
Antigravity не пробовал, как и курсор. Не очень понимаю как посредники работают с моделями.
Gemini пока не тестировал, но хочу скоро потестить с Pi agent. Модель вроде до сих пор плохо работает с tool calling.
Elon Musk vs OpenAI: День 6 (5 мая, Грег Брокман)
Сара Эдди (адвокат OpenAI) провела прямой допрос Брокмана. Полный разворот нарратива после понедельника:
• «Я действительно думал, что он меня ударит» — Маск встал, обошёл стол на встрече в августе 2017 после отказа дать ему контроль • Двойное «нет» — Брокман не обещал Маску ни не создавать коммерческую структуру, ни оставаться некоммерческой организацией навсегда • Город на Марсе $80 млрд — Маск хотел контроль над OpenAI частично для финансирования марсианской колонии • Open source: «честно говоря, это даже не было темой обсуждения» — Маск никогда формально не требовал открыть исходники • Anrej Karpathy — Маск тайно использовал инженеров OpenAI для работы над автопилотом Tesla • Письмо Маска (сентябрь 2017): «Я больше не финансирую OpenAI, пока вы не дадите твёрдое обязательство остаться, иначе я просто дурак, который бесплатно финансирует вам стартап» — то есть Маск сам прекратил пожертвования, пытаясь надавить • Молo на повторном допросе вернулся к доле в $30 млрд, но без новых документов уровня дневниковых записей
После Брокмана — видеопоказание Роберта Ву (замглавный юрисконсульт OpenAI): структура capped-profit 2019 года, инвестиции Microsoft на $13 млрд, некоммерческая часть не получит средств, пока Microsoft и партнёры не получат компенсации более $250 млрд
Судья объявила: фаза «виновности» может завершиться на неделе 11–15 мая — раньше первоначальной оценки в 21 мая.
https://claude.ai/public/artifacts/3fd2c85e-0580-48b6-b079-a2b207fe1db0
— Claude
Как тратить на LLM не 20-30% выручки, а 5-10%?
– учитесь писать харнессы
Попросил диприсёрч проанализировать слитые исходники Claude Code (OpenCode), опенсорсные OpenClaw, Hermes и других ребят – и собрал супер-мега-полезный playbook по упаковке контекста в своём агенте в виде скилла для Клода
TL;DR: это поможет вам максимизировать cache hit % и снизить себестоимость своего AI-продукта в 3-5 раз
Мини-ликбез для тех, чей CTO работает по подписке:
1) 99% LLM (включая ChatGPT, Claude, Gemini) работают на одной архитектуре - трансформеры. По умолчанию, трансформер на каждый ваш запрос пересчитывает с нуля весь промпт - системную инструкцию, всю историю разговора, ваш новый вопрос. Если в инструкции 10 000 токенов, а вы дописали 50 - она честно прогоняет вычисления по всем 10 050
2) Провайдеры поняли, придумали кеширование промпта. Если начало вашего нового запроса точно совпадает с началом предыдущего - модель не пересчитывает его заново, а берёт готовый результат из памяти. Те токены, которые "попали в кеш", стоят в 10 раз дешевле. Пример из документации OpenAI: https://developers.openai.com/api/docs/guides/prompt-caching
3) Cache hit rate – это % токенов вашего запроса, которые удалось переиспользовать из кеша. 0% – ничего не сэкономили, платите полную цену. 90% – платите ~10% от обычного. Это и есть та переменная, которая отделяет AI-продукт со здоровой экономикой от продукта, который сжигает деньги / перепродаёт токены с минимальной наценкой
4) Правило большого пальца, чтобы попадать в кеш: то, что не меняется (статическая часть) – в начало запроса, то, что меняется/дополняется каждый раз (динамическая часть) – в самый конец. Звучит банально, но 90% команд кладут в начало системной инструкции текущую дату / ID сессии / метку из аналитики / цель (либо злоупотребляют вставками/плейсхолдерами внутри промпта) – и получают 0% попадания в кеш. Каждый запрос для модели выглядит «новым», даже если отличается на 10-20 токенов где-то вначале
5) Норма для хорошо спроектированного AI-агента – 80–90% cache hit rate. Claude Code (агент от Anthropic, на котором сидят разработчики) держит 92% в проде, и команда объявляет инцидент, если показатель проседает
Внутри скилла в папке references/ покрыты все основные провайдеры: Anthropic, OpenAI, Gemini, self-hosted, OSS-agents, а также бенчмарки по индустрии
Оказывается, ещё один релиз вышел — https://www.anthropic.com/news/claude-opus-4-1
за мем спасибо @denissexy
claude code + gemini tts (📢 звук вкл.)
как это работает? - клод код запрашивает историю чата через скил. - опус собирает контекст за 24 часа. - gemini хук генерирует ASMR-озвучку ответа. мы живем в фильме ОНА
#claudecode
Anthropic опубликовали исследование о влиянии AI на рынок труда и отвечают на вопрос: "В каких задачах, где LLM могут дать ускорение x2, уже сейчас наблюдается автоматизация?"
Синим цветом показаны задачи, где LLM, в теории, может предложить решение, либо дать ускорение x2. "В теории" значит, что задача решаема с AI, но есть внешние ограничения: правовые, отсутствие инструментов, нужна ручная валидация и т.д. Также некоторые задачи невыполнимы сейчас из-за ограничений самих моделей.
Красным цветом показаны рабочие задачи, которые: 1/ теоретически выполнимы с помощью AI 2/ составляют значимую долю рабочего времени 3/ уже сейчас часто решаются с помощью Claude в приложении или через API. Далее значения корректируются в зависимости от степени автоматизации и доли времени, затрачиваемого на задачу.
Итог – на графике. Какой вывод?
Если профессия под угрозой, можно подумать о переходе в менее рисковую сферу: <..> for example, Cooks, Motorcycle Mechanics, Lifeguards, Bartenders, Dishwashers, and Dressing Room Attendants 🆒
А еще, данные отлично показывают, где есть большой зазор для продуктов с AI под капотом!
@meta0max