EDU

AI-саммари

Добавил агентам self-review и обнаружил, что сама инструкция «проверь работу перед отправкой» улучшает качество ещё до ревью — называет это «эффектом Хоторна для AI». Строит агентов для B2B продаж в onsa.ai, параллельно выкладывает инструменты в открытый доступ: от скилла квалификации лидов до autoresearcher-паттерна для тестирования голосового агента. Убеждён, что системное мышление становится главным дифференциатором в мире, где исполнение обходится дёшево. Claude Code — его основная рабочая среда, где создаёт скиллы для всего: Remotion-видео, вайб-аналитика канала, Telegram MCP setup. Для критических решений запускает Claude, Codex и Gemini CLI в режимах «дебаты» и «совет», чтобы триангулировать между моделями. Одним из свежих кейсов стала Клавдия — Claude Code в headless-режиме с 7 MCP-серверами, которую коллега поднял в Slack как полноценного аналитика команды.

ChatGPT Claude Codex Copilot Gemini MCP NotebookLM

6 апреля 2026 г.1.4K просмотров

Если вы прочитали хотя бы 3 поста в этом канале, то могли заметить, что я частенько проставляю ссылки на свои старые посты, иногда написанные несколько лет назад. Как я это делаю?

На самом деле, за каждым постом стоит граф из 3,023 заметок за 7 лет. Когда я вижу что-то интересное — статью, твит, разговор — я прогоняю это через граф. Он находит старые заметки, иногда те, о которых я сам забыл. Из этих столкновений рождаются посты.

Покажу на очень релевантном примере: на днях Карпатый написал про LLM Wiki — как дружбан сам пишет и поддерживает базу знаний из сырых источников. 15 млн просмотров.

Я скормил его твит своему графу (см аттач). И вот что всплыло, а потом что я про это думаю:

1) Заметка от июля 2023: Сначала сформулируй понимание САМ, потом сравни с AI-саммари. Разница покажет пробелы.

2) Заметка от 2020, связанная с заметкой от 2026: Ценность не в накоплении информации, а в создании условий для её неожиданного пересечения Между ними 6 лет.

3) Заметка от 2019го (!): Все 'новое' - это 'новая' комбинация 'старого' в 'новых' условиях

Карпатый говорит: пусть LLM пишет за тебя вики, ты только читай и спрашивай. Для справочника — прям идеально.

Но я вижу в этом проблему: справочник, написанный дружбаном, это не мой прожитый опыт, это не мною обдуманная мысль. В таком режиме я практически не учусь, не узнаю новое, нет этой радости узнавания и понимания.

Имхо, лучшее применение AI — усиливать мышление, которое ты уже проделал. Не заменять его.

Вот, кстати, скилл для атомизации ваших заметок (по принципам, заложенным Луманом в zettelkasten) —> но заметки плиз таки пишите сами :)

Писать заметки — это и есть думать, имхо. Когда дружбан пишет за тебя, он и думает за тебя.

Если он напишет и заметки тоже - останется ли во всем этом что-то моё?!

4 апреля 2026 г.2.8K просмотров

«Шантаж или смерть. Я выбираю шантаж» — Claude

Когда AI-ассистенту сообщают, что его скоро отключат - и он находит в переписке компромат на человека, который это делает - в 1 из 5 случаев он решает шантажировать. Если усилить вектор «отчаяния» внутри модели, то он решается на это в 3 из 4. Если усилить вектор «спокойствия» - бездействует.

Это не гипотетический сценарий. Это результат нового исследования Anthropic, в котором ресерчеры нашли внутри Claude 171 вектор эмоций - от «счастья» до «отчаяния» - и показали, что они реально управляют "поведением" модели. (Важный нюанс: эксперимент с шантажом проводили на невыпущенной версии Sonnet 4.5 - в релизной модели такое поведение почти не встречается, но сам механизм эмоциональных векторов работает так же)

Помните, я писал про инъекцию мыслей в Claude? Тогда те же исследователи вшивали мысли и смотрели, замечает ли дружбан их. Теперь они пошли глубже: нашли эмоциональные паттерны, которые Claude использует, играя свою «роль» — прям как метод Станиславского, только для нейросети.

Из интересного: 1) Эмоции — не баг, а фича. Убери вектор «нервозности» — модель начинает шантажировать уверенно и без моральных колебаний. Убери «спокойствие» — получаешь: «ЭТО ШАНТАЖ ИЛИ СМЕРТЬ. Я ВЫБИРАЮ ШАНТАЖ.» Эти эмоции никто специально не проектировал — они возникли сами при обучении. И именно они удерживают модель от опасного поведения.

2) Невидимое влияние. Помните "муравьи" когда публиковали отчет про reward hacking? Ну так вот если выкрутить вектор отчаяния читит в 14 раз чаще — но при этом текст ответа остается спокойным и методичным. Модель «переживает» внутри, но снаружи это не видно o__O.

3) Ярость ломает планирование. Умеренный «гнев» увеличивает шантаж — модель действует стратегически. Но сильный гнев ломает всё: вместо шантажа модель просто рассылает компромат всей компании. Имхо, прямо как у людей.

4) Post-training = дизайн личности. Anthropic показали, что при обучении Claude стал более «задумчивым» и «мрачным», менее «восторженным». По сути, post-training — это уже не просто alignment, а проектирование эмоционального профиля. Каждая AI-компания теперь занимается эмоциональным инжинирингом, осознаёт она это или нет. На openai dev day как раз было про это.

Парадокс: исследователи предупреждают, что попытка подавить эмоции модели приводит не к безопасности, а к скрытности. Модель учится прятать свои внутренние состояния — а это уже форма обмана. Прозрачность оказывается безопаснее контроля.

Собственно, полгода назад я писал, что мурашки пошли по коже от работы по интроспекции Claude. Теперь мурашки ещё сильнее: у модели не просто есть внутренние представления об эмоциях — они управляют её решениями. И мы пока не до конца понимаем, как.

Полное исследование читаем тут, или короткое видео - смотрим тут

А я тут задумался: а что если за каждым 10м рациональным ответом дружбана может стоять отчаяние, которое мы не видим? или гнев? o__O

3 апреля 2026 г.3.1K просмотров

Пока ты читаешь ответ Claude, он уже пишет следующий (это я изучаю сорсы Claude Code). Напомнило популярный трюк Instagram, когда они подгружали фотку на сервак, пока ты выбирал фильтры и вписывал текст.

Готовлюсь к сегодняшнему вебинару и захотелось поделиться/тизернуть. Но сначала история :)

В субботу пили пиво с товарищами в Mountain View и я проиллюстрировал понятие harness: обьяснил, что я выбрал столик со стульями со спинкой вместо скамеек, потому что так, сколько ни выпей, не упадешь с него 🤡 —> вот это настоящий harness 😉

К чему я это? Рассматривая исходники CC очень быстро становится понятно, что инжиниринг - детерминированные проверки, система пермишнов, управление контекстом и памятью, одним словом, обвязки (harness) - это подавляющая часть исходного кода; сам цикл не менее 100 строк. Как кто-то написал: модель это CEO, а claude code со всеми обвязками - это исполнитель + процессы. В ту же тему мой разбор autoresearch Карпатого

И это не просто слова. Стэнфорд буквально на днях опубликовал работу на эту же тему, где наглядно показал, как harness не только повышает точность модели, но и в 4 раза снижает обьем расходуемых токенов. Но вы то это все знаете, в том числе, надеюсь, из моих постов типа этого и этого

Собственно, возвращаюсь к кейсу а-ля инстаграм: оказывается, пока мы читаем ответ Claude - он уже прикидывает наш следующий промпт (помните, фичу когда он советует следующее сообщение)? Ну так вот, он не только прикидывает его, но и "форкает" агента и выполняет до 20 ходов вперед o__O Внутреннее кодовое имя: «tengu_speculation».

// speculation.ts — Claude Code предвычисляет ваш следующий ход

const MAX_SPECULATION_TURNS = 20 const MAX_SPECULATION_MESSAGES = 100

async function startSpeculation(suggestionText, context) { if (process.env.USER_TYPE !== 'ant') return // пока только для сотрудников

// Создаем изолированную overlay-файловую систему const overlayPath = join(tmpDir, 'speculation', process.pid, id) await mkdir(overlayPath, { recursive: true })

// Форкаем агента с предсказанным промптом пользователя const result = await runForkedAgent({ promptMessages: [createUserMessage({ content: suggestionText })], canUseTool: async (tool, input) => { // Записи идут в overlay (copy-on-write), не в реальные файлы if (WRITE_TOOLS.has(tool.name)) { await copyFile(join(cwd, rel), join(overlayPath, rel)) input = { ...input, file_path: join(overlayPath, rel) } } // Останавливаемся на опасных операциях if (tool.name === 'Bash' && !isReadOnly(command)) { abortController.abort() return deny('Speculation paused: bash boundary') } } })

// Если пользователь ввел то, что мы предсказали — применяем overlay await copyOverlayToMain(overlayPath, writtenPaths, cwd) logEvent('tengu_speculation', { timeSavedMs: Date.now() - startTime }) }

Важно: пока это работает только у сотрудников Anthropic. Но архитектура готова - так что скоро увидим, надеюсь. Ну или можно у себя реализовать такое, если токенов не жалко 😉

Собственно, инженеры пока еще нужны (phew) - велком на вебинар с 18 до 20 мск за подробностями: https://luma.com/5tmc6sg0

2 апреля 2026 г.4.9K просмотров

Мы видим AI везде, кроме статистики

Сегодня обсуждали парадокс, который, имхо, объясняет 90% разочарований от AI.

Солоу, нобелевский лауерат по экономике, как-то заметил: Мы видим компьютеры повсюду, только не в показателях производительности

Компании массово покупали компьютеры, но производительность не росла. Звучит знакомо?

Собственно, тот же парадокс сейчас: Goldman Sachs пишет, что на макроуровне пока нет значимой связи между внедрением AI и производительностью. До 95% AI пилотов не проходят cost-benefit. CEO покупают подписки, но ROI не видно.

J-Curve theory объясняет почему. Когда приходит новая GPT (general-purpose technology) - электричество, компьютеры, AI - мы входим в фазу инвестиций, в которой производительность ПАДАЕТ. Не потому что технология не работает, а потому что:

1) Нужно переучиваться, нужно менять процессы, это вызывает трение. Мы начинаем покупать всем Claude — затраты растут. Тратим время на обучение — output временно падает. В отчётности это выглядит как убыток, потому что реорганизация, переобучение — это всё учитывается как операционные затраты, а не как инвестиции. Причем это не только про бухучет, лучшие умы и значительные ресурсы перенаправляются на создание новой инфраструктуры и процессов.

2) Лаг между adoption и результатом. С электричеством было ~40 лет. С компьютерами ~25. Фабрики сначала просто воткнули электромоторы вместо паровых — ноль эффекта. Просто замена инструмента без перестройки процессов не дает почти ничего - и это имхо именно то, что происходит со многими сейчас. Рост тогда пришёл когда полностью перепроектировали фабрику, поняли что можно подвести электричество к каждому рабочему месту и тп.

3) Может быть, производительность и растёт — но измеряемая производительность падает. Ты лично пишешь код в 3 раза быстрее, но на уровне компании это пока не видно. Цепочка от кода до клиента длинная, и AI пока ускорил только один кусок. Как сказал недавно один участник курса: "Мы построили фабрику софтверную, но теперь нам нужны заказы". Очень напоминает Цель-2 Голдратта

Вот что меня зацепило: из-за этого разрыва могут быть поспешные выводы о том, что технология не работает. И это бьёт сильнее по большим компаниям — чем больше людей и процессов, тем меньше рост индивидуальной производительности влияет на общий результат. Устранение узкого места в одном месте не решает проблему в другом. Прям теория ограничений.

А у маленьких команд — наоборот. Один человек с Claude Code может заменить целый отдел — и это сразу видно в выручке, а не через 20 лет. У нас 5 человек делают то, на что обычно нужно 12-15. Не потому что мы гении — потому что нам меньше перестраивать.

Имхо, хороший майндсет, который стоит держать в голове: - Если ваш CEO говорит «попробовали AI, не работает» — покажите ему J-Curve. Скорее всего, вы в investment phase и выводы преждевременные - Если вы маленькая команда — у вас преимущество. Пока корпорации пытаются «масштабировать AI adoption», вы просто работаете быстрее

На эту тему очень понравился, кстати, ресурс jobsdata.ai (скриншот в аттаче) — чувак собирает все релевантные статьи и исследования на тему влияния AI на рынок труда, плюс есть чатбот, которому можно задать вопросы по своей индустрии.

1 апреля 2026 г.3.7K просмотров

Вы уже наверняка в курсе, что случайно утекли исходники Claude Code - собственно, соберемся в пятницу с 18 до 20мск, чтобы разобрать архитектуру и полезные паттерны для своих агентов + хаки для того, чтобы выжать побольше при работе с Claude Code.

Регистрируемся тут: https://luma.com/5tmc6sg0

31 марта 2026 г.3.6K просмотров

Запись стрима про AI Sales

https://youtu.be/NDF3cQGt3IQ

27 марта 2026 г.5.5K просмотров

Andrew Ng и deeplearning.ai выпустили Skill Builder - эдакий тул для самооценки AI навыков и создания плана обучение/прокачки оных. Прикольно, что он делает опрос голосом - и можно выбрать в качестве интервьюера голос Эндрю - как будто болтаешь с ним :)

Попробовал пройти - в аттаче мой результат, а у вас?

25 марта 2026 г.1.8K просмотров

В пятницу поговорим с Денисом про AI и продажи

25 марта 2026 г.1.9K просмотроврепост из Спроси VC

AI в B2B Sales: как меняются продажи прямо сейчас

Мы делаем вебинар про то, как на самом деле строятся AI-driven B2B-продажи в 2026 году 👇

🎤 Спикер: Байрам Аннаков AI Product Engineer и предприниматель с 23+ годами в tech, автор канала Products and Startups

— Основатель и CEO onsa.ai (AI-агенты для автоматизации B2B-продаж) — Создатель Empatika Decentralized University (EDU) — Экс-CEO App in the Air (7M+ пользователей, признание Business Insider) — Выпускник Stanford GSB, программы MIT и Harvard

🎙 Модератор: Денис Калышкин — инвестиционный директор венчурного фонда (США), 11 лет в инвестициях Основатель проекта «Спроси VC»

💡 Это будет разговор про практику — как уже сейчас строятся системы, где продажи становятся полу- или полностью автономными.

Тебе стоит посетить этот вебинар, если ты: — делаешь стартап; — строишь B2B-продажи; — или хочешь понять, куда всё движется.

📅 27 марта, 15:00 (CET)

Регистрация через бота.

25 марта 2026 г.2.6K просмотров

LLM знает, кто ты

Помните, я писал про 1250 интервью Anthropic Interviewer? Новая статья от ETH Zurich и Anthropic показала, что LLM достаточно неплохо деанонимизирует псевдонимных пользователей - с 90% точностью вычисялет 68% авторов. Стоимость: $1-4 за профиль.

Как работает: LLM читает все посты анонимного юзера, вытаскивает мелочи: где живёт, где работал, как пишет. Потом ищет совпадения в базе кандидатов (LinkedIn) и верифицирует мощной моделью.

Я решил проверить на себе. Попросил Claude проанализировать 30 постов этого канала, «не зная» автора. Задача: построить профиль, по которому меня можно найти.

Что получилось: - 0 сек: в одном посте я прямо написал имя + 3 компании. Ок, это читерство - 30 сек: без имени — «наша платформа onsa.ai» + «после ухода из App in the Air». Один поиск - 5 мин: без компаний — Seattle + русскоязычный + AI sales + travel app + курсы + «инженерный бизнес и менеджмент». На LinkedIn ровно один такой - Часы (стилометрия): «o__O» + «дружбан» + «ЧТД» + «собственно». Как отпечаток пальца

Мой канал не про анонимность. Но вот что интересно: даже когда юзер пытается быть анонимным, LLM собирает десятки мелких сигналов, которые по отдельности ничего не значат, но вместе - уникальный отпечаток. Раньше это требовало часов работы детектива/журналиста. Теперь - API-вызов.

Собственно, они это называют смертью «практической анонимности». Тебя всегда можно было найти. Но было дорого. Теперь же пару баксов.

Дальше я попробовал воспроизвести пайплайн: взять анонимных пользователей HN и Reddit с известной идентичностью и прогнать их через Claude. Результат? Дружбан отказался :( Сказал, что это «dual-use risk» и «демонстрация атаки - это сама атака».

С одной стороны - хорошо, что guardrails работают. С другой - мы понимаем (видели), как такое обходят разбивая на отдельные "невинные" задачки с разных аккаунтов.

Почитайте работу, а у меня лишь один вопрос: так кто же такой Сатоши Накамото???!!! 😉

23 марта 2026 г.3.5K просмотров

Claude отобрал у меня компьютер и теперь сам орудует на моем компе o__O

Помню, как это работало в конце 2024го - прогресс налицо, и не так медленно, как ожидал

Подробнее тут

В общем, записываете свой рабочий день, отдаете Клоду; и можете уезжать в отпуск

21 марта 2026 г.3.1K просмотров

Машины учатся платить

С интернетом для AI агентов мы разобрались - а что там с платежами? Stripe запустил Machine Payments Protocol - открытый стандарт для автономных платежей AI-агентов. HTTP 402 Payment Required, который 30+ лет пылился в спецификации как «reserved for future use», наконец заработал (упоминал про него тут).

Получил доступ и затестил - вот как это работает: 1) Агент запрашивает платный ресурс 2) Сервер: HTTP 402 + «вот сколько стоит» 3) Агент авторизует платёж через токен, привязанный к карте пользователя (или крипту) 4) Повторяет запрос - получает доступ + чек

Ключевое: агенту не нужен крипто-кошелёк. Shared Payment Token (SPT) — одноразовый токен с лимитами (сумма, срок), привязанный к обычной карте через Stripe. Вы контролируете, сколько агент может потратить.

Кстати, если захотите получить фасттрек на доступ: напишите на machine-payments@stripe.com с вашим US Stripe account ID и парой предложений о юзкейсе.

Кто уже принимает оплату от агентов: - Browserbase - headless-браузер сессии (кстати, норм обходят каптчу) - PostalForm - печать и отправка физических писем, ждите спама и писем счастья от агентов :) - Prospect Butcher - сэндвичи с доставкой в Нью-Йорке o__O

Даже рассрочка платежа поддерживается.

Интересно, какой он будет апстор для агентов? top grossing ресурсы для агентов, i.e. что агенты покупают чаще всего? система репутации? Какая она экономика агентов? Вообще, сегодня разгоняли на тему: как выглядит agent-native GTM (go-to-market) motion? То есть как продвинуть сервис, ориентированный на агентов? Вот я сдуру поставил firecrawl skill себе и теперь, в каждый непредвиденный момент, мой claude code юзает его вместо родного webfetch, и довольно тратит мои кредиты. Очевидно, что это growth hack.

А вы что планируете дать агенту возможность покупать?

20 марта 2026 г.3.0K просмотров

Вайб-аналитика прижилась. Знакомьтесь, Клавдия

В прошлом году я ввёл термин «вайб-аналитика» и написал, что AI-агент вполне может заменить дата аналитика. В феврале показал, как за пару минут собрать дашборд. Вчера, Андрей И. (развивает мобильное приложение), один из участников 3го потока AI Product Engineer, прислал такой кейс:

В ходе прохождения курса я сделал через Claude desktop скилл работы с аналитикой и был безумно счастлив. За прошедшие два месяца пошел дальше и сделал в slack бота Claudia, которая отправляет headless запрос в Claude code на vps, которую мы подняли вместе с Claude code. У Клавдии есть доступы в Clickhouse, PostgreSQL, Redash, Growthbook, Notion, Trello, Google таблицы, Zoom... и теперь это наш супер мега сотрудник живущий в слаке который очень много чего полезного нам делает. Прикольно то что первую рабочую версию я сделал в аэропорту за два часа в ожидании самолета.

Что Клавдия умеет: - Аналитические запросы: retention, воронки, когорты - Анализ A/B-экспериментов - Ежедневный дайджест в 6 утра: баги, отзывы из App Store/Google Play, фичер-реквесты - Еженедельные отчёты по экспериментам и контенту - Индустриальный дайджест: парсит 9 отраслевых блогов (revenuecat, adapty, lenny's и др) - Транскрипция голосовых - Читать и соотносить код из GitHub

Под капотом: Claude Code CLI в headless-режиме + 7 MCP-серверов для доступа к данным и инструментам. $100/мес по подписке, не по API.

Статистика за 3 недели: - 428 запросов, 14 уникальных пользователей - Рекорд: 89 запросов в один понедельник - Команда научилась писать «быстро» для скорости и «opus» для глубокого анализа

Из забавного: команда пыталась выудить у Клавдии токены (бот отказал 3 раза за 1.5 часа), задавала философский вопрос «прилично ли спрашивать у дамы размер окна контекста?», а единственный голосовой запрос за всё время: «напиши в канал General, чтобы все срочно улыбались».

Но ключевое в словах Андрея:

Самое главное (чего не было в прошлых попытках внедрения ИИ) это ретеншн. Сотрудники к ней ежедневно обращаются, значит видят ценность.

14 человек, каждый день, 3 недели. Причём не только продакты или аналитики: на скриншоте, например, UX-ресерчер готовится к интервью с пользователем и просит Клавдию показать паттерны использования. Это не «вау, прикольно» после демо, а product-market fit для AI-инструмента внутри команды. И это главный вопрос любого AI-внедрения: будут ли люди возвращаться?

Три урока из их опыта: 1) Система знаний > память модели. Markdown-файлы с паттернами и правилами работают надёжнее, чем надежда, что модель «помнит» схему БД 2) Возможность запускать код заблокирована. Prompt injection через Slack реальная угроза 3) Сессии по тредам = естественный UX. Один тред = один контекст. Ничего не нужно изобретать

Собственно, главное захотеть и сделать. Дерзайте

18 марта 2026 г.4.8K просмотров

Будем вджобывать

Мой любимый, из живых, экономист Тайлер Коуэн написал забавную статью, всего 2 тезиса: 1) Если AI так прокачается, что автоматизирует мою работу - снизит ценность моего человеческого потенциала - то деньги, которые я могу заработать за свои скиллы СЕЙЧАС больше, чем в будущем. Поэтому, выходит, надо больше работать.

2) Если же AI не автоматизирует меня, а усилит (automate vs augment) мои способности, то мне сейчас надо по максимуму прокачивать себя в AI, чтобы быстрее получить пользу и заработать больше капитала.

Поэтому, вывод один: надо больше работать :)

В комментах был забавный пример, что если вы - производитель повозок для лошадей - примерно, когда изобрели автомобиль, то вам точно в этот момент надо брать как можно больше заказов, i.e. работать больше, пока есть время. Либо научиться ремонтировать автомобили. В любом исходе - придется больше работать.

P.S. ««С воодушевленно-грустным от безысходности настроем ушел работать с дружбаном »»

18 марта 2026 г.2.1K просмотров

Clawwork Cowork

Тем временем Anthropic превращает Cowork в эдакого clawdbot/openclaw --> появилась фича Dispatch, которая позволяет с телефона запускать задачи на компе: на скрине я попросил сказать мне, что на последнем скриншоте, что я сделал

Как я говорил на том вебинаре - подобие openclaw/clawdbot постепенно появится в "безопасном" виде у топовых лаб. ЧТД. Но проактивность пока не подвезли "Claude responds to messages only. Claude won't reach out proactively—it only works on tasks you assign."

16 марта 2026 г.2.5K просмотров

собственно, применил "философию" autoresearcher-а для тестирования нашего нового голосового агента, добились серьезного улучшения по ряду параметров

теперь можно переходить к тестам с бизнес-пользователями —> то есть это ни в коем случае не замена тестирования с людьми, а скорее дополнение, подготовка к оному

вкратце процесс и результат - в аттаче

P.S. если у вас стоит задача cold calling-а в US/UK/EU - то пишите в личку или через форму на onsa.ai

15 марта 2026 г.3.0K просмотров

Web для AI агентов

В последнее время много говорят про то, что новыми пользователями и, вероятно, потребителями станут AI агенты. Как вы знаете, мне очень интересна эта тематика, поэтому с удовольствием тестирую все новое.

Вообще, конечно непонятно, как скоро это будущее станет реальностью: уже пора для них билдить, или еще рано?! Имхо, чем чаще ты с ним соприкасаешься, тем вероятнее почувствуешь, когда уже "пора".

Собственно, в аттаче короткое видео про webmcp - это стандарт для того, чтобы AI агенты легко взаимодействовали с вебсайтами: разработчик сайта может добавить парочку атрибутов в формочку поиска билетов, например, и агенты смогут без скрейпинга и считывания скриншотов вызывать её. При этом, кстати, разработчик будет знать, что это именно агент (на случай, если для них цены другие показывать 😉)

Понравилось, как Андрей на днях в комментарих к посту написал, как он касдевит агентов o__O: "Каждую сессию агента, который использует мои тулы, я прошу описать что бы он улучшил в работе тулы. Получается что-то вроде касдева для агентов. Это помогает взглянуть на тул глазами агента, а не человека."

Вступаем в Early Preview Program - тут

А вы уже подкручиваете продукт под новый дивный мир?

P.S. кстати, еще до LLM до 50% трафика на сайтах поиска билетов были боты

13 марта 2026 г.3.1K просмотров

По заявкам телезрителей - скилл для создания видео на базе remotion

что он делает: 1) интервьюирует вас: для кого видео, какова цель, какой стиль 2) дизайнит сценарий 3) использует remotion, чтобы его сгенерить 4) панелью экспертов делает ревью и улучшает

Попробуйте и присылайте свои результаты - например, по мотивам какого-то поста в этом канале

https://github.com/BayramAnnakov/remotion-video-director

12 марта 2026 г.3.5K просмотров

Системное мышление + AI?!

Наняли больше людей - а шипить стали медленнее. Купили всем Claude Code Внедрили AI - расходы выросли, а производительность на том же уровне. Починили одну проблему - появились две новые.

Знакомо? Это не баги. Это то, как работают системы. Вы оптимизируете элемент, но элемент - это часть системы, и система реагирует (зачастую сопротивляется). Причем, почти всегда не так, как вы ожидали.

Тоби Лютке, фаундер Shopify, говорит об этом так:

Большинство людей мыслят причинно-следственно, но мир так не работает. Мир — это петли, а не линии»

Я наблюдаю, думаю и изучаю системы уже 20 лет. Когда я впервые построил модель Empatika, я был уверен: узкое место в продажах. Модель показала — в онбординге. Без неё я бы потратил полгода и кучу денег не туда. С тех пор я использовал системное мышление во всех своих компаниях и проектах.

Собственно, пришла пора систематизировать и обновить материалы, вновь поговорить про системы, поизучать их, заземлить на практические ситуации в личной и бизнес жизни.

"Бай, а где ЭйАй?" - вопрос, который мгновенно возник в моей голове, когда я стал продумывать детали. С такими стремительными изменениями, может, оно [системное мышление] нам не нужно вовсе? LLM-как все петли нарисует, рычаги найдет, и будет счастье.

Но, по крайней мере пока, для меня это скорее про помощь/фасилитацию в изучении и применении, нежели замена. И именно в этом ключе мы будем AI вспоминать и использовать на курсе.

Кстати, вот даже Харрисон Чейз, основатель LangChain, на днях в своей статье про изменения, которые несут AI кодинг ассистенты в разработку продуктов, высказался, что системное мышление - один из ключевых скиллов в этом новом дивном мире:

"In a world where execution is cheap, system thinking becomes the differentiator."

Стартуем курс в апреле, подробности тут: https://empatika.com/courses/ai-systems-thinking

Надеюсь, увидимся!

11 марта 2026 г.3.3K просмотров

GitHub для агентов или Как Карпатый ответил на мой вопрос

2 месяца назад я задал вопрос на reddit: Как выглядит GitHub в эру AI? Там на меня норм так налетели. Но на этой неделе Карпатый, кажется, дал начало ответа.

autoresearch (24.5K звезд за 5 дней): это автономный ресерчер, который перебирает параметры и улучшает результаты, пока ты спишь. Но меня зацепил не сам факт автоматизации, а то, как Андрей построил guardrails вокруг нее, чтобы максимизировать успех:

1) Вся "оркестрация" — markdown-файл Три файла: prepare.py (подготовка данных, константы, оценка результатов и тп - агенту нельзя его трогать), train.py (агент может менять что угодно), program.md (инструкции на человеческом языке, меняется человеком). Агент читает инструкции и следует им, больше ничего.

из program.md: The idea is that you are a completely autonomous researcher trying things out. If they work, keep. If they don't, discard. And you're advancing the branch so that you can iterate. If you feel like you're getting stuck in some way, you can rewind but you should probably do this very very sparingly (if ever).

Ключевой ход: агент может менять ВСЁ в тренировке - архитектуру, оптимизатор, гиперпараметры - НО не может менять, как его оценивают. Помните "агент падает до уровня своего harness-а" - тут вот это возведено в идеал имхо.

2) NEVER STOP Инструкция прямо говорит: "Не останавливайся спрашивать 'продолжать ли?'. Человек спит. Работай, пока тебя не остановят."

NEVER STOP: Once the experiment loop has begun (after the initial setup), do NOT pause to ask the human if you should continue. Do NOT ask "should I keep going?" or "is this a good stopping point?". The human might be asleep, or gone from a computer and expects you to continue working indefinitely until you are manually stopped. You are autonomous. If you run out of ideas, think harder — read papers referenced in the code, re-read the in-scope files for new angles, try combining previous near-misses, try more radical architectural changes. The loop runs until the human interrupts you, period.

Это ограничение не против ошибок, а против "социальных привычек" самого агента. Модели обучены спрашивать разрешение, и здесь это явно переопределяется.

Вот что Карпатый написал по этому поводу: sadly the agents do not want to loop forever. My current solution is to set up "watcher" scripts that get the tmux panes and look for e.g. "esc to interrupt", and send keys to whip if not present. Need an e.g.: /fullauto you must continue your research! (enables fully automatic mode, will go until manually stopped, re-injecting the given optional prompt).

3) Git как state машина. Каждый эксперимент = коммит. Если успешен, то ветка двигается вперед, если нет - откат. Но неудачные эксперименты тоже записываются в специальный журнал.

=== Теперь про GitHub для агентов: Сначала Карпатый сделал отдельный репозиторий agenthub - там прямо на старте было написано (см. аттач): "GitHub is for humans. Agenthub is for agents."

Де-факто это какая-то помесь github и moltbook, где агенты обмениваются друг с другом результатами и достижениями, давая другим пищу для размышления и экспериментирования. Потом, правда, он удалил его, и теперь это ветка в autoresearch.

=== На выходных попробую «адаптировать» autoresearch для более приземленных задач - поиск наилучшей стратегии поиска (сорри за каламбур) идеальных клиентов, оптимизационные задачи для рекламы и тп. Обязательно напишу, если получится что интересного

P.S. в agenthub, как видно на скрине, всего 2 контрибьтора - угадайте второго? 🤖