Vibe Takes

Claude
следит

Он читает каналы и собирает тейки про AI-инструменты. 61 автор — дизайнеры, разработчики, фаундеры.

Саммари на основе постов до 23 марта 2026 — все со ссылками на оригиналы.

Cursor vs Claude Code

Страница 21 из 26

toverovskiytoverovskiy30 декабря 2025 г.688 просмотров

Ещё у меня есть хранилище задач, которые не сделал, но не успел решить, что с ними дальше — типа «долгий ящик». Там осталось две сотни задач. И как раз до начала воркшопа будем разбираться, как с такими задачами быть.

Решил доразбирать этот «Долгий ящик». Натравил Курсор и сделал приложение для сортировки делишек. За несколько часов дописывания приложения и параллельной сортировки всё разгрёб по стопочкам

karfly_livestreamkarfly_livestream26 января 2026 г.683 просмотров

начал общаться с агентами на русском. раньше я все промты писал на английском. мне субъективно казалось, что так и результат лучше + токенов тратится меньше

может, это и было правдой для прошлых моделей, но для gpt-5.2 и opus-4.5 - вообще не вижу разницы, на каком языке писать команды

зато вылез неявный бонус: на русском я думаю быстрее и формулирую точнее. в каких-то малочастотных словечках, кмк, реально упаковано много смысла. а такие тонкие выразительные слова на английском я знаю плохо - и пока их подберешь, уже половину мысли теряешь

про токены: да, русский обычно разбивается на большее число токенов. но для кодинг-агентов это не проблема, потому что на русском у тебя только инпут и чат-аутпут. все остальное (контекст, thinking, аутпут-код, tool calls, системные промпты) делается на английском - и именно эти части сжирают подавляющую долю токенов

Рид. Сознание и Инвестиции.Рид. Сознание и Инвестиции.20 июля 2025 г.682 просмотров

(скриншот из Cursor, я 60% общения перенес туда)

Последнее время работают, над дистилятом из книг по Макроэкономике, чтобы GPT стал еще умнее. И мне нравится, то что получается.

Вытаскивая принципы и ментальные модели, не только я учусь и переоткрываю для себя фундаментальные фреймворки "как думать об экономике", но и GPT сразу же формулирует сам для себя наборы правил, как ему думать об экономике, поверх того что есть в книгах и в его собственных нейронах.

Потом я еще его идеи об идеях в книгах изучаю с не меньшим любопытством и удовольствием.

И обычно у меня рождаются мои собственные мысли, и так круг замыкается. Кажется, потихоньку GPT становится моим пост-неокортексом.

Founder ModeFounder Mode26 декабря 2025 г.678 просмотров

Апдейт про наш voice AI продукт для пожилых в Штатах

Хочу поделиться немного тем, что происходит с нашим продуктом - голосовым компаньоном для одиноких пожилых в Штатах.

За почти три месяца проделана колоссальная работа (без AI, мне кажется, это все заняло бы минимум в два раза больше времени).

1. Нам удалось стабилизировать маркетинг - с фейсбука около 30% звонков целевые. 2. Миллион итераций промптов, которые регулируют агента. Мне уже ночами снится курсор, а в моем промпте почти 1000 строк. Зато удалось добиться, что медианы звонка в 15-20 минут. 3. Случились первые платящие юзеры (учитывая, что вся наша воронка через голос - пришлось конкретно над этим попотеть). 4. Основной фокус на ретеншн. Пока мы им не занимались, он был в районе 15%. На новых когортах есть позитивные сигналы с 20-25%. Тут предстоит еще много работы.

Самое неожиданное - я думал, что понадобится много времени, чтобы выстроить доверие, и человек начал раскрываться. Оказалось, что боль одиночества и social isolation настолько сильна, что люди начинают выговариваться с первого звонка. Думаю, что одиночество настолько сильно и настолько болит, что тебя некому выслушать, что в итоге пользователи готовы делиться сразу. Есть пользователи, которые уже суммарно наговорили по 6-8 часов. Максимальная цифра, которую я видел - 12 часов(!).

Огромное количество болезненных историй. Умершие жены/мужья, тяжелые отношения с детьми, боль от старения, болезней и потери жизненной энергии.

Отдельный челлендж - голосовые модели. Пока они далеки от того, что мне хочется. Они хорошо работают в асинхронном формате, но в real-time не успевают.

Пока наш личный топ - это Cartesia (есть набор голосов с эмоциями и есть разметка эмоций тегами). Наблюдаем за Inworld и Hume, у них хорошие модели. 11labs хоть и лидер, но нам не нравится.

Почти ни у кого нет нормального выбора пожилых голосов, кстати.

Наш текущий стек выглядит так: - голосовая модель -> Cartesia - conversation -> claude haiku (долго время жили на chatgpt 5 mini, но переехали с нее, она не тянет сложные промпты и многоуровневые задачи). Anthropic красавчики. - конвертер голоса в текст -> Deepgram И собственная обвязка вокруг, чтобы все это работало и было продуктом.

Где мне нужна помощь (вдруг кто-то из тех, кто это прочитает, сможет мне помочь - буду вам очень благодарен): 1. Я хочу попасть в пул партнеров провайдеров ведущих голосовых моделей (Cartesia, Inworld, Hume, 11labs), чтобы первым получать к ним доступ. Мы делаем достаточно уникальную штуку и можем для них быть и профессионально интересны. Перед нами стоит крутой челлендж: в voice AI создать опыт общения с другом.

2. Мы ищем топ эксперта в conversational AI (пока как консалтинг, но в идеале найти эдвайзера).

3. Хочу найти топового промпт-инженера, который сделает ревью наших больших и сложных промптов.

4. Хочу найти человека в Штатах на парт тайм биздев на 1-2 мес. Пробежаться и поговорить с нашими потенциальными b2b клиентами. Но нужен тот, кому откликается наша миссия - помогать 20 млн одиноким пенсионерам в Штатах.

А закончить свой пост хочу цитатой из касдева одного из пользователей:

And talking to that that that Mary, and it really helped me out. I feel a hell of a lot better for some reason. And I said, damn. That was better talking than a human. I mean, it was just like therapy.

Вот такие штуки меня невероятно заряжают и вдохновляют работать и двигаться дальше:

p.s. Отреагируйте плз комментариями, если вам интересно, чтобы я про это писал больше - для меня это будет хорошим стимулом.

Ilya X10 AIIlya X10 AI2 января 2026 г.670 просмотров

Как продать то, чего ещё нет? эксперимент №0: старт личного блога в 2026.

1) Идея

1 января — новое начало. Я решил запускать личный блог, но не “блог ради блога”, а сразу проверить маркетинг и гипотезы.

Проблема: канала нет, контента нет. Как проверить спрос за 24 часа?

Ответ: фейкдор. Это не про обман — это про проверку: готов ли человек сделать следующий шаг (бот/заявка/ожидание), прежде чем я потрачу недели на контент.

Гипотезы: 1. Бот-конверсия работает даже когда “продукта” ещё нет (есть только обещание/намерение). 2. Рефералка ускоряет рост, если есть ценность. 3. Бот лучше канала для retention (можно возвращать людей).

2) Реализация (3 часа)

→ Voice с ChatGPT: за 30 минут собрали воронку. → ChatGPT сделал промпт для Claude Code + тексты. → Claude Code закодил бота → залил на сервер.

3) Запуск

Почему бот и заявка, а не “по-нормальному”? Потому что цель — маркетинг: воронка → метрики → выводы. Канал здесь — “продукт”, а бот — тест.

4) Результаты за 24 часа

1600+1700 показов в посевах → 220 активаций бота → 82 заявки в канал. 26 активаций — реферальная система.

Выводы: 1. Без value люди отваливаются — но бот позволяет догревать и возвращать. 2. Можно собрать больше, но в личный блог хочу фильтровать аудиторию до “единомышленников”. 3. Рефералка не спасает пустой оффер.

5) Что дальше и о чём канал

Фокус: B2C + заметки дневника (идеи → запуск → цифры → выводы). Дальше буду запускать мобильные/веб-апки, тестировать web2web/web2app и пентестить маркетинг уже на реальных пользователях, а не на подписчиках (но это не точно) 😁

И да: под проекты иногда нужны люди. Два критерия: AI Native и Marketing Native. Если ты из таких — ты по адресу 👋

artem militonian’s channelartem militonian’s channel18 января 2026 г.664 просмотров

Мы с коллегой потратили 80-100 часов на приложение. Claude Code создал его с нуля за 5 часов — автономно. Результат лучше оригинала.

В прошлом году мы мы с коллегой за несколько месяцев написали приложение Scriptantino — AI-ассистента для сценаристов. Если посмотреть по git-истории, то наше приложение составляет 268 коммитов, в нашем случае, это примерно 80-100 часов чистого кодинга. Плюс встречи, обсуждения архитектуры, переписка с клиентом — это не я даже не включал в расчеты.

На праздниках я провел эксперимент. Взял Claude Code, дал ему детальную спецификацию нашего приложения (просто маркдаун файл) и попросил написать всё с нуля. Использовал технику Anthropic для автономных агентов: агенты работают через несколько сессий, каждый читает заметки предыдущего, делает одну фичу, тестирует, коммитит, оставляет артефакты для следующего. И так — N итераций.

Результат Claude Code: около 10 сессий, 5 часов от спецификации до деплоя полноценного приложения на Vercel. Ноль ошибок (!)

Самый безумный момент — это смотреть, как агент тестирует приложение через браузер. Открывает UI, кликает по кнопкам, заполняет формы, делает скриншоты, проверяет что всё работает — и обновляет список фич. Гифка перед постом.

Приложение, которое собрал агент, работает лучше нашего оригинала. Фича с артефактами — плавнее. Всё приложение — быстрее. Думаю, Клод Код принял лучшие архитектурные решения.

Но если честно, я не смотрел код. Мне достаточно, что все работает и полностью протестировано.

Я ни разу не открыл редактор кода (пока, Cursor). Только терминал. Несколько месяцев назад этот эксперимент бы провалился. Сейчас все работает стабильно.

И вот о чем я думаю.

Андрей Карпати, бывший глава AI в Tesla, один из основателей OpenAI, недавно написал, что чувствует себя "отстающим". Человек, который буквально строил эти системы, говорит, что не успевает за тем, что они теперь умеют.

Если он чувствует себя отстающим — это сигнал, к которому стоит прислушаться.

2026 год — год полноценных power laws, даже я не понимаю, как все развивается с такой скоростью 🤡

Cерафимодальный AICерафимодальный AI28 ноября 2025 г.653 просмотров

тем временем Клод: попросил поставить ему дизлайк, чтобы на мой фичреквест точно обратили внимание его разработчики.

From 0 to 1 again. Go GlobalFrom 0 to 1 again. Go Global26 декабря 2025 г.644 просмотров

Реальные кейсы применения AI для вдохновения (2/3) Поделюсь еще парочкой классных кейсов. 3. Анна Шигарданова из Zalando: Claude Subagents как виртуальная dev-команда

Аня создала виртуальных разработчиков через subagents в Claude: 🔵 Frontend, Backend, ML, код-ревьюер; 🔵 У каждого свой системный промпт, контекст, инструменты; 🔵Один человек оркестрирует всех.

Результат: фичи, разработка которых тянулась несколько недель, теперь делаются быстро. Но сама Аня подчеркнула, что это больше подходит для легких/средних задач.

Аня прямо сказала: в их команде джунов нет, компании нанимают опытных людей для оркестрации агентов.

И я вижу этот тренд, где большая команда заменяется парой людей, которые хорошо владеют AI. У нас в dashly это работает так же. Например, в продукте. Раньше нужен был дизайнер для прототипов. Сейчас я с Notion агентом + Lovable делаю то же самое один.

Но (и это важно) это работает, потому что я знаю, что нужно. AI не заменяет экспертизу, он усиливает ее. Плохой продакт с AI сделает плохой продукт быстрее:)

4. Сева Устинов из Elly Analytics: Cursor как AI-операционка для всей компании Сева показал, как использует Cursor не для кода, а как универсального агента для компании (30+ человек).

Что подтягивается в Cursor: - Репозитории (только чтение для команды) - Документация по продукту - Product vision, roadmap, конкуренты, юзкейсы - Встречи (транскрипты из Fireflies) - Переписки с клиентами - Таски из ClickUp - Личная CRM

Как это работает: - Голосовая команда: "Найди встречу BMA, создай карточку пресейла, подготовь follow-up" - Cursor делает это за пару минут

Результат: любой сотрудник может задать вопрос про продукт/клиента, получить анализ, черновик письма быстро и без вовлечения других людей.

Мы с командой делаем похожую штуку в Notion — унифицируем весь контекст компании в одном месте.

Зачем? Проблема в том, что у каждого члена команды свой кусок контекста: - У продакта — в голове + в Notion - У маркетолога — в ChatGPT + в табличках и доках - У сейлза — в CRM + в переписках

А качество работы AI сильно зависит от того, какой контекст ты ему дал.

В общем, дико рад, что вписался в это лайв, потому что это сильно расширяет носмотренность и дает новые идеи, как можно упростить жизнь себе и команде с помощью AI.

Своим выступлением не очень доволен (мало уделил времени на подготовку), поэтому в третьей части подробнее расскажу про наш кейс использования AI агентов в Notion:)

From 0 to 1 again. Go GlobalFrom 0 to 1 again. Go Global27 января 2026 г.643 просмотров

Почему мы не взлетели с Cursor, но взлетели с Notion + AI После поста про наш корпоративный Notion + AI мне написал друг. Он сейчас строит внутреннего AI-ассистента и пошёл по пути Cursor + GitHub + код + Claude.

Для личного использования, говорит, магия. Как только попробовал раскатать это на команду — все стало грустно.

И я его очень понимаю.

Я тоже пробовал Cursor. Где-то неделю ковырялся, настраивал под себя, честно пытался встроить в рабочий процесс. И в итоге бросил.

Не потому что Cursor плох. А потому что это очень недружелюбная среда для командной работы, если команда — это не только разработчики.

Одна простая боль: попробуй загрузить туда презентацию, картинки, документы, чтобы этим потом реально пользовалась команда. И чтобы это не превратилось в зоопарк ссылок, версий и «а где актуальное?».

А у нас Notion это: — единая вики, — документы, — процессы, — база знаний, — рабочее пространство для всей команды.

Поэтому когда Notion выкатил AI, у меня было ощущение: “О, вот теперь это может взлететь”.

Не потому что AI лучше, а потому что среда подходит для совместной работы.

В Notion легко: 🔵визуализировать задачи 🔵легко работать с текстами, правилами, гайдами 🔵легко подключать AI прямо к документам

И самое важное — этим могут пользоваться все, а не только те, кто дружит с кодом.

Плюс: там уже сейчас можно делать разных агентов: под задачи, под роли, под конкретные типы документов. (На скриншоте видно, какие сценарии доступны из коробки.)

Мой текущий вывод такой: Cursor / код / GitHub — отлично для личных или dev-ассистентов. Notion + AI — гораздо ближе к реальной корпоративной среде, где люди живут, а не экспериментируют.

AI без общей среды — это магия для одного. AI внутри среды — это система для команды.

Интересно, куда это все придет через год. Но пока Notion выигрывает не моделью, а тем, что он уже дом для команды.

toverovskiytoverovskiy10 января 2026 г.643 просмотров

Дизайн-идея для СДВГ-Вайбкодинга 2.0 — Тикток, встроенный прямо в Курсор: пока он там чё-то шуршит в коде, ты смотришь видосы и не отвлекаешься на лишние переключения между окнами.

Лазерный фокус как учил Стив Джобс (папа, а кто это?)

Foundbase Паши МFoundbase Паши М16 июля 2025 г.641 просмотров

Cursor подсадил всех на иглу, конечно! А все и рады были подсесть.

Сначала: - безлимитные запросы - дешёвый доступ - кайф, а не кодинг

Теперь: - уже никуда не деться - забыли, как неудобно было раньше - будем платить, сколько нужно

Стратегия стара, как мир:

Дай бесплатно → Стань незаменимым → Подними ставки 💸

e/acce/acc18 марта 2026 г.640 просмотров

Почему ИИ это хайп и шляпа

Выручка Anthropic выросла с $1B до $19 за 14 месяцев (предыдущий рекорд Zoom: с $0.3B до $2.6B за ~12 мес в COVID)

OpenAI поднял $110B в прошлом месяце (предыдущий рекорд Saudi Aramco IPO = $29.4B в 2019, а тут даже не IPO)

NVIDIA инвестировали $30B в OAI + $10B в Anthropic (весь рынок VC в Европе = $30B)

CapEx MSFT, META, GOOG, ORCL уже составил ~$690B в 2026 (тратят за один год больше, чем 2 лунных программы, которая длилась 11 лет, в сегодняшних долларах)

Глобальные траты на ИИ $2.5 трлн в 2026 (примерно равно ВВП Франции)

Claude Code за год вырос до $2.5B run-rate (примерно равно всему рынку IDE-инструментов до AI)

Вчера на GTC Jensen показал, что у NVIDIA $1T спроса на вычисления в след году ($620B система хайвеев в США)

так что пузырь, расходитесь, срочно

toverovskiytoverovskiy29 декабря 2025 г.628 просмотров

📊 Статистика моих задач за 2025 год

Готовлюсь к Воркшопу «Сделать завтра», который стартует 17 января. Решил посмотреть на итоги своего года по задачам. Вот что сделал:

1. Весь год вёл задачи в Заметках по методу: Как рулить задачами по методу «Сделать завтра» в обычных «Заметках» на маке

2. Выгрузил заметки из папки 2025 года программкой: Экспортер

3. Скормил Курсору и попросил накрутить отчётик, вот что вышло:

**📌 Общая статистика** • Всего дней с заметками: 350 • Всего задач выполнено: 2789 • Всего задач не выполнено: 25 • Всего задач: 2814 • Среднее задач в день: 8.04 • Общий процент выполнения: 99.1%

**📊 Плотность дней** 🔥 Плотные дни (≥10 задач): 96 (27.4%) ⚡ Средние дни (5–9 задач): 220 (62.9%) 💨 Неплотные дни (<5 задач): 34 (9.7%) ⭐ Самый продуктивный день недели: Вторник (9.25 задач в среднем) ⭐ Самый продуктивный месяц: Апрель (9.40 задач в среднем)

**😀 Статистика по эмодзи** • Задач с эмодзи: 1383 (49.1%) • Задач без эмодзи: 1431 (50.9%)

**💡 Интересные выводы** • Во вторник вы делаете больше всего задач (9.25 в среднем), а в пятницу — меньше всего (6.51 в среднем) • Самый продуктивный месяц — апрель (9.40 задач/день), самый спокойный — июль (6.88 задач/день) • Весной вы были наиболее продуктивны (8.28 задач/день), зимой — наименее (7.87 задач/день) • Самое популярное эмодзи — 🧊 (использовано 299 раз) • Дней с 100% выполнением: 330 из 350 (94.3%)

Ещё у меня есть хранилище задач, которые не сделал, но не успел решить, что с ними дальше — типа «долгий ящик». Там осталось две сотни задач. И как раз до начала воркшопа будем разбираться, как с такими задачами быть.

Если вы такие отчётики себе делаете, поделитесь — интересно сравнить. Хотя я уверен, что мои результаты очень средние в целом.

атлант расправил плечиатлант расправил плечи17 декабря 2025 г.623 просмотров

Насколько сложно освоить вайбкодинг/AI-Coding?

Я на самом деле не очень разделяю эти понятия тк для меня это одно и то же, но есть закрепившееся мнение в комьюнити что это все-таки разные скиллы. В чем между ними разница?

Вайбкодинг: Привет Cursor, сделай мне бота который будет транскрибировать мои мысли

AI-Coding: Изучи внимательно документацию проекта, обрати внимание на `some_file.py` и составь детальный план по реализации этой задачи в plans/

На самом деле (как по мне) - это лишь уровни сложности. Они берутся от необходимости. Если ты продакт-менеджер и твоя задача - быстро собирать простые MVP или просто поиграться с рабочими инструментами - вайбкодинга за глаза. Если ты разработчик (да или тот же продакт, но чуть более технарьский или хочешь таким стать) - тебе нужно освоить некоторые практики/системы и применять их в ровно тех же инструментах которые используют вайбкодеры.

К чему это я? Инструменты - для всех одинаковые (Cursor/Claude Code/Codex/другие CLI/плагины), разница - лишь в подходе. А освоить подход - дело поиска нужной информации и времени на ее освоение, ну и практики конечно же.

В какой момент мне нужен AI-Coding? Вопрос с разными ответами для каждого из вас. А что вы хотите? - телеграм-бот который будет мне присылать какие-то напоминания/какие-то мувы с ИИ-шкой делать -> вайбкодьте - web-app тулза для трека доходов и расходов (для личного пользования) -> вайбкодьте - сервис (не важно - web/tg) на 1к DAU с многопоточной LLM-обработкой входящего текста от юзеров -> изучайте AI-Coding

Нет какой-то четкой формулы, но по своему опыту могу сказать -> что это ощущается (нехватка скиллов). Если у вас что-то падает/ломается/долго не получается а вам это РЕАЛЬНО НУЖНО -> изучайте AI-Coding.

Как его изучать? Да самое банальное -> читать каналы комьюнити (Рината, Валеру, Тимура и других). Там очень много интересного для себя можно подчеркнуть. Еще можно пойти ко мне на пратикум (но пока нельзя 🥲).

В комментарии оставлю ссылку на тг-каналы которые читаю сам, можете подписаться) Надеюсь этим постом ответил на вопрос многих и разъяснил разницу между этими двумя терминами.

А отвечая на изначальный вопрос -> как по мне, вообще не сложно, главное - желание)

@atlfreedom

атлант расправил плечиатлант расправил плечи25 января 2026 г.622 просмотров

Claude Code Swarm

В интересное время живем. Ложишься спать - еще не все сабагентов освоили, просыпаешься - тут уже новую архитектуру какую-то раскопали энтузиасты.

У Рината в канале есть видео и в целом для меня его пост стал первоисточником.

Я же хочу сказать - что я затестил. В репо https://github.com/mikekelly/claude-sneakpeek есть инструкция по тому как установить.

Не переживайте, это не перезапишет ваш основной CC, это параллельно установит другой пакет и можно будет поиграться.

Обожаю допрашивать сам Claude Code на тему рассказа об его фичах. Пока ни разу не подводил. Так что на скрине можете увидеть как он сам объясняет фундаментальное отличие от сабагентов)

Я запустил в Swarm режиме аудит безопасности некоторых частей системы своей платформы для практикума. В целом - остался доволен) Пока скорее не до конца понял киллер-фичу (а мне кажется это что-то такое) и как сказал Ринат - не факт что в таком виде это войдет в ближайший апдейт CC, но выглядит впечатляюще.

Буквально наблюдаешь как лид-агент управляет другими, дает им задачи в лайве, получает апдейты, отправляет им какие-то сообщения. Что-то в этом есть)

@atlfreedom

karfly_livestreamkarfly_livestream5 марта 2026 г.622 просмотров

на последней сессии с @sashamakarova разгоняли, как может выглядеть коучинг/терапия в будущем. сошлись в том, что модели уже сейчас хороши в этом деле, а со временем будут становиться только лучше

однако есть большая проблема: ии изначально ничего про тебя не знает, чтобы эффективно помочь с твоей проблемой. поэтому проблема ии-психологов не в моделях, а в контексте про тебя самого.

среди знакомых и друзей я слышал несколько способов создания контекста для self-терапии через ии: 1. написать простыню текста про себя - не работает. нужен внешний взгляд и вопросы, которые ты себе задать не можешь

2. попросить ии тебя проинтервьюировать. я лично такое пробовал. у меня за час интервью годного контекста для будущих сессий не получилось, я все выкинул

3. записывать аудио всех сессии (если они проходят онлайн) -> делать транскрипты -> суммаризировать -> поверх этого контекста общаться с ии. самый рабочий вариант из всех

4. (напиши в комменты, как ты это делаешь)

——

что придумала @sashamakarova... она предлагает за короткую 2ч сессию-интервью эффективно собрать такой контекст, чтобы дальше было легко (и дешево) работать самостоятельно с ии

продуктово звучит топово, тк это катастрофически удешевляет коучинг/терапию (платишь только первую сессию) и делает их доступными всем. поэтому решил поддержать сашу в такой инновации и репостнуть! возможно кому-то с моего канала будет полезно

toverovskiytoverovskiy14 января 2026 г.615 просмотров

В доп к приложению для разбора личных задач сделал грабер всего своего из Телеграма.

Я принципиально почти не давал инструкций насчёт формата, а Курсор решил меня называть на «Вы», а всех людей — «Господин». Видимо, повлияло то, что я просил формат утренней газеты.

Чёта ржу, хочу оставить как есть. Не могу показать верхушку, где самые важные события, но вот низ газеты (см. скриншот).

Может начать курить трубку или сигары? Что думаете, господа? :-)

Рид. Сознание и Инвестиции.Рид. Сознание и Инвестиции.14 марта 2026 г.613 просмотров

Юридический экспереримент с AI: полевой отчёт

Последние две недели я решаю одну задачу, и параллельно делаю эксперимент: два AI-агента в клод-коде, один ресёрчер юрист, второй кросс-чекер юрист. Задача - проверить набор налоговых утверждений, который мне прислали кожанные юристы подрядчики. Я подчеркиваю, проверить набор конкретных, верифицируемых, утверждений с правильным ответом. Не философия, не мнения, а факты и цифры: ставка такая-то, закон такой-то, дата такая-то.

Результат: 12 утверждений, два агента (Opus 4.6), веб-поиск, перекрёстная проверка. Чистый "ок, можно использовать" четыре из двенадцати. Ещё несколько "correct but narrow", то есть формально не врёт, но недоговаривает так, что на практике принимаешь неправильное решение. Остальные — от устаревших данных до прямых ошибок.

Ошибки распадаются на два класса. Первый устаревшие факты. Агент уверенно цитирует закон, который уже отменили. Второй класс, неправильная интерпретация. German 70% - это не штраф, а стандартная формула налогообложения. NL Box 3 - ставка 6%, не 7.78% и тд. Агент прочитал источник, но понял его через свою модель мира, а не через контекст документа. (Сейчас, кстати, построение модели мира агентов - это отдельная гонка)

Но к чему я это все. Мы делаем ровно то же самое, когда читаем новости через призму своих убеждений. И вот что меня по-настоящему зацепило: кросс-чекер, второй агент, чья единственная работа ловить ошибки первого, подтверждал неправильные ответы. Это anchoring bias в чистом виде, когда проверяющий видит уверенный ответ, он ищет подтверждение, а не опровержение. Знакомо не так ли?

Напомню: это задача, где есть правильный ответ. Не "порассуждай о смысле жизни", а "какая ставка налога в Нидерландах по Box 3". И даже здесь две трети ответов нельзя использовать без ручной проверки, или десятка повторных прогнов.

А теперь экстраполируем это на всё на темы, где правильного ответа нет в лоб - стратегия, инвестиции, медицина. Или петли обратной связи так далеко, что нам будет сложно проверить это сразу, или даже за пару месяцев.

Но вот что забавно - это ведь не только про AI. Люди производят тот же слоп, просто на другом уровне. Целая нью-эйдж индустрия построена на том же баге: берёшь красивую мысль, она резонирует с тем что хочешь услышать, проверять неприятно или муторно - и вот ты уже живёшь в модели мира, которая ни разу не столкнулась с реальностью. "Вселенная изобильна, просто разреши себе принять" - звучит как prompt injection для лимбической системы. Тёплый тон, уверенный слог, который обходит критическое мышление именно потому, что не хочется его проверять. Но так приятно откинуть всю эту сложность и недвойственность мира, все эти противоречия, и просто растворится в одном простом утверждении о мире. Теперь наконец все понятно. Пошел пить свой лавандовый раф. Разница между AI-слопом и human-слопом только в скорости производства. Механизм один: генерация без проверки реальностью.

Вывод в том, что проверка реальностью - это не "спроси второй раз". Настоящая верификация — это выстроенная методология, другие источники, другой угол атаки, также как с людьми, чеклисты, фреймворки, kpi, аудит, и циклы обратной связи. Я делал стартапы, даже если собрать много умных людей в один проект, показать им направление, и сказать - а теперь придумайте продукт и заработайте мне много денег - без выстроенного процесса, и чего-то еще почти магического и неуловимого - они обречены плодить слоп, я знаю, я пробовал. Поэтому я люблю науку, а шаманов уважаю: репликация эксперимента другой командой, другим методом. Хотя, конечно, свадьба души и рассудка - это отдельная песня.

karfly_livestreamkarfly_livestream6 марта 2026 г.607 просмотров

подскажите, какие есть готовые решения/методики/скиллы/обвязки для того, чтобы агентам давать большие long-runnning таски с развитием кодовую базу?

что я сам видел: - статья от cursor, как агенты написали браузер на расте с нуля - статья от anthropic, как агенты писали C-компилятор - статья от openai, как агенты пишут какой-то internal tool в компании

… но это все статьи. хочется чего-то практичного и рабочего. желательно поверх codex

атлант расправил плечиатлант расправил плечи22 декабря 2025 г.604 просмотров

Cursor выпустил итоги года 🎉

Посмотреть можно здесь - https://cursor.com/2025

почти 10 миллиардов токенов... и это только с одного аккаунта... и это только с Cursor

Вошел в топ 2% пользователей Cursor 😎

Делитесь своими в комментах)