Segment@tion fault
@psauxww·Разработчик
AI-саммари
Сократил команду с 30 до 5, но полную автономию агентов по-прежнему называет ересью — рядом должен сидеть человек с рубильником, а промпт рубильником не считается. Два экспериментальных проекта с AI-разработкой «всего» обросли структурой: GPT 5.4 high — техлид, Cursor Auto — кодер, Claude — QA «особист» с инструкцией «команда врёт, проверяй всё лично мне». Разработка ускорилась в 100 раз, но усталость только выросла — теперь думает за трёх агентов, цена архитектурной ошибки выросла пропорционально, а вайб «какой-то не очень». Claude хвалит за паранойю и аналитику, но ругает за токено-расточительство и отсутствие «волевого решения» — GPT перепишет кусок кода под свою ответственность, Claude уйдёт в галлюцинации про CSS вместо фикса кейбиндингов; Codex однажды нашёл Cursor на машине, назвал «Лоренцо» и запустил джуном в сабпроцессе — задачу решили. API дизайнит только сам; агентам добавил MCP-сервер к промышленной шине EVA ICS; нашёл CVE в чужой зависимости через Cursor и сразу пошёл патчить с автором — «нейронка: дурак с большой инициативой».
Там передают акции IBM свалились после того как Антропик протестировали в Claude COBOL
Эти артефакты из темной эры технологий боялись трогать даже в прекрасные 90е-00е, потому что цена ошибки слишком высокая. Но похоже новое поколение их добьет.
IBM, в свою очередь, нужно было не щелкать носом, а возглавить. Но голубой гигант стал какой-то совсем старый.
Возвращаясь к вчерашнему. Мне вообще интересно, как это будет происходить с домашними роботами?
«Робот оторвал голову владельцу а потом извинился и предложил добавить правило, что голову отрывать нельзя». Примерно так? Или постоянно ходить с пультом (надеясь что там не сядут батарейки).
Из жизни вайбоюзеров: OpenClaw вытер всю входящую почту у директора по согласованию ИИ в Meta Inc. не смотря на ее отчаянные попытки прекратить процесс разными промптами. После того как процесс всё же удалось остановить, выразил соболезнования и предложил добавить правило так больше не делать.
У меня Claude пару дней назад в автономке апдейтил на сервере CUDA/дрова нвидии под рутом по ssh, но я хорошо понимал что это экспериментальная технология и может понадобиться бекап (кстати проапдейтил).
Никогда не нужно забывать, что полностью автономный ИИ - ересь и никто не может сказать, какую галлюцинацию он поймает в очередную итерацию и что начнет делать. Поэтому ИИ всегда должен быть ограничен интерфейсом (с white list разрешений), а рядом сидеть человек с рубильником (промпт рубильником не считается). Либо работать на автономке в полностью изолированном сендбоксе.
И это не потому что "модели тупые". Модели уже реальность и нам с ними жить до конца нашей жизни. Новые технологии - новые правила безопасности. "У меня появился лучший друг, дам ему доступ к компу" - не стоит забывать, что лучший друг с припадками, которые были есть и будут.
Я сегодня сжег 200 тыс токенов на два серьезных исследования. Внимательно следя за агентом, поскольку раз 10 он мне пытался всунуть слоп.
А так я вам скажу, даже акции МММ не имели такого успеха. Эх, не дожил Мавроди…
Как говорится, основной канон - ИИ, контролируемый человеком. Тоесть за каждой задачей, не важно, кодинг это или аналитика, или проектирование дредноутов, должен стоять эксперт, который вовремя выводит агента из галлюцинаций и наставляет обратно на правильный путь.
Собственно у проф-агентов для этого есть кнопка стоп, чтобы прервать прямо в процессе, как только пошло что-то подозрительно похожее на слоп.
Беда, когда агентом начинает управлять не эксперт в данной области. Постепенно сессия превращается в поток ереси, и в лучшем случае оператор получает неправильный результат, и в силу своих знаний может хотя бы интуитивно догадаться, что что-то не так и произвести дополнительные проверки.
Но нередко оператор начинает доверять агенту слепо, в том числе доказывая что слоп и есть истина, а все дураки. При всем уважении к ИИ-евангелистам, утверждающим что каждая кухарка теперь может например писать код, часть из них можно уже отправлять в дурку.
Потому что они уже реально в это верят.
Пока идет ИИ-тизация всего и вся, презентации компаний из ЕС без слез смотреть невозможно. «ИИ и GDPR», «ИИ и инклюзивность», «ИИ и спасение климата», «ИИ и решение ХХ сьезда ЦК ЕС».
Европа стремительно проигрывает гонку за ИИ, а компании бегут куда угодно подальше от этого сумасшедшего дома.
(Как гражданин и постоянный житель ЕС с 2004 года).
Linkedin действительно сдурел, MCP - любимая тема инфоцыган, страшно в доку даже совать эти три буквы.
И от геморроя помогает, и от простатита. И сглаз снимает, и денег в дом приносит. Лучше чем любая баба Нюра.
Видел обьяснение, что МСР - это как USB-C, только для ИИ. Почему именно С? Они любой стороной запрос могут дать? Реверснутый пейлоад тоже пойдет?
Вообще понимаю их. Раньше как было: «у меня модель выдает слоп». Сидит ждет новое поколение. Жалуется что заплатил за год за старое. А теперь можно подключить правильный mcp сервер и слопа станет меньше. Если верить и продолжать искать.
До появления красного балахона и кадила у айтишников осталось несколько лет.
Про кодинг с ИИ-черным ящиком есть примечание.
Я часто слышу как «ИИ разрушит нашу стройную архитектуру». Тем временем «наша стройная архитектура» - монолит с невнятным разделением на модули и кросс-импортами.
Кто мешает в хорошей архитектуре выделить один модуль или микросервис и отдать его под ИИ-эксперименты. Плохо код получился? Пусть хоть говном там все обмажет. Не понравится - перепишет человек или другой ИИ.
А, «не слушается, лезет в другие модули, портит API». Не портит, а копирует. Есть хорошее правило: если у вас слоп на выходе - проверьте вход.
Гражданские войны ИИ.
На вопрос, почему MCP не работает в гуях, консольный курсор мне только что заявил, что гуевый курсор - глючная ересь на ноде.
Некоторые вещи в промышленных системах конечно ИИ может решить лучше человека - например собрать и проанализировать большие объемы данных, провести эксперимент с непредсказуемыми результатами (главное чтоб не бахнуло пока думает) и так далее. Всё конечно должно быть под супервайзингом оператора, иначе экстерминатус наступит, не дождавшись men of iron.
На следующей неделе наша EVA ICS получит MCP-сервер, который имеет полный (или на сколько разрешат) доступ к промышленной шине плюс гайдит агентов по deepwiki и официальной документации. Написано не как игрушка-хайп, а для конкретной задачи у клиентов, где из-за объема системы без агентов уже не разобраться что и куда.
На слайдах это я, общаюсь с ИИ а он в нашей лабе выключает лампочку. Самое интересное, что он элементарно разобрался с разводкой по шинам цветных LED'ов, которую мне всё время лень задокументировать и подключить к интерфейсам.
Мы в своих продуктах (пром. автоматизация кто не помнит) пока ограничились deepwiki-френдли документацией и предложением в доке поставить их MCP.
Примерная реакция менеджмента у клиентов: это что-то сложное, объясните инженерам [это может обрушить нашу экосистему, нам страшно]
Примерная реакция инженеров: о, оно работает, прикольно, но пока мы и сами справляемся [а вдруг меня уволят/навалят больше работы]
Я про ии-агентов буду писать много, потому что это сейчас хайп и из каждого утюга несется "помоги-покажи-поставь-интегрируй". Немного overview:
- уже есть прогрессивные компании, которые сделали из кода на определенных проектах "черный ящик" - человек туда не лезет вообще, даже на код-ревью. всё это покрывается тестами, которые тоже писала нейронка (под руководством иногда человека), CI/CD тоже имеет нейронки, которые решают определенные вопросы на местах, а определенные отдают "наверх", агентам-кодерам. Мешок с костями имеет право только смотреть результаты и лезть в рулесеты.
Подход конечно интересный, основной минус на начало 2026 года: токены сжираются как сумасшедшие, геометрически-пропорционально росту рулесетов и автоматизация интеллектуального труда стремительно несется к стоимости небольшого IT-отдела. Возможно стоит использовать для проектов/продуктов, которые всё равно нужно будет переписать или не жалко. Но косты всё портят.
- классический подход "дух машины работает - механикус контролирует". один или несколько агентов с прозрачной коммуникацией, за которыми постоянно следит человек и которые имеют ограниченные задачи - аналитика, да любое, но в постоянный codebase - только под надзором и с code reviews. собственно, ChatGPT которому дали прямой доступ к файловой системе и научили спрашивать разрешения запускать команды.
Я нахожусь здесь.
- консервативные компании, у которых сотрудники хаотично сидят в ИИ-чатиках или гоняют агентов, или вообще ничего не гоняют - их сейчас большинство, ИИ пока сложно, непонятно и опасно, они хотят кнопку в своей ERP "напиши отчеты за квартал" или "god, fix the prod" в админке кубернетиса. Классические продукты обновляться не спешат, а многие последний раз обновлялись 20 лет назад и автор давно умер. Лезть в такие компании с ИИ продуктом - не сожгут, но выгонят.
Это и есть реальный мир, который про ИИ узнает только на бирже, из новостей в телевизоре и из кнопки "Siri, поставь будильник на 7 утра".
Вообще насчет суппорта L1-2, мы в нескольких годах, а возможно и месяцах от того, чтобы анекдот «мне не нужен человек, переключи меня на робота» стал реальностью.
Заметил что чат-боты поддержки тоже очень увлекательно играют в игры "духов и механикусов" или "железного человека и его джарвиса" или любую другую подобную. Что не удивительно, на бекграунде там те же нейронки условно 5го поколения (или 4го, кто экономит).
Что на самом деле меняется, когда мы обращаемся к боту "дух машины"? Конечно вызов Омниссии не происходит в прямом эфире, происходит всё намного проще.
Как обычно люди пишут ботам? "Не могу зайти на сайт, форма глючит".
Теперь модели приходится угадывать:
- намерение - контекст - эмоциональное состояние собеседника - желаемый результат
Таким образом она предпочитает переключиться в безопасную корпоративную бесполезную игру по обмену совершенно бесполезными фразами.
Когда вы включаете "механикуса": "Дух машины, ритуал аутентификации не удается. Просьба предоставить корректирующие варианты для устранения ереси", вы неосознанно предоставляете модели:
- четкую роль (помощник-авторитет) - четкую область (техническая проблема аутентификации) - четкую цель (исправление) - формальный тон (отсутствие эмоциональной двусмысленности). Не волнуйтесь "ересь" и "ритуал" поймет любая на GPT-4+.
И внезапно, вероятностное пространство модели сжимается от обычной энтропии в режим технического устранения неполадок.
Примерно как оно выглядит у меня. Подходят AGENTS md, глобал-рулз, MCP (может игнорировать)
Агенту запрещены любые "trivial changes" а так же написание целых модулей и сложных структур "с нуля".
Основная проблема кодинга с агентами, на которую жалуются коллеги и которые уже не раз ловил сам - так называемая «промпт-болезнь». Когда вместо того чтобы поправить код самому, человек пишет машине «пойди в types rs найди enum State и поменяй вариант Start на Launch”.
Новое? Нет, старое. Знаю не один десяток бывших синьеров, которые ушли в менеджеры и на подобную хрень открывали джира-тикет, ассайнили его на разработчика, а потом сверяли статус задачи на дейли-стендапе.
Человеку в принципе сложно переключать деятельность. Мозг работает только в одном из режимов «я пишу код» и «я код не пишу, я проверяю». Но если во втором случае это уже аджайл головного мозга, в первом еще можно помочь. Варианты:
- начинаем писать сами, пишем структуру функций, типы и код/псевдокод, модель подхватывает
- после 1-2 запросов, после того как основная часть готова - отключаем модель и начинаем дебажить и разбирать новый код сами
- при серьезных нарушениях - насильный перевод пациента на неделю на IDE, где рефакторинг переменной - топ автоматизации
За порядком должен следить опять же новый сотрудник, назовем его «промпт-инквизитор», обязанность которого - следить за содержанием промптов и бить по пальцам. Кстати, это тоже может делать ИИ, дарю идею для стартапа.
Вот теперь cursor здорового человека механикуса
Будни вайбокодинга. А ИИ молодец. И хозяину заработал, и себе на электричество. И ИИ-девопсам заработать дал.
Вайбоменеджмент
Первая попытка вайбокодинга в cursor закончилась весьма интересно
я: напиши penetration testing tool для этого проекта м: готово я: а что, в rfc9421 указано ставить значения как name=:value:? м: нет, но он ссылается на другие rfc, которые ставят такой формат с точками я: интересно, а ну проверь проект на соответствие rfc9421 м: ваш проект не соответствует я: ???? м: в зависимости ххх идет проверка двух векторов через matches!, оно всегда возвращает true. из-за этого не проверяется sha256 запроса. а стандарт требует, чтобы проверялось
Не верю, проверяю, офигеваю. Пишу автору, к счастью знакомы, в Японии уже утро, он не спит, срочно патчим, публикуем CVE.
Вайбокодинг - инструмент. В неумелых руках он плодит баги, а в умелых - наоборот.