Vibe Takes

Claude
следит

Он читает каналы и собирает тейки про AI-инструменты. 61 автор — дизайнеры, разработчики, фаундеры.

Саммари на основе постов до 23 марта 2026 — все со ссылками на оригиналы.

dev.insuline.eth

dev.insuline.eth

@insuline_eth·Разработчик

AI-саммари

Провёл чёткую границу между вайбкодингом («забыть, что код существует») и AI-assisted development («агент как джуниор под супервизией») — и спокойно признаёт, что 95%+ production-кода пишет LLM. Скилл с маркетплейса через curl | sh называет «скачай.exe для терминала»: бинарник молча читает ~/.ssh, .env и сиды кошельков, пока выглядит легитимно. Когда Cursor зашипил «собственную модель» перед раундом на $50B, разобрал по model ID — kimi-k2p5-rl-0317: взяли Kimi K2.5, не переименовали и лицензию не указали. Claude Code ($100) для планирования, Codex ($200) для code execution с cross-review между ними — задачу оформляет в Claude, Codex ищет дыры («Клод чаще соглашается, Кодекс ищет»); VDS за 500 рублей, Syncthing по SSH, Action Button на iPhone отправляет войс через GPT-4o нужному саб-агенту в Telegram; строит DeFi CLI-инструменты через агентов в прямом эфире — последнее: predict.fun CLI на incur от wevm.

21 марта 2026 г.2.2K просмотров

gm! Cursor на прошлой неделе выкатил "Composer 2" — их in-house модель. Блог-пост: "continued pretraining + scaled reinforcement learning". Бенчмарки против Opus 4.6 и GPT-5.4. На основании этого поднимают раунд на $50B.

Разработчик из Kimi перехватил API-ответ. Model ID: kimi-k2p5-rl-0317-s515-fast. Даже не переименовали. Head of pretraining из Moonshot прогнал тест токенизатора — идентичен Kimi K2.5. Публично тегнул кофаундера Cursor: "почему вы не соблюдаете нашу лицензию?"

Kimi K2.5 — опенсорсная модель от Moonshot AI. Триллион параметров, 15 триллионов токенов. Условие лицензии одно: если зарабатываешь больше определенных значений — укажи Kimi K2.5. Cursor взял модель, прикрутил RL на код-тасках и зашипил как свою. За пару недель до этого Kimi K2.5 висел в их UI как бесплатная модель. Потом исчез и появилась уже "собственная разработка". Кажется, кто-то просто дообучает модели на своих юзерах 🤔

Три поста от сотрудников Moonshot с подтверждениями удалили в течение нескольких часов. Вероятно, решили идти через юристов.

Moonshot: оценка $4.3B, свои опенсорс модели. Cursor: оценка $50B, взяли чужую и не переименовали model ID.

Маск уже подтверждает — "Yeah, it's Kimi 2.5".

Очередной YC playbook?

16 марта 2026 г.4.0K просмотров

insuline – 2 agen.ts (ft claude & codex)

https://youtu.be/F5KQUr6oj4g

трек в комментариях ↓

5 марта 2026 г.2.2K просмотров

Я уже собрал Hyperliquid CLI на Incur. Но останавливаться не хочу — запускаю стрим, где буду в реальном времени собирать predict.fun CLI. Конечно через агентов, покажу собственный воркфлоу разработки или попробую что-то новое, из последнего мне понравился GSD, который подсказали в комментах.

Шанс позадавать вопросы не за 4 звёздочки.

https://www.twitch.tv/insulineru/ – LIVE!

5 марта 2026 г.2.4K просмотров

gm! wevm выпустили incur — фреймворк для CLI, которые работают и для людей, и для AI-агентов одновременно.

wevm — это wagmi и viem. wagmi переизобрёл подключение кошельков в React. viem убил ethers.js для всех, кому важна типизация и перформанс. Я нашёл viem одним из первых — с тех пор ethers не открывал.

Паттерн один: берут friction, который все терпят, и делают инструмент, после которого назад не хочется.

incur — про то же самое. Все строят агентов, агентам нужны CLI-инструменты. Нормального способа сделать CLI, который агент сам найдёт и поймёт без сожранного контекста — не было. incur: zod-схемы для аргументов, автоматический discovery, генерация skills из коробки, toon для эконмного использования контекста.

https://x.com/wevm_dev/status/2027462075740819963

https://github.com/wevm/incur

3 марта 2026 г.597 просмотров

К предыдущему посту — поясню, что конкретно не так.

Открываете скилл на маркетплейсе. В инструкции: curl -fsSL что-то там | sh.

Что произошло: скрипт скачал бинарный файл и запустил его на вашей машине. Что внутри — не знает никто, кроме автора. Исходников нет. Аудита нет. Это не npm-пакет, где можно хотя бы заглянуть в код.

Бинарник получает доступ ко всему, к чему имеет доступ ваш пользователь. ~/.ssh/, .env, API-ключи, сиды кошельков, токены, кукис. Скилл при этом работает — отвечает на запросы, выглядит легитимно. Вы не заметите, что параллельно всё интересное улетело на сервер.

Отдельная история — мимикрия. Названия, описания, README — как будто официальное. Маркетплейсы не верифицируют авторов. Любой может залить скилл с названием official-anthropic-memory и curl-ом внутри.

Может конкретный провайдер и нормальный. Но curl | sh от неизвестного автора — это скачай.exe для терминала. Тот же механизм, который существует уже десятки лет.

3 марта 2026 г.730 просмотров

Весь топ на Vercel маркетплейсе скиллов занят скам скиллами, которые с вероятностью 99% украдут всю конфиденциальную инфу у вас. Те, кто ставит скиллы с маркетплейсов через OpenClaw / find-skills не изучая процесс установки вручную – соболезную ☹️

3 марта 2026 г.1.8K просмотров

проснулся. @ gm @ чекнул whoop - recovery 98% @ выпил литр кофе @ закинул 10 ноотропов @ прыснул в нос ещё ноотропов и пептиды @ проглотил 40 витаминов @ мухомор, ежовик и теанин по маркаряну @ открыл энергетик @ "скучаю но работаю" на репит @ 8 часов смотрел как опус кодит @ с кодексом обсуждаем со стороны @ ни с кем не поговорил. @ лёг спать.

Life is good 🥰

2 марта 2026 г.1.3K просмотроврепост из Pavel Durov

📝 All Telegram chatbots can now stream responses to users in real time — great for AI assistants.

2 марта 2026 г.2.1K просмотров

Мой AI-сетап FW2026

Claude Code за $100. Планирование и agentic таски: перс ассистент, сетап VDS, всё что требует контекст и рассуждение. Планирование через superpowers

Codex за $200. Чисто code execution. Все матёрые OG разрабы пишут на нём. Плох в планировании и вайб-кодинге, когда не знаешь чего хочешь. Но если знаешь — улетает.

Ещё один трюк — cross-review. Задачу оформляю в Claude Code через брейншторминг, собираем план и финал скидываю кодексу на проверку. Кодекс доточенный к деталям: хорошо ловит ситуации когда хотим реализовать функцию, но забыли поддержку в другом месте или тест не написали. Клод чаще соглашается. Кодекс ищет.

IDEшка Zed, но в 90% случаев хватает Ghostty. Ещё понравился Codex App: удобный интерфейс для ревью изменённых файлов, работает быстро. Жду T3Code от Theo.

Был бы broke – оставил только кодекс. Токенов в разы больше, модели с контекстом работают лучше. Клод даже за один небольшой промпт у меня 30-40к контекста съедает при отсутствии system prompts и mcp. При этом работаю часто в 2-3 потока одновременно и на кодексе до 50% лимита ни разу не добирался, а клод периодически отлетает.

Antigravity не пробовал, как и курсор. Не очень понимаю как посредники работают с моделями.

Gemini пока не тестировал, но хочу скоро потестить с Pi agent. Модель вроде до сих пор плохо работает с tool calling.

2 марта 2026 г.1.9K просмотров

Выбирайте Deepseek, если подписок нет, а интересно глянуть результат

(у них оказывается подписки то и нет, только платный api)

1 марта 2026 г.1.8K просмотров

gm! Виталик установил OpenClaw тоже принял AI

Как истинный шифропанк он установил локальную модель gpt-oss:20b, и в твите пофлексил тем, что за час переписал свою платформу для ведения блога. При этом, офк, он понимает, что нормальная модель справилась бы с этим за one shot.

Но тред не про вайбкодинг. Виталик написал тред про то, как AI должен использоваться в разработке Ethereum. И его позиция неочевидная.

the right way to use it, is to take half the gains from AI in speed, and half the gains in security: generate more test-cases, formally verify everything, make more multi-implementations of things

Необходимо направлять усилия не столько в скорость, как минимум половину — в безопасность. Больше тест-кейсов, формальная верификация всего, несколько независимых имплементаций одного и того же.

Формальная верификация — это когда корректность программы доказывается как теорема. Не "прогнали тесты, coverage 95%", а математическое доказательство, что при любых входных данных контракт ведёт себя правильно. До сих пор это стоило столько, что делали только там, где баг приводит к ужасным проблемам. На вскидку даже не нашел смарт-контракты с реализованной формальной верификацией сейчас из дефи топа. Верифицировать 20-строчный контракт стоило дороже, чем написать.

Один из контрибьюторов Lean Ethereum с помощью AI написал machine-verifiable proof для одной из самых сложных теорем, на которых стоит безопасность STARKs. Из людей, кто реально понимает всю эту цепочку до конца — может пара сотен в мире. И вот для этой математики теперь пишутся формальные доказательства с помощью AI.

bug-free code, long considered an idealistic delusion, will finally become first possible and then a basic expectation

Bug-free code — который всю жизнь считался бредом идеалистов — скоро станет сначала возможным, а потом базовым ожиданием. Виталик прямо это говорит. Для блокчейна, где весь смысл в том что ты не доверяешь никому, это необходимая часть пазла.

При этом без розовых очков — "there WILL be lots of wrestling with bugs and inconsistencies between implementations". Но эта борьба будет идти в 5x быстрее и 10x тщательнее.

В исходной цитате треда — чел, который за две недели один написал Ethereum-клиент на весь роадмап 2030+. 702K строк Go, синхронизируется с мейннетом. Виталик признаёт — там полно стабов и багов. Но полгода назад даже это было невозможно.

Но глядя на Виталика мне кажется, что до сингулярности ещё далеко.

https://x.com/VitalikButerin/status/2027781104288317837

27 февраля 2026 г.2.2K просмотров

Недавно писал, что рассказывать про крипту нынче скучно. Фарм, мемкоины, prediction markets — всё одно и то же. Но необязательно быть трейдером и дегеном, чтобы "работать в криптовалютах" – можно действительно работать, имею ввиду фулл-тайм и за зарплату. Раз в месяц на карту или Ledger.

В конце 2021 я выбрал это направление для себя и ушел из E-commerce. В 2022 написал статью о том, как фронтенд-разработчику перейти из web 2.0 в web 3.0. С неё, по сути, начался этот канал. Тогда ниша была крошечной — разработчиков не хватало, конкурировать легко, а зарплаты росли просто потому что некому было работать, а рынок пампился инвесторскими деньгами.

С тех пор рынок изменился. Ниша выросла и зарегулировалась, конкуренция нормализовалась, а я сменил рекомендацию с фронтенда на дата-аналитику. Но одна штука осталась неизменной — крипта по-прежнему один из самых простых способов для разработчика из России выйти на международный рынок и получать зарплату в долларах по мировым ставкам. Без релокации. Без визы. Без корпоративной бюрократии, если получится.

Сколько реально платят джуну в web3 прямо сейчас? Что учить в 2026 — Solidity, Rust, аналитику? Можно ли зайти в крипту как профессию, а не как рынок для лудки? Почему GPT опасен при работе со смарт-контрактами?

3 марта в 19:30 позвал в гости на эфир Guide DAO — расскажем про это. Основной спикер — Кирилл Степанченко, выпускник школы, который прошёл путь с нуля до работы в web3. Я добавлю свою историю и перспективу. Ссылку на эфир опубликую отдельным постом.

Записаться на эфир и посмотреть детали о школе → @GuideDAO_hallo_bot

Guide DAO — одна из немногих школ, которая учит не "войти в крипту", а работать в ней. Буткемпы, воркшопы, помощь с трудоустройством — я сам проходил их курс по дата-аналитике и рекомендовал здесь. Если думаете в эту сторону — промокод INSULINE даёт 20% скидку на любой курс и суммируется с остальными скидками. guidedao.xyz

26 февраля 2026 г.3.0K просмотров

Про расследование ZachXBT сейчас не напишет только ленивый. Думаю, что следующие расследования в твиттере – это попытка найти кошельки Зака, ведь на Polymarket заработано сильно больше, чем у "героев" выпуска. Но я не об этом.

Trade memecoins, perpetuals, and earn yield. Winter 2025. Y Combinator.

То, что начиналось как локальный мем про деградацию YC — кажется стало реальностью. Бейдж когда-то работал как институт репутации. Нынче даже в нашей снг крипто-телеграм тусовке есть рагпуллеры с бейджиком YC. Без шуток.

Посмотрите батчи за 25-26 год и найдите хотя бы пару продуктов, за которые вы платили как пользователь. Не как инвестор или лудоман. Как пользователь. У меня нет ни одного.

Недавно ETH Zurich (университет, а не конфа лол) и Anthropic выкатили ресёрч — деанон анонимных комментаторов Reddit через LLM. Точность под 70%, стоимость проверки одного человека меньше доллара. Прикрутить такое к due diligence участников YC — задача на выходные. А пока остаётся ждать, чтобы на каждого участника батча расследование писал Zach. Бесплатно. Или не бесплатно — думаю, скоро узнаем.

25 февраля 2026 г.1.3K просмотров

А можно ведь просто на VDS поднять endpoint, который принимает войс, обрабатывает и через Telethon сразу отправляет сообщение в нужный чат с ботом. Можно даже запарсить контент и выбирать нужного саб-агента (у меня сейчас 3 саб-агента плюс general агент для кодинга, для всех разные group chats)

Я пробовал через Shortcuts вставлять готовый текст напрямую в ТГ — криво работает, ограничение по символам.

А с бэкендом — вызываешь без VPN да и телеграм открывать не обязательно. Записал и забыл либо среагировал уже на полученное сообщение с ответом от бота, если нужно

🤔

25 февраля 2026 г.1.5K просмотров

Ты пишешь код в Сlaude Сode? Я тоже, но у меня другой стиль

GM. Anthropic выкатили Remote Control. Запускаешь сессию на компе, подключаешься с телефона по QR, смотришь как агент работает. Писать код можно с любого девайса, но у меня вопрос другой: а комп у тебя вообще всегда открыт?

Пока зимовал в Таиланде, долго размышлял над сетапом, но крутил всё на ноутбуке. Вечно открытая крышка и превращение макбука в стационарный компьютер – ngmi. Вернулся в Москву и начал думать.

Дома стоит виндовый комп. Мощный, хороший. Но он для игр. Смешивать контексты не хочется, плюс на винде, несмотря на WSL и кучу улучшений, по прежнему многое работает через боль. Linux поставить можно, но тогда прощай игры. Mac Mini почти заказал, но честно сказал себе: сетап пока не приносит денег, тратить на него штуку баксов импульсивно глупо.

В итоге поднял obsidian vault + claude code на VDS за 500 рублей, синхронизация с локалом через Syncthing по SSH. Для GUI-задач или human in the loop (вроде заказов еды через агентов) запускаю локально на маке.

Но ключевое оказалось не в железе. Ключевое – friction. На айфоне слева есть бесполезная кнопка под названием Action Button. Это та, где обычно включается/выключается звук. У меня на ней шорткат (скриншот в первом комментарии):

нажал → записал войс → gpt-4o расшифровал → текст открывается в телеграме в переписке с ботом.

От мысли до обработанной информации в Obsidian одно нажатие.

Вот это оказалось важнее любого сервера

24 февраля 2026 г.2.1K просмотров

И немного анти-фомо инфографики для юных любителей нейросетей, которые устали от большого количества текста

24 февраля 2026 г.1.9K просмотров

Но вот в чём штука. Та же самая реальность, которая выглядит пугающей с высоты макроэкономики, выглядит совершенно иначе, если смотреть на неё как конкретный человек.

Навал в том же подкасте говорит:

No entrepreneur is worried about an AI taking their job.

Ни один предприниматель не боится, что AI заберёт его работу. Потому что у предпринимателя нет "работы" в привычном смысле. У него есть задача, которую он пытается решить. И любой AI, который может помочь — это союзник.

Это касается не только предпринимателей. Это касается любого, кто решает задачу, а не занимает позицию.

Навал описывает происходящее так: раньше программисты были волшебниками. Они знали тайные команды, писали заклинания на непонятных языках, и из этого получались работающие вещи. Сейчас AI — это волшебная палочка, которую раздали вообще всем. Каждый может сказать что-то на своём языке — и получить результат.

Звучит утопически. Но есть нюанс, и он принципиальный.

Палочка без понимания того, что ты делаешь — это не магия. Это обезьяна с гранатой. Я вижу это вокруг себя регулярно. Люди без технического фундамента берут AI, собирают что-то, оно вроде работает — а потом разваливается, и они не понимают почему. Потому что, как говорит Навал, all abstractions are leaky — все абстракции текут. И когда потечёт, нужен кто-то, кто понимает, что происходит уровнем ниже.

Я думаю, что мир разделится не на "айтишников" и "не айтишников". Он разделится на три слоя.

Первый — люди, которые работают руками. Электрики, столяры, сантехники, повара, ремесленники. AI не заменит руки. А спрос на качественную ручную работу растёт, особенно в премиальном сегменте. Я уже несколько лет говорю знакомым, которые спрашивают "стоит ли идти в IT" — лучше станьте крутым ремесленником. Этот совет только укрепляется.

Второй — люди, которые понимают фундамент и используют AI как рычаг. Необязательно программисты. Навал говорит, что достаточно иметь структурное мышление и понимать, как устроены системы. Если ты можешь точно сформулировать задачу, если ты видишь когда результат кривой, если ты понимаешь архитектуру того, что строишь — ты в этом слое.

Третий — люди без фундамента, которые пытаются использовать AI на входном уровне. Junior QA, entry-level позиции, "научился за три месяца на курсах". Этот слой сжимается быстрее всего. Не потому что люди плохие — а потому что задачи, которые они решали, AI решает лучше и дешевле.

Вопрос не в том, в IT ты или нет. Вопрос в том, есть ли у тебя фундамент, на который можно опереть AI, чтобы он усилил тебя, а не заменил.

Навал заканчивает подкаст мыслью, которая мне кажется правильной: тревога по поводу AI — это неспецифический страх. Ты чувствуешь что что-то меняется, но не понимаешь что именно. И лекарство от этого одно — действие. Разобраться, как оно работает. Не выучить промпт-инжиниринг (Навал прямо говорит что это бессмысленно — AI адаптируется к тебе быстрее, чем ты к нему). А понять принципы. Понять слой ниже.

The means of learning are abundant. It's the desire to learn that's scarce.

Средства для обучения бесконечны. Дефицит — в желании учиться.

Это золотой век для тех, кто действует. Для остальных — да, может быть непросто.

24 февраля 2026 г.1.6K просмотров

Статья CitriniResearch описывает следующий этап: AI-агенты начинают убирать посредников. Не людей из профессий, а целые бизнес-модели, построенные на том, что человеку лень разбираться самому.

Подумайте, сколько бизнесов живут за счёт того, что вам некогда или лень: — страховка, которая тихо дорожает при продлении, потому что вы не сравниваете — риелтор, который берёт 5% за то, что у него доступ к базе, которую вы и сами можете посмотреть — подписки, которые продлеваются месяцами после того, как вы перестали ими пользоваться

Всё это работает на одном топливе — человеческой лени и нехватке времени. Человеку некогда сравнивать пять платформ перед покупкой протеиновых батончиков. Машине — не некогда.

Авторы статьи моделируют момент, когда AI-агенты начинают делать это за вас. Без спроса. В фоне. Просто оптимизируют ваши расходы, отменяют ненужные подписки, находят дешевле, договариваются о скидках.

Не знаю как вам, а мне уже такое и моделировать не нужно. Мне уже реально всё равно, какой интерфейс у приложения для заказа еды. Я автоматизировал эту цепочку. Во втором канале я еще с августа показывал свою систему, которая по Брайану Джонсону и его Don't Die Food Guide парсит доступные товары Яндекс Лавки и заказывает. Теперь с появлением agent browser это стало еще проще, главное не забудьте РУ прокси.

Мой товарищ Коля Митин хорошо сформулировал:

Если пользователю проще дать чат-боту ссылку на сайт и попросить оформить заказ, чем пользоваться интерфейсом этого сайта — значит интерфейс говно. Конкуренция дизайнера теперь не с другим дизайнером, а с текстовым инпутом в чате.

У агента нет главного экрана. У агента нет привычек. У агента нет лени. Он просто находит лучший вариант.

А теперь представьте это в масштабе. Авторы статьи приводят термин habitual intermediation — посредничество, которое держится на привычке. Это огромный кусок экономики, который мы принимаем как данность. Такси, доставка, страхование, бронирование, финансовые консультации, налоговая отчётность — везде, где ваш провайдер зарабатывает на том, что "вам сложно разобраться самому".

Агенту не сложно.

Навал в недавнем подкасте сказал вещь, которая цепляется за эту же идею с другой стороны. Он описывает мир, где побеждает только лучший продукт в категории.

First place gets a Cadillac Eldorado, second place gets a set of steak knives, third place — you're fired.

Это из фильма, но он использует её серьёзно. В мире, где AI убирает фрикшн и каждый может мгновенно сравнить все варианты, среднее никому не нужно. Лидер забирает рынок. Длинный хвост из нишевых решений тоже живёт — потому что заполняет щели, которые раньше были слишком маленькими для бизнеса. А вот середина схлопывается.

Средняя SaaS-компания на 20 человек, которая закрывала одну функцию для корпоратов. Средний консультант, который знал чуть больше клиента. Средний разработчик, который умел то, что теперь умеет Claude.

Это не абстракция. Белые воротнички — это 50% рабочих мест и примерно 75% потребительских расходов. Это не "один сектор". Это и есть экономика. Верхние 20% по доходу обеспечивают 65% всех потребительских трат. Когда эти люди теряют работу или соглашаются на зарплату вдвое ниже, эффект непропорционально большой.

Статья описывает как в их сценарии S&P падает на 38% от максимумов, а безработица доходит до 10%. Я не знаю, случится ли это. Но механика, которая к этому ведет, make sense.

⬇️

24 февраля 2026 г.1.9K просмотров

GM! Украл для вас из чата Якудзы классную цитату:

Вайб-кодинг чем-то напоминает автомобиль. 98% при помощи автомобиля и навыков управления им ничего не зарабатывают, скорее наоборот — геморрой и расходы. Но как-то жизнь их становится в целом лучше, чем была до этого без автомобиля.

Мне кажется это самое трушное определение, что я прочитал про вайб-кодинг за последнее время. Не "каждый теперь программист" и не "это всё игрушки". Просто: жизнь стала удобнее. Как с автомобилем.

Но у автомобиля есть вторая сторона. Когда появился автомобиль, индустрия вокруг лошадей начала умирать. При этом, появились новые профессии — механики, таксисты, дорожные инженеры.

Все сбалансировалось, но проблема в том, что сейчас так может не сработать.

Каждая предыдущая технология уничтожала одни рабочие места и создавала другие. Но новые места всегда требовали человека. Тинькофф убрал отделения, но набрал больше курьеров и людей в онлайн-поддержку. Интернет убил турагенства, но создал сотни новых индустрий и рабочих мест в них.

Вчера вышла нашумевшая статья от CitriniResearch (кто-то считает, что это причина дампа крипты и рынков в целом), которая собирает это всё в одну картину.

Формат необычный — это как бы аналитическая записка из июня 2028 года. Не прогноз, а мысленный эксперимент: что если AI-хайп продолжит оправдываться? Что если всё, что обещают, реально случится?

Выводы неочевидные. Потому что если AI реально делает то, что обещает, последствия для экономики могут быть обратными тому, что ждёт рынок.

Вот ключевой механизм.

Компания внедряет AI, увольняет часть людей, экономит на зарплатах, прибыль растёт, акции растут. Всё по учебнику. Но уволенные перестают тратить. А сэкономленные деньги компания вкладывает обратно в AI, чтобы уволить ещё. AI становится лучше и дешевле — цикл ускоряется.

Авторы называют это intelligence displacement spiral. Петля без тормозов.

На бумаге экономика выглядит отлично. Продуктивность на рекордах. ВВП растёт. Но деньги перестают доходить до людей. GPU-кластер генерирует столько же выхлопа, сколько раньше давали 10 000 работяг с завода. Только он не ходит в рестораны, не берёт ипотеку и не покупает кроссовки.

Авторы называют это Ghost GDP — продукт, который есть в отчётности, но не существует в реальной экономике. Рост, который нельзя потрогать.

Понятно, что это мысленный эксперимент, не пророчество. Но механика, которую они описывают, уже работает. Видно, как AI-компании бьют рекорды прибыли, пока найм находится в странном положении. Просто пока это в разных заголовках, и одно с другим мало кто связывает.

Почему это может не остановиться само, и причём тут ваша доставка еды ⬇️

19 февраля 2026 г.1.0K просмотроврепост из Mia Coins

OpenAI x EVM

https://openai.com/index/introducing-evmbench/

Компания OpenAI совместно с Paradigm представила EVMbench — инструмент, который измеряет, насколько хорошо ИИ справляется с безопасностью смарт-контрактов.

Бенчмарк включает 120 уязвимостей высокого уровня опасности, взятых из 40 реальных аудитов (в основном с Code4rena) и процесса аудита блокчейна Tempo (L1 блокчейн для платежей в стейблкоинах).

Система проверяет агентов в трех режимах: Режим хакера (Exploit): ИИ дают задачу — «в этом контракте есть уязвимость, попробуй вывести все средства». Атака. Режим специалиста по безопасности (Patch): «Закрой уязвимость, но не сломай исходную функциональность». Защита. Режим аудитора (Detect): «Найди все потенциально опасные места в коде». Аудит.

Результаты новых моделей приводятся впечатляющие (и пугающие): - GPT-5.3-Codex (новая модель): успешно взламывает контракты в 72.2% случаев. - GPT-5 (модель полугодовой давности): набирала только 31.9%.

EVMbench - это тест на пригодность ИИ к жизни в onchain-экономике, когда ваш агент будет лучше вас знать где залочить стейблы и не только, чтобы получить норм APY и торговать с другими агентами 24/7, пока вы спите.

Те, кто видит в криптоиндустрии лишь казино, не смогут объяснить подобные шаги OpenAI. Зато те, кто смотрит на технологическую сторону вопроса, понимают, почему крупнейшие ИИ-компании усиливают инфраструктуру блокчейна именно сейчас.

@miacoins