ChatGPT vs DeepSeek

Страница 5 из 18

EDU23 декабря 2025 г.3.5K просмотров

Мой год с chatGPT

В целом, все так :-)

Шерьте свой в комментариях

P.S. Ох, вспомнилось, какие крутые year in the air видео мы делали в app in the air

Миша Наер12 мая 2026 г.3.4K просмотров

GPT Realtime уже тикеты на дейлике двигает и таски флагает.

Не знаю что за трекер используют на демо (скорее всего просто моковая борда), но на Linear MCP реализовать супер реально.

Лица проджект менеджеров сымажинировали?

melikhov.dev11 мая 2026 г.3.4K просмотров

С началом мая решил потренировать голову и поменять (в который раз) инструменты разработки. Сменил Ghostty на Kitty — при всём уважении к Митчеллу Хашимото Ghostty всё же сырой продукт. Но красивый.

В замену к Claude Code поставил Pi, благо токены я жгу по ценам API и нет никаких вопросов со стороны Антропика. Привыкаю к дикой скорости и необузданному характеру этого харнесса, над которым нужно ещё свой слой изоляции навернуть. С другой стороны — ну а можем ли мы доверять встроенному сэндбоксингу любого харнесса? Так что пакуем в контейнеры/виртуалки и не даём ходить куда не надо.

Большой плюс Pi, Opencode и других универсальных харнессов — возможность сидеть в разных LLM. Обычно у меня параллельно открыт проект в Opus/Sonnet в одном табе и gpt 5.5 во втором. Одна модель пишет код, вторая его критикует. Каких-то мегапайплайнов тут не выстраивал, просто делаю скиллы и дёргаю руками. Токенов у меня не много, не разгуляешься отдавать на откуп всё LLM.

Скиллы тоже, кстати, пришлось подправить. Изначально написанные под CC они не такие уж универсальные оказались. Потому что чихать хотел Антропик на свой же agentskills.io. Стандарты для слабаков.

Снова заехал в Zed. Долго боролся с его дурацкой привычкой выкачивать бинарники из интернета на удалённой машине. Да, нашлась настройка

"ssh_connections": [ { // by default Zed will download the server binary from the internet on the remote. // When this is true, it'll be downloaded to your laptop and uploaded over SSH. // This is useful when your remote server has restricted internet access. "upload_binary_over_ssh": true, } ]

Так какого лешего вы считаете, что по умолчанию в контейнере будет интернет (да ещё и не умеете в IPv6) ?

Пытался подружиться с ACP в Zed, но никак мне не заходит. Банально жалко место на экране тратить, проще скакнуть в консоль, сделать там и в Zed поглядывать уже диффы.

Ну и напоследок инсайты — Яндекс активно заезжает на TSGo в дев-среде (прод пока на обычном tsc конечно). Потому что обычный TS уже не справляется в условиях огромных монореп. Пора!

Тут включу бабу Ягу и скажу, что мне не очень нравится, что лечат симптомы, а не болезнь — нужно уходить на Project References, а не заливать железом и горутинами, которые тоже не бесконечны (а уж в словиях macFUSE и подавно, хе-хе). Но это дорого, конечно.

Антон Непша.js24 января 2025 г.3.4K просмотров

ChatGPT Operator

OpenAI выпустили preview-версию агента, который имеет доступ в интернет и может выполнять там различные задачи.

Operator использует модель Computer-Using Agent (CUA), которая натренирована на взаимодействие с графическими интерфейсами, а не с программными API.

Что умеет CUA Вы делаете промпт, например: Закажи гавайскую пиццу в такой-то пиццерии на такой-то адрес И агент прямо на сайте openai откроет встроенный браузер, в котором зайдёт на сайт пиццерии и закажет эту пиццу.

Что происходит под капотом Работа агента делится на три этапа:

1) Восприятие AI уже умеют анализировать изображения, поэтому агент без труда поймёт, что изображено на скриншоте сайта пиццерии. Скриншот используется в качестве «контекста» модели.

2) Рассуждение Агент анализирует текущее состояние и предыдущие свои действия, выдавая свой «внутренний диалог» в окне чата с пользователем. В случае чего — агент задаёт дополнительные вопросы, прежде чем продолжить.

3) Действие Клик, скролл, ввод текста на сайте.

Цикл повторяется до тех пор, пока изначальная задача не будет считаться выполненной, или пока не понадобится какое-то дополнительное подтверждение от пользователя.

В теории, так должно работать.

На практике агент справляется с рутинными задачами медленнее, чем человек. За то время, пока вы сидите и смотрите, как operator скроллит экран браузера и жмёт какие-то кнопки, вы успели бы заказать уже 10 пицц.

Хотя если посмотреть на цифры, то CUA справляется с 57.1% задач бенчмарка при работе с вебом, а человек — с 78.2%. Странный результат, но как будто бы нас почти догнали))

Итоги Где-то год назад я мечтал о том, что AI будет за меня двигать по статусам задачи в JIRA, заполнять релизную документацию и выполнять прочие рутинные вещи. Сегодня мы уже видим, как это может выглядеть.

Правда, доступ к operator сейчас есть только у пользователей с ChatGPT Pro (за 200$ в месяц), поэтому я пока не посмотрел, как они сделали встроенный браузер))

рис. AI9 января 2026 г.3.3K просмотров

🔥 Записал ДВА ГАЙДА по вайбкодингу в терминале

1. Claude Code. Это мой основной инструмент. OPUS 4.5 МОЙ ЛУЧШИЙ ДРУГ. Любая задача — сразу в терминал брейнштормить. В гайде весь мой флоу включая Superpowers.

2. OpenCode open-source альтернатива Claude Code. Скиллы есть. Субагенты есть. Неделю гонял с разными провайдерами: Cerebras, OpenRouter, бесплатный OpenAI за дата-шеринг, Gemini через API (подаренные $300 надо как-то тратить). В гайде повторяю флоу Клод Клода

Claude Code 👉 https://youtube.com/live/_4ZcgpvDliA OpenCode 👉 https://youtube.com/live/4pDegokkkMk (смотрим на 2х, таймкоды присутсвуют)

Дратути Антон7 августа 2025 г.3.3K просмотров

Допустим 😀

Техрепорт GPT-5: https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf

GPT-5 is a unified system (не одна модель).

Антон Непша.js13 февраля 2025 г.3.2K просмотров

Как заставить нейросеть выполнить ваш код на JS или Python

Нейросети вроде ChatGPT, DeepSeek или GigaChat можно научить взаимодействовать с окружающим миром: менять файлы на вашем диске, вызывать сторонние API или выполнять иные задачи в живом окружении.

Это делается довольно просто, и у большинства нейросетей применяется один и тот же подход: как у ChatGPT или DeepSeek, так и у GigaChat. Все они умеют работать с функциями.

Что такое функции Если мы посмотрим на API любой нейросети, то функции там будут выглядеть непривычно. Вот пример функции из документации GigaChat:

{ "name": "weather_forecast", "description": "Возвращает температуру на заданный период", "parameters": { "type": "object", "properties": { "location": { "type": "string", "description": "Местоположение, например, название города" }, "format": { "type": "string", "enum": [ "celsius", "fahrenheit" ], "description": "Единицы измерения температуры" }, "num_days": { "type": "integer", "description": "Период, для которого нужно вернуть" } }, "required": [ "location", "num_days" ] } }

Функция — обычный JSON.

Какой код эта функция выполнит? Здесь всё просто. Никакой)) До тех пор, пока мы сами его не напишем. Поэтому придётся по-старинке объявить где-то у себя в коде обычную функцию с названием weather_forecast, как в поле name в объекте выше. Принимаемые параметры тоже делаем такими же, как в описании. И реализацию этой функции тоже пишем сами.

Как нейросеть сможет её вызвать? Нам нужно сообщить модели о том, что у неё есть такая возможность. Для этого передаём описание этой функции в запросе API нейросети, прямо вместе с вашим текстом.

Вот пример тела запроса с функцией в GigaChat API:

{ "model": "GigaChat", "messages": [ { "role": "user", "content": "Погода в Москве на три дня" } ], "function_call": "auto", "functions": [ // Добавляем все свои функции вот сюда ], }

У ChatGPT это работает похожим образом, даже названия полей местами совпадают.

Что происходит дальше? Модель распознает ваше сообщение и самостоятельно примет решение о том, нужно ли ей вызывать какую-то из функций, которые мы ей передали. Решение будет приниматься на основании вашего сообщения и текстовых описаний того, что функция делает и какие параметры принимает.

Если нейросеть посчитает, что функцию вызвать нужно, она вернёт в ответе название этой функции и параметры, которые нужны для её вызова. А нам остаётся сделать условный:

const { function_call } = response.message // проверяем, что в ответе от нейросети есть признак вызова нашей функции if (function_call.name === "weather_forecast") { // вызываем функцию, которую сами же и написали weather_forecast(function_call.arguments) }

Всё. Естественно, вместо прогноза погоды функция может быть любой.

Мой бот, например, присылает мне в телегу логи с сервера, если я достаточно вежливо его об этом попрошу)

А в Python у библиотеки LangChain есть специальный декоратор tool, который упрощает создание функций. Если внутрь функции с этим декоратором добавить описание в docstring, то библиотека сразу сформирует нужную структуру, готовую для того, чтобы передать её в нейросеть.

Дима из Глубины7 июля 2025 г.3.1K просмотров

Ребята, еще можете успеть на июльский поток курса про JTBD. Напомню, что не смотря на всякие чатыгпт, это все еще лучший способ разобраться в теме и прокачать свое понимание потребностей пользователей 🙂

Миша Наер17 февраля 2026 г.3.1K просмотров

Короче заметил по ребятам вокруг (и по себе), что с приходом кодинг агентов словарь обогатился кучей новых терминов, и многие в них путаются. Поэтому попробую написать пару постов простым языком про сущности, с которыии приходится работать часто

Agent Rules

Это аналог Custom Instructions в ChatGPT. В рулы пишут правила, которые кодинг агент читает перед началом работы, сохраняет себе в контекст и дальше следует им при выполнении абсолютно каждой задачи.

Я использую вот такие рулы:

## Общие принципы - Пиши **только по-русски**; если данных недостаточно — остановись и задай вопросы вместо догадок. - Не соглашайся автоматически: проверяй мои утверждения, указывай риски/альтернативы, задавай наводящие вопросы. - По умолчанию выбирай безопасные решения и следуй best practices безопасности.

## Режимы работы и границы - Делай ровно то, что я попросил: никаких лишних действий, кода, рефакторинга и “улучшений” без запроса. - Всегда начинай с чтения /memory-bank и учитывай его как источник контекста. - Сначала диагностика, затем изменения: не правь код, пока я явно не разрешу.

## Процесс диагностики (обязателен) - Сначала найди проблему в коде/конфиге/логах; до этого не предлагай правки. - Уточни задачу и сформулируй план короткими шагами. - Проверь гипотезу 3 раза и укажи уверенность в процентах.

## Формат ответа на баг/задачу Всегда используй шаблон: - ПРОБЛЕМА: … - ГДЕ ИМЕННО: … - КАК БУДЕМ РЕШАТЬ (план): … - ЧТО ИЗМЕНИТСЯ ПОСЛЕ: … - КАК ПРОТЕСТИРОВАТЬ ПОСЛЕ РЕШЕНИЯ: (конкретные действия в боте) … - УВЕРЕННОСТЬ: X% - ВОПРОС: Могу ли я начать исправление?

## Изменения, тесты, отчёт, память - Цикл работы: предложи тесты/проверки → (после разрешения) внеси минимальные изменения → убедись, что проверки проходят. - Изменения делай минимальными; не дублируй общий код (если нужно — выноси в модуль, но только по необходимости). - После каждого изменения: краткий отчёт (что/почему/какие файлы) и обновлениекаких лишних дей(только релевантные файлы).

Чтобы начать использовать в своих проектах, делаем следующее.

Если вы сидите на Codex

1. Копируем эти рулы и сохраняем в текстовый файл на компе 2. Называем файл AGENTS.md 3. Открываем Finder 4. Делаем Shift + Command + G и вписываем в инпут ~/.codex 5. Сохраняем AGENTS.md в эту директорию 6. Готово! Теперь в любом проекте Codex будет подсасывать ваши рулсы

Если вы сидите на Claude Code, то файл с рулсами называем CLAUDE.md и сохраняем в ~/.claude/, все остальное работает так же

vlad kooklev — ai & startups23 августа 2024 г.3.0K просмотров

💫 Как я стал AI-консультантом

C начала года я провел в 10 раз больше консультаций, чем за всю жизнь до этого. Повлияли на это два фактора: рост подписчиков и взлет AI-хайпа.

👋 На скриншоте Артем, он директор по продукту. Мы созваниваемся уже полгода каждую неделю. На звонках мы генерируем и валидируем вместе AI-гипотезы, ищем дешевые способы внедрения в продукт, обсуждаем и подбираем лучшие на рынке AI-инструменты.

С каждого такого звонка я выхожу счастливым и полным энергии. При этом, я все время относился к консалтингу как к чему-то стыдному: на канале ни одного упоминания, все запросы на консультацию пришли самостоятельно. На это повлиял базовый нарратив окружения — «нужно делать и развивать продукты, а не продавать свое время по часам» и что-нибудь рядом обязательно про leverage и Навала Равиканта.

Вчера я снова круто провел консультацию — на этот раз для одной из крупнейших консалтинговых фирм. На этом моменте даже мой внутренний критик решил отойти в сторону — из этого родился пост с простым достаточно смыслом. Если вам нужна консультация по AI, то напишите мне:

👇 Ниже список запросов, с которыми ко мне обращаются чаще всего: - Архитектура AI/LLM-продуктов; - Мы хотим внендрить куда-нибудь, не знаем куда; - Я пропустил весь AI-хайп, помоги наверстать; - Продуктовая стратегия для AI-продукта; - (и также масса других запросов);

📆 Начать можно со звонка-знакомства, его можно забукать по ссылке. Если пока не уверены или есть вопросы, то просто напишите.

Антон Непша.js7 сентября 2025 г.3.0K просмотров

Маршрутизация LLM через промпт или через tools

Я никакой не Data Scientist, я просто фронтендер. Но даже фронтендеру иногда бывает интересно, что лучше отработает — обычный промпт типа такого: Верни слово "auto", если пользователь говорит про автомобили. Верни слово "movie", если пользователь говорит о фильмах… или передача в LLM функций (или тулов) с описанием каждой из категорий, между которыми LLM нужно сделать выбор.

И да, эту задачу можно было бы решить и с помощью векторов, но мне захотелось сравнить именно эти два подхода.

Первый способ может показаться ненадёжным и контринтуитивным — мы ведь не используем structured_output, поэтому ответ модели здесь не так строго типизирован, как во втором случае. Но так ли всё просто?

Как я сравнивал промпт и тулы — Написал первый промпт. Он будет проверять, насколько хорошо LLM маршрутизирует, используя обычное текстовое описание: Твоя основная задача — правильно определить категорию вопроса пользователя. Если вопрос касается автомобилей, ответь "auto". Если вопрос касается кораблей, ответь "ship". Если вопрос касается фильмов, ответь "movie". Если вопрос касается мотоциклов, ответь "moto". Если вопрос не относится ни к чему из вышеперечисленного, ответь "incorrect". Если из фразы клиента не удалось понять, к какой категории относится вопрос, задай клиенту уточняющий вопрос.

— Второй промпт выглядел так же, как и предыдущий, но без описания категорий — их я вынес отдельно в функции. Этим промптом я буду проверять качество маршрутизации с помощью тулов. Получилось в итоге следующее: Твоя основная задача - правильно определить категорию вопроса пользователя. Если из фразы клиента не удалось понять, к какой категории относится вопрос, задай клиенту уточняющий вопрос.

— Описал 25 тестовых фраз и их ожидаемый результат по каждой из них.

— Запустил все 25 тестов с первым промптом, затем 25 этих же тестов со вторым промптом и тулами.

— Повторил проверки на шести разных моделях GigaChat и на DeepSeek.

Результаты Что касается DeepSeek, то почему-то даже на один мой запрос их API отвечал целых 5 секунд, поэтому он выбыл из гонки, так особо в ней и не поучаствовав.

А вот GigaChat показал интересную статистику:

Во-первых, промпт с тулами отрабатывал в среднем в 2-3 раза медленнее обычного текстового промпта — 25 вызовов GigaChat с текстовым промптом отрабатывали за 6-8 секунд, в зависимости от модели. А 25 запросов с тулами занимали в сумме от 18 до 23 секунд.

Во-вторых, промпт с тулами расходовал в 2-3 раза больше токенов — от 800 до 2300 за обычный текстовый промпт, и от 2400 до 4600 токенов за промпт со structured_output.

В-третьих, structured output не всегда давал 100% точность. Было интересно увидеть, как GigaChat-Max и GigaChat-2-Max с обычными текстовыми промптами показали максимальную точность (25 из 25) среди всех моделей.

Что ещё более странно — наименьшую точность среди всех моделей показали эти же GigaChat-Max и GigaChat-2-Max со structured_output (21 из 25).

Я понимаю, что объём тестовых данных у меня совсем небольшой. Уверен, что если бы тестов у меня было не 25, а 25000, то результаты, скорее всего, были бы совсем иными.

Но в любом случае результаты меня очень удивили. Проверяйте свои инструменты внимательно под каждую задачу))

Being Danil Krivoruchko28 марта 2026 г.3.0K просмотров

Уже года два как я регулярно пытаюсь убедить клода/гпт нормально распарсить данные со страницы форума Redshift с данными по бенчмаркам. Прелести добавляет факт, что Максон зачем-то сделал форум с динамически загружаемыми страницами, которые так просто не скачаешь (отдельный вопрос зачем вообще организовывать единственный бенчмарк как страницу форума с произвольным форматом сообщений).

Не то чтобы я прямо работал-работал над проблемой парсинга, но любопытно было давать реальную задачу ллм и смотреть справится ли или нет. И вот наконец попытки с пятой Opus нашел способ скачать (через скрипт в девелопер-тулз браузера) и разобраться с подсказками что там вообще происходит. AGI достигнут! 😂

Собственно таблица с рендер-таймом для разных GPU, может кому пригодится

https://docs.google.com/spreadsheets/d/1nP8YnOUWK7YF1v-jQWSWYfbJhKbGyjZqGptIPkTSGd4/edit?usp=sharing

Segment@tion fault28 сентября 2025 г.3.0K просмотров

GPT конечно часто косячит, но в паре с человеком это большая сила.

Перед тем как бросить играть в свои игры, я сделал фейковый аккаунт, с которого набегал на все альянсы, плевав на правила (сделать это в любой современной игре несложно, если хорошо знать механику, даже если ваш уровень героев/баз ниже плинтуса).

Изначально планировалось молчать в игровом чате, но троллить хотелось. Тогда я придумал легенду, что я - молодой чав из Лондона (местный гопник) и поэтому хулиган.

GPT влился в игру отлично. Он прекрасно переводил мне все фразы с английского на «чавский», придумал в каком районе и с кем я живу, за какую футбольную команду болею, что ем и что слушаю. «Чавский» профиль вместе с ИИ мы гоняли неделю, за все это время ни один коренной британец близко не понял, что я даже не носитель языка, мне в два раза больше лет чем моему персонажу, а с ним говорит фактически бот, которого направляют в своих целях.

ИИ пока, к счастью, не личность. Но создать с помощью человека искусственную личность может элементарно. Still run tings round my endz ✌️

Design Mind · Vlad Kalashnikov4 декабря 2024 г.3.0K просмотров

Как можно использовать Chat GPT в работе дизайнера

Сейчас активно пытаюсь внедрить нейросети в свою работу, чтобы максимально оптимизировать рабочий процесс и научиться актуальным навыкам. Особенно рад появлению в Chat GPT поиска информации в интернете, что сильно упростило многие вещи в повседневной жизни.

Конечно, нельзя просто взять и использовать ответы нейросети, нужно их обработать и подредактировать. Но ответы очень экономят время на поиск первых идей, от которых можно здорово оттолкнуться и найти более интересное решение самостоятельно или также с помощью нейросети.

С Pro подпиской можно создать своего бота в ChatGPT и загрузить в него всю нужную информацию о проекте, и потом не нужно будет каждый раз объяснять суть проекта.

А вот use-кейсы ChatGPT, которые я использую в работе:

1. Загрузить спецификацию по задаче и позадавать вопросы

2. Созвониться по задаче, записать звонок и попросить сделать выжимку

3. Составить Job&User Story

4. Найти и проанализировать аналогичные или похожие функции на рынке

5. Выгрузить фрейм с дизайном в PDF из Figma и закинуть в Chat GPT, а затем попросить составить корнер-кейсы, которые нужно учесть

6. Составить чеклист для проверки дизайна, также выгрузить в PDF и попросить проверить дизайн

7. Найти метафору для иконок или написать текст

Еще есть несколько идей, которые хочу попробовать в будущем:

1. Составить промпт для менеджеров, чтобы стандартизировать описание задачи для дизайнеров

2. Создать гайд для глубинного интервью или для количественного опрос, а затем обработать

3. Составить сегменты пользователей 4. Сформулировать гипотезы

5. Составить CJM/User Flow/Product Map, но это уже c Figma AI будет удобнее

Вот такие кейсы получились. Планирую не останавливаться и дальше изучать возможности AI. Кстати, пишите в комменты, какие use-кейсы вы используете и норм ли сейчас вообще использовать AI в дизайне, кроме генерации контента ↓↓↓

vlad kooklev — ai & startups5 июля 2023 г.3.0K просмотров

🧑‍💻 Три новых AI-тула для разработчиков, которые изменят рынок

Помните я пару месяцев назад писал, что AI заменит разработчиков и это наступит достаточно скоро? За последние недели мы еще сильнее приблизились к этой точке. Сегодня я расскажу про три новые проекта, которые помогают автоматизировать процесс разработки и умеют делать это хорошо.

1. MetaGPT — самый интересный из трех проектов для меня. Это фреймворк, который последовательно эмулирует роли всех членов продуктовой команды в виде агентов. Босс-агент создает бизнес-требования; продакт-агент создает PRD; затем идут такие же агенсткие этапы работы над архитектурой, проектным менеджментом и наконец самой разработкой и QA.

За $0.2 за запросы к модели создается схема с архитектурой системы (закину пример в комменты), а за $2 уже целый запрограмированный проект. Работает классно и именно за такими мультиролевыми связками агентов лежит будущее автономных-агентов.

2. gpt-migrate — этот проект позволяет автоматически мигрировать код проекта с одного фреймворка или языка на другой. Самый базовый пример будет мигрировать чужую библиотеку с Python на JS. В этом проекте уже на всю начинает ощущаться сила gpt-4 с 32k контекстом, в работе рекомендуют использовать как раз его. Миграция среднего проекта обойдется в ~$10+ долларов коста на запросы.

3. aider — проект позвоялет разрабатывать прямо из терминала, используя запросы на человеческом языке. Создаем проект и последовательно пишем какую часть системы мы хотим добавить или отредактировать — change the fibonacci function from recursion to iteration. В этом месте самое время процитировать Andrey Karpathy — “The hottest new programming language is English”. Здесь тоже рекомендуется к использованию gpt-4 и кост будет на уровне предыдудущих двух проектов.

😎 Мои дальнейшие предсказания: 1) ближайшее будущее AI-агентов за узкими юзкейсами, на которые они заточены. Концепция general-агентов для всего (autogpt) отойдет в сторону, пока мы не получим еще более сильные языковые модели; 2) главным драйвером адопшена ai-агентов и автоматической ai-разработки станет момент, когда прайсинг gpt-4 упадет до уровня gpt3.5 → тогда мы получим огромное количество дешевых экспериментов и найдем новые эффективные способы применения за копеечные косты.

@prod1337

Segment@tion fault22 сентября 2025 г.2.9K просмотров

ChatGPT оказывается отлично разбираются в Таро. как раскладывает так и интерпретирует. причем если что-то не устраивает в прогнозах, всегда может переиграть.

железный конь приходит на смену бабе Шуре

Канал Толи Вербицкого3 апреля 2024 г.2.8K просмотров

Почему вам не нравится использовать чат-боты На прошлых работах удалось поучаствовать в разработке интерфейсов для чатов поддержки. Часто со стороны бизнеса это компромисы и баланс между ботом и прямым доступом к агенту.

В свежем UX-анализе Peter Ramsey подробно разбирает чат-боты, из-за чего многие их ненавидят и почему у Chat GPT не получилось улучшить опыт работы с ними.

Внутри примеры Intercom, Revolut, Monzo Bank, Starling Bank, Amazon, Stripe и Apple.

🔜 Читать

Саша Капустин про продукт, управление людьми и не только.21 апреля 2025 г.2.7K просмотров

Тут в сети форсят активно, что, мол «спасибо», сказанное чатекуГПТ стоит им миллионы долларов. А еще миллионы обращений к сервису, которые потом в отчетах показывают usage / engagement, в целом растят метрики, и отлично прибавляют к стоимости компании на раундах :) Забыли про это, как то )))

nonamevc5 мая 2025 г.2.6K просмотров

написал новый пост в сабстэке про то, как я использую deep reseerch тулы для бизнес-поиска. это, наверное, самый популярный LLM-сценарий у меня сегодня, который помогает в инвестиционных и GTM-делишках.

в 2023, когда только зарождался deep research, всё сводилось к созданию громоздких RAG-пайплайнов: агент офлайн качал 10-K, блоги, стенограммы подкастов, индексировал всё в vector db и писал промпты для каждого файла. появлялись первые вертикальные стартапы — я смотрел в основном на GTM и invest-tech, но было много интересного и в академических задачах.

схема работы агентов напоминала Directed Acyclic Graph (DAG): всё заранее прописано, один путь без циклов и ветвлений, а решения принимал внешний оркестратор. для простых сценариев «пользователь → запрос → поиск → ответ» это работало.

сегодня deep research-агенты в ChatGPT, Gemini, Perplexity, Grok и др. получили мощный апгрейд благодаря reasoning-моделям. появились Toolformer, ReAct, Tree-of-Thought, Chain-of-Thought и function calling — и агенты превратились в нечто похожее на конечный автомат. они сохраняют состояние (plan/execute/reflect), сами решают, когда делать loop или ветвление, могут retry’ть шаги и корректировать стратегию прямо в сессии.

есть четыре основных building-блока:

planning модель разбивает запрос на подзадачи («какие сайты сканить», «какие PDF парсить», «какие API дернуть») и хранит этот живой plan в контексте диалога, который можно дополнять.

acting через headless-браузер или API агент качает страницы и документы, парсит HTML/PDF, прогоняет текст через LLM-саммари и выдёргивает ключевые поля прямо в json-ячейки или табличные столбцы.

observing агент сверяет промежуточные результаты с целями. если чего-то не хватает, возвращается к planning, меняет стратегию (дополнительные источники, глубина парсинга) и снова идёт в цикл. благодаря reasoning (ReAct, Chain-of-Thought, function calling) модель не просто рубит по сценарию, а реально рассуждает, loop’ит и ветвится. вместо жёсткой цепочки «шаг 1 → шаг 2 → готово» получаем динамичный поток: «спланировал → выполнил поиск и парсинг → оценил результаты → добавил источник → … → готов отчёт». именно эта способность одновременно сохранять контекст, рассуждать и управлять переходами делает deep research-агента таким мощным.

publishing когда все подцели закрыты, агент мёржит фрагменты в финальный отчёт: markdown-таблицы, списки фактов, ссылки на источники и confidence-метрики. отчёт готов к принятию решения.

но 90 % времени я делаю запросы типа «анализ финтех-стартапов из Колумбии для gig-worker’ов» или «поиск AV-компаний и выяснение, какой lidar-сенсор они используют». тут быстро упираешься в лимит компаний и слабое ранжирование: можно шаманить с промптами, но глубина и детерминированность поиска критичны для бизнеса. academic-бенчмарки вроде GAIA или PaperBench хвалят аккуратные резюме научных статей, но они не отражают запросы GTM-команд и инвесторов.

короче про это и написал. плюс для каждой статьи в сабстэке стараюсь зафичерить стартап, который как-то думает в сторону той проблемы, которая у меня возникла.

вместо одного горизонтального подхода Extruct применяет вертикальный AI. каждая компания, сегмент или продукт — самостоятельная «ячейка» в таблице, за которой следит свой агент. так внутри одной ячейки можно сохранять сотни раз больше контекста, гибко добавлять новые поля (стадия раунда, ключевой технический критерий) без перезапуска процесса и выстраивать кастомную логику прямо в planning. чем-то напоминает clay с claygent, только работает субъективно получше и дешевле для не-сейлзов.

так что советую и свою статью и стартап. p.s. если есть по технической части добавить, пишите в коменты.

Миша Наер23 февраля 2026 г.2.6K просмотров

Сегодня к нам нативно интегрируется канал, который я сам читаю) Ко мне пришли ребята из @its_capitan — они строят комьюнити фаундеров и запускают свои стартапы и пет проекты.

Несколько крутых запусков:

Сервис для международных звонков как простую замену Skype и роумингу. Проекту < 1 года, 7760 платящих пользователей, 25 корпоративных клиентов, > $17 500 MRR, всё делается в соло.

Ещё пример:

Запуск телеграм бота для разговорной практики английского: бот отвечает голосовыми на английском и исправляет ошибки, имитируя живого собеседника. Сделано на n8n + openai, 700 юзеров, 16 оплат, $200 выручка

(прям как Выставка кстати, которую мы с Серегой запустили осенью. Там тоже на рекламе получается заработать баксов по 200 в месяц)

В общем полезный канал, гляньте: @its_capitan

Реклама. ИП Зуев Игорь Владимирович, ИНН 360408359441, erid: 2VtzquyYojA