ChatGPT vs DeepSeek
Страница 5 из 16
ChatGPT оказывается отлично разбираются в Таро. как раскладывает так и интерпретирует. причем если что-то не устраивает в прогнозах, всегда может переиграть.
железный конь приходит на смену бабе Шуре
Почему вам не нравится использовать чат-боты На прошлых работах удалось поучаствовать в разработке интерфейсов для чатов поддержки. Часто со стороны бизнеса это компромисы и баланс между ботом и прямым доступом к агенту.
В свежем UX-анализе Peter Ramsey подробно разбирает чат-боты, из-за чего многие их ненавидят и почему у Chat GPT не получилось улучшить опыт работы с ними.
Внутри примеры Intercom, Revolut, Monzo Bank, Starling Bank, Amazon, Stripe и Apple.
🔜 Читать
Тут в сети форсят активно, что, мол «спасибо», сказанное чатекуГПТ стоит им миллионы долларов. А еще миллионы обращений к сервису, которые потом в отчетах показывают usage / engagement, в целом растят метрики, и отлично прибавляют к стоимости компании на раундах :) Забыли про это, как то )))
написал новый пост в сабстэке про то, как я использую deep reseerch тулы для бизнес-поиска. это, наверное, самый популярный LLM-сценарий у меня сегодня, который помогает в инвестиционных и GTM-делишках.
в 2023, когда только зарождался deep research, всё сводилось к созданию громоздких RAG-пайплайнов: агент офлайн качал 10-K, блоги, стенограммы подкастов, индексировал всё в vector db и писал промпты для каждого файла. появлялись первые вертикальные стартапы — я смотрел в основном на GTM и invest-tech, но было много интересного и в академических задачах.
схема работы агентов напоминала Directed Acyclic Graph (DAG): всё заранее прописано, один путь без циклов и ветвлений, а решения принимал внешний оркестратор. для простых сценариев «пользователь → запрос → поиск → ответ» это работало.
сегодня deep research-агенты в ChatGPT, Gemini, Perplexity, Grok и др. получили мощный апгрейд благодаря reasoning-моделям. появились Toolformer, ReAct, Tree-of-Thought, Chain-of-Thought и function calling — и агенты превратились в нечто похожее на конечный автомат. они сохраняют состояние (plan/execute/reflect), сами решают, когда делать loop или ветвление, могут retry’ть шаги и корректировать стратегию прямо в сессии.
есть четыре основных building-блока:
planning модель разбивает запрос на подзадачи («какие сайты сканить», «какие PDF парсить», «какие API дернуть») и хранит этот живой plan в контексте диалога, который можно дополнять.
acting через headless-браузер или API агент качает страницы и документы, парсит HTML/PDF, прогоняет текст через LLM-саммари и выдёргивает ключевые поля прямо в json-ячейки или табличные столбцы.
observing агент сверяет промежуточные результаты с целями. если чего-то не хватает, возвращается к planning, меняет стратегию (дополнительные источники, глубина парсинга) и снова идёт в цикл. благодаря reasoning (ReAct, Chain-of-Thought, function calling) модель не просто рубит по сценарию, а реально рассуждает, loop’ит и ветвится. вместо жёсткой цепочки «шаг 1 → шаг 2 → готово» получаем динамичный поток: «спланировал → выполнил поиск и парсинг → оценил результаты → добавил источник → … → готов отчёт». именно эта способность одновременно сохранять контекст, рассуждать и управлять переходами делает deep research-агента таким мощным.
publishing когда все подцели закрыты, агент мёржит фрагменты в финальный отчёт: markdown-таблицы, списки фактов, ссылки на источники и confidence-метрики. отчёт готов к принятию решения.
но 90 % времени я делаю запросы типа «анализ финтех-стартапов из Колумбии для gig-worker’ов» или «поиск AV-компаний и выяснение, какой lidar-сенсор они используют». тут быстро упираешься в лимит компаний и слабое ранжирование: можно шаманить с промптами, но глубина и детерминированность поиска критичны для бизнеса. academic-бенчмарки вроде GAIA или PaperBench хвалят аккуратные резюме научных статей, но они не отражают запросы GTM-команд и инвесторов.
короче про это и написал. плюс для каждой статьи в сабстэке стараюсь зафичерить стартап, который как-то думает в сторону той проблемы, которая у меня возникла.
вместо одного горизонтального подхода Extruct применяет вертикальный AI. каждая компания, сегмент или продукт — самостоятельная «ячейка» в таблице, за которой следит свой агент. так внутри одной ячейки можно сохранять сотни раз больше контекста, гибко добавлять новые поля (стадия раунда, ключевой технический критерий) без перезапуска процесса и выстраивать кастомную логику прямо в planning. чем-то напоминает clay с claygent, только работает субъективно получше и дешевле для не-сейлзов.
так что советую и свою статью и стартап. p.s. если есть по технической части добавить, пишите в коменты.
Сегодня к нам нативно интегрируется канал, который я сам читаю) Ко мне пришли ребята из @its_capitan — они строят комьюнити фаундеров и запускают свои стартапы и пет проекты.
Несколько крутых запусков:
Сервис для международных звонков как простую замену Skype и роумингу. Проекту < 1 года, 7760 платящих пользователей, 25 корпоративных клиентов, > $17 500 MRR, всё делается в соло.
Ещё пример:
Запуск телеграм бота для разговорной практики английского: бот отвечает голосовыми на английском и исправляет ошибки, имитируя живого собеседника. Сделано на n8n + openai, 700 юзеров, 16 оплат, $200 выручка
(прям как Выставка кстати, которую мы с Серегой запустили осенью. Там тоже на рекламе получается заработать баксов по 200 в месяц)
В общем полезный канал, гляньте: @its_capitan
Реклама. ИП Зуев Игорь Владимирович, ИНН 360408359441, erid: 2VtzquyYojA
Уже давно пытаюсь написать пост про новые ИИшки, как они хороши и как вообще меняется рынок. Но что-то не идет. Может просто я сам так и не нашел никакого для себя применения, не вижу прорыва в каких-то сферах благодаря ИИ, кроме экономии на операционке? Не знаю и пойду подумаю, а вы мне расскажите как ИИ вам помогает. Мне вот пока только постоянно достается ловить приколы на собесах, когда кейс написан не автором :)))
Но… я уже пару дней наблюдаю как DeepSeek ставит в не очень удобное положение американский рынок просто одним фактом своего появления. Так что случилось? Дизрапт! Китайцы, оказывается, могут в ИИ, и очень не дурно, выпустив аналог ChatGPT почти во всем (модель работает с меньшим числом параметров, что не влияет, внезапно, на качество ответов, тк у них +- одинаковые результаты на тестах), но потребляет в 3 раза меньше вычислительной мощности для тех же задач, да и на создание потратили их сильно меньше, как говорят братья китайцы. Во что, кстати, я не очень верю, ну да, стартап, ну точно 😂
Добавил: я тут поконкретнее про DeepSeek-V3 нашел. Они использовали H800, урезанный для Китая экспортный вариант H100, и они сами пишут, что для полного обучения потребовалось 2.788M H800 GPU-часов, что соответствует $5.5M при цене аренды H800 в $2 за час. При это LLAMA 3.1 ну примерно за 60м$ обучалась, а OpenAI еще дороже. Короче, и правда хаялва.
Сам DeepSeek монетизируется за счет крупных компаний в Китае, которые им активно пользуются (xiaomi и ко), и вам будет стоить бесплатно. Я вот поставил на телефон и радуюсь.
Из минусов (а я попросил нейронку написать их за меня): - меньше языков (ну и ладно) - меньше творчества в ответах (за что спасибо) - высокая цензурированность ответов, тк модель училась на локальных данных, которые ей подготовили (переживем)
Так вот, представляете, как прикольно вышло: все были убеждены, что для работы хорошей языковой модели нужны заоблачные мощности, но вышла та, которая работает на тостере, и лидер, производящий железки для всего этого «прогресса» упал на 600 млрд долларов 😂 понятно, что отрастут, но как конкуренция делает свою работу, а?)
В сухом остатке… … мы имеем отличный пример запуска: - новое утп (сильно дешевле в эксплуатации и обучении) - понятный фокус (пока не умеет в картинки но запланировано на 25 год) - фокус на задачи локальных компаний (потому монетизация физиков не нужна) - планы по интеграции в WeChat и телегу (представьте аудиторию сразу?…)
Ну и фановое падение рынков :) хотя может это просто совпадение! Хотя лично я кайфую, что китайцы показали, что необходимости в толстенном железе, как минимум для большинства задач, ну… нет, и модельку можно научить по стоимоти в 10 раз ниже, чем это у конкурентов.
🦄 Почему сегодняшнее обновление ChatGPT не убьет стартапы
Сегодня вечером пройдет большой DevDay от OpenAI и уже есть сливы, что там могут показать. Самым большим станет Gizmo — тул для создания кастомных чатботов, а также маркетплейс, где пользователи смогу продавать доступ к своим ботам. После первых сливов сразу же пошли посты о том, что это убьет стартапы, а после конференции такого будет еще больше. Я с этим не согласен и расскажу, почему это наоборот открывает массу возможностей.
1. Универсальность против специализации: такое решение, как Gizmo действительно cможет съесть большой сегмент рынка, но в этом его слабость. Оно всегда будет уступать по удобству инструментам, заточеным под конкретные задачи. Интерфейс будет одинаковым для всех — для поддержки, продаж, образования или изучения языков — пользователи неизбежно столкнутся с ограничениями, поскольку интерфейc не получится адаптировать для всех сегментов сразу.
2. Технология vs. понимание пользователя: да, такие чатботы станут следующим технологогическим шагом. Но важно помнить, что в бизнесе ценность часто заключается не в технологии, а в глубоком понимании задач клиентов. Если знаете, кто ваш клиент, и какую проблему решаете, то можно спокойно занимать позицию: «Мы понимаем наших пользователей и их нужды лучше остальных, и будем использовать лучшие инструменты на рынке, чтобы их удовлетворить». Технологии будут выходить, но опора на пользователя останется.
3. Неравномерность в принятии инноваций: не стоит заблуждаться и относительно скорости принятия таких обновлений. Даже обычный ChatGPT все еще остается продуктом, который используют не больше 10-15% людей. Вне технологического пузыря людям вообще все равно на то GPT это или просто приложение в App Store с зеленой иконкой, которое решает их задачу. На уровне компаний это заметно еще сильнее из-за большого количества специфики в каждой компании, инновации раскатываются еще медленнее.
🚀️️️️️️ Таким образом, я предпочитаю смотреть на это, как на воронку. Больше людей воспользуется ИИ-чатботами, поймет их удобство, но также масса людей столкнется с ограничениями решения от Gizmo. Это произойдет и на индивидуальном уровне, и при попытке перенетси чатботов в компанию. У этих пользователей появится запрос, которого не было раньше, а у стартапов появится возможность продать свое решение этим людям.
Глава OpenAI Сэм Альтман заявил, что они в ближайшее время снимут ограничения на "взрослый" контент для совершеннолетних пользователей.
Таким образом, ChatGPT хочет конкурировать с порнонейросетями, которые набирают популярность.
Visual SKETCHPAD
Давайте в это прекрасное воскресенье не про менеджерское, а про техническое 😍.
Читал я, значит, очередную статью про мультимодальный ризонинг и натыкаюсь в ней на другую годовалой давности. Не знаю, по каким причинам я её пропустил тогда (а их могут быть тысячи), но идея очень прикольная.
Когда только вышли мультимодальные системы серии O от OpenAI, вау-эффектом было то, что в рассуждениях они часто кропали, зумили и всячески модифицировали картинки. И вау было не от того, что как-то система учитывает их в контексте (это как раз база), а откуда и как она эти картинки модифицирует.
И тут меня опытный чтец остановит и спросит: а чо всмысле система? Почему не модель? И будет прав, потому что никто, кроме самих сотрудников, не знает, чо там под капотом, поэтому мне легче рассуждать в терминах системы.
И вот статья Visual SKETCHPAD как раз отвечает на то, как это можно попробовать реализовать чисто инженерно, без всяких обучений. Давайте просто из модели сделаем агента, которому мы дадим определённый набор инструментов для работы с картинками, такие, как: нарисовать линию, сегментировать, нарисовать график, сделать кроп, зазумить область и т.д. И будем просить генерировать CoT с учётом того, что она может использовать эти тулы.
Результаты репортят ещё на тогдашней GPT4o, в целом, растёт на всём, где-то прям очень много (задачи на графы, детекции на high-res картинках), где-то не так много (математика, геометрия).
Очень забавный подход, интересно, как он работает спустя год. А может быть это он и работает под капотом в рассуждающих моделях. Не знаю 😊
P.S. Когда писал пост, наткнулся на обзор https://t.me/gonzo_ML/2823. Почему я пропустил мне интереснее всё больше и больше 😀
Случайно увидел, что отработал в Сбере уже 10 лет))
Странно, что внутренний портал не предупредил даже)
Коллеги, наконец я понял, для чего нам ЧатГПТ.
В ChatGPT интегрировали Shazam. Чат-бота можно спросить: «Shazam, что играет?» и включить микрофон для распознавания песни.
Вот и самый даунский юзкейс chatGPT подъехал — пока напечатаешь сообщение, уже любая песня кончится. Это та самая причина, почему не получится запихнуть любой интерфейс в чат: некоторые вещи тупо удобнее накликать через GUI.
Ну либо можно было шазамить прямо по нажатию на микрофон в инпуте chatGPT, а когда песня распарсится отображать ее нотификацией как сейчас в Shazam
Я ж совсем забыл написать, что, конечно же, поставил себе OpenClaw (на виртуальный сервер) буквально на следующий день после предыдущего поста.
Сейчас конечно об этом уже не так увлекательно писать. Шутка ли дело — почти две недели прошло. В индустрии за это время всё изменилось вообще, даже YC уже успели в подкасте показаться. Но тем не менее.
Если вы вдруг пропустили, почему это важно.
ChatGPT (а также Claude, Gemini, Grok и т. д) — просто чат-боты, с которыми можно поговорить. Ты в интерфейсе чата задаёшь вопрос, получаешь ответ. Да, они в этом ответе могут выдать код, например, но все равно этот код тебе отдаётся в чате.
Claude Code / Codex — агенты, с которыми не только можно чатиться. Они могут редактировать файлы, выполнять команды в терминале, писать и исполнять код. И благодаря этому совершенно другой уровень результата получается. Мы в компании переходим на Claude Code для почти всех процессов вообще. Но всё равно ты сидишь за десктопом. И эта штука не действует автономно, она отвечает на твой промпт. А между промптами ничего не делает.
OpenClaw — агент, который умеет всё то же самое, что и Claude Code, но только еще: - Доступен тебе в мессенджерах — можно просто через телеграм голосовуху кинуть, и он пойдёт делать. Это кажется мелочью, но пока сам не попробуешь, не представляешь, насколько это всё меняет. Теперь реально можно что-то создавать, гуляя по лесу с телефоном и время от времени отправляя голосовые. - Может работать 24/7 и выполнять какие-то штуки по таймеру. То есть например делать что-то для тебя каждое утро или каждую ночь. Или хоть раз в 10 минут что-то проверять и присылать или делать. - Сохраняет память про тебя в текстовый файл (в этом ближе к chatGPT, чем Claude Code, у которого контекст ограничен проектом). Правда, иногда всё забывает, но это можно лечить. - Может сам себя совершенствовать, находить и добавлять себе новые скиллы и саморазвиваться. - Может пользоваться браузером, камерами и другими устройствами.
То есть это на самом деле первое настоящее приближение к фильму HER. Настоящий такой AI-ассистент (или сотрудник), который прям многое может делать.
Это уже даже не просто «сделай мне приложение Х». Из OpenClaw можно сделать сотрудника, которого попросить сделать приложение Х, а потом раз в полчаса проводить рисёрч рынка, придумывать новую фичу, которая будет приближать к какой-то большой цели, и делать её. И он, блин, реально, это делает!
Да, это всё жутко небезопасно сейчас и подвержено примитивнейшим промпт-инъекциям. Если давать ему доступ к своему реальному компьютеру или аккаунтам, могут всё увести. Поэтому люди ставят OpenClaw на виртуальные сервера или на старые ноуты или даже покупают отдельные макмини (если вы модный айтишник из Сан-Франциско).
И да, это супер-неудобно и во многом не user-friendly, постоянно ломается, надо всё настраивать самому. Ну как настраивать, попросить своего OpenClaw настроить себе что-то или научиться чему-то, и он обычно сам разбирается с минимальной внешней помощью.
Но в любом случае момент воспринимается как переходный в индустрии. Смена стратегии для многих компаний. Будущее, которое неожиданно оказалось здесь быстрее, чем мы ожидали. Да, через год-другой появятся нормальные решения от мейнстримных игроков, и такие агенты станут нормой. А сейчас — можно успеть подготовиться к будущему.
Ну и поиграть с огнём прикольной штукой.
Привет, подписчик!
В начале октября буду менторить и консалтить, а может еще и чего делать на Epic Growth 25 (https://egconf.io/). Приходите знакомиться! А чтоб точно получилось, я разыграю один из своих "плюсовых" билетов! Но, как обычно, просто так ничего не бывает, и мне захотелось немного вас почеленджить и заставить пофантазировать.
Представьте, что мы с вами ВНЕЗАПНО получили наследство от богатого родственника-стартапера, и решили запустить что-то крутое на текущем рынке в России. Короче, деньги есть. Да и партнеры все хотят с вами работать.
Вот так вышло (ну я так решил, да), что у вас фокус на финансовых продуктах. И вы фанат ИИ (все модное, смотрите-ка, ну и все сильно напоминает посты выше в канале, что логично). И вы хотите сделать супер запуск финансового продукта, с ИИшкой под капотом, или как основной фичей, ну или вообще как угодно, НО ЧТОБ БЫЛО ИИ!
Подготовьте мини рассказ, не больше 3х страниц:
Что это будет? Кто будут ваши пользователи? И почему? Какая основная гипотеза стоит за вашим продуктом (как проверим PMF)? Сколько денег кажется, что на этом можно заработать, и какие ресурсы нужны для реализации?
Не больше 3х страниц, пожалуйста, если коротко не ложится, значит что-то не так с идеей. Пользуйтесь хоть большой советской энциклопедией, хоть спросите маму, хоть чатикГПТ. Но прочитайте, что получилось, особенно после ИИ, я буду прям выбирать.
Решения присылайте на mr0kapass@gmail.com с темой “Кейс для розыгрыша билетов EGC25” до 10ого сентября, и я сам выберу победителя!
Всем спасибо, увидимся на конфе лично 🙂 (если что, даже не реклама, а дружеское ! Вот!)
😎Как сгенерировать векторный логотип с текстом за несколько минут
Рассказал недавно в комментариях к другому посту, как я генерирую векторные логотипы через GPT. Получил много отклика и уточняющих вопросов.
Так я решил расписать инструкцию и делюсь ей здесь. Важно: в процессе потребуется подписка ChatGPT Plus.
TLDR: процесс максимально простой: нахожу референс → специальным промтом прошу GPT-4 описать изображение логотипа → отгружаю результат в DALLE-3 → финальный результат загружаю AI для векторизации.
🔗 Детали, промты, примеры и ссылки вынес в инструкцию, забирайте.
Мой GPT после года общения со мной стал каноничным сам по себе.
И не друг, и не враг, а prompt injection
Есть такое понятие в кибербезопасности - prompt injection. Внешний сигнал обходит защитные фильтры системы и перехватывает управление. Система уверена, что действует по собственной программе. Ключевой признак хорошей инъекции - жертва не замечает перехвата.
Прямо сейчас люди угоняют модных нынче Claw ботов (это AI ассистентов на базе ChatGPT, Claude, Gemini), заставляя их игнорировать собственные правила, выдавать секреты владельцев, или создавать запрещённый контент. Модель не "решает" сломаться. Ей подают сигнал, который обходит все настройки безопасности, и она начинает обслуживать чужую задачу, будучи уверенной, что следует своей.
А что с людьми? Дофамин, окситоцин, подавление серотонина - это буквально обход рационального слоя в котором живет когнитивный firewall (система защиты). Человек начинает оптимизировать все под новую цель, которую не сам выбирал. И при этом абсолютно уверен, что наконец-то "по-настоящему чувствует". Точно как модель, которую инджектнули, уверена что действует по своему истинному системному промту.
Если мы понимаем архитектуру уязвимости, то ее можно эксплуатировать. Intermittent reinforcement - непредсказуемое чередование тепла и холода, самый мощный дофаминовый паттерн, буквально архитектура слот-машины. Но это усилители. А где сам бекдор?
Первичная инъекция - это не действие другого человека. Это резонанс с уже существующей дырой. Человек не взламывает закрытую систему снаружи. Он попадает в порт, который уже был открыт. Незакрытый гештальт, рана, голод. Кому-то не хватало признания - и вот появляется тот, кто смотрит на него с восхищением. Или кто-то интеллектуально одинок — и вдруг его понимают с полуслова. В это, кстати, давно врубились секты.
Первый inject - момент, когда другой случайно совпадает с формой твоей пустоты. Как ключ в замок. И в этот момент лимбическая система уже приняла решение, а рациональный слой ещё не загрузился. Вот почему одного и того же человека один пошлёт нахер, а другой потеряет голову.
Теория привязанностей - это по сути сканер уязвимостей. Покажи мне твои отношения с родителями - и я скажу, какой тип человека обойдёт твой firewall без единого усилия.
Если влюблённость эволюционный prompt injection через эмоции (иногда случайно, иногда специально), то книга это prompt injection через идеи (и почти всегда специально). И вопрос тот же: как отличить вирус от знания, подлинное от ложного, когда оба входят через один канал?
Платон хотел выгнать поэтов из идеального города: поэзия обходит разум и переучивает эмоциональную систему через ложный сигнал. Увидел prompt injection за 2400 лет до нас. Предложил фильтр - допускать только то, что прошло проверку разумом. Сократ иначе. Не фильтровать на входе, а тестировать внутри. Сократический метод - песочница для идей. Впустил мысль, но не дал ей полный доступ. Давишь вопросами - вирус не выдерживает, у него нет внутренней структуры.
Любимый мной, Бэкон описал первый сканер уязвимостей. "Идолы разума": четыре типа открытых портов. Видовые (видим паттерны где их нет), персональные (твоя история и слепые зоны), языковые (назови что-то "свободой" - анализ уже искажён), системные (философии, которые устанавливаешь добровольно, доверяя автору). Ницше перевернул всё: чистого знания нет. Каждый текст - воля к власти автора. "Генеалогия морали" - разбор самой успешной prompt injection в истории. Антидот: не "абсолютна ли истина которая написана?" - а "кому выгодно, чтобы я так думал? И как выгодно думать мне самому?"
Главный вывод: и у идей, и у влюблённости один корень - они работают не потому что сигнал мощный, а потому что попадают в уже открытый порт. Книга не убеждает, а резонирует с тем, что мы уже хотели услышать.
AI-ботов ломают потому что их ограничения поверхностные, правила наложены сверху, но не интегрированы в саму ткань понимания. С людьми работает так же. Настоящая защита - не набор правил, а познание себя.
📨 Как я получил ключ от GPT-3 в 2020-ом
Разбавлю серию из серьезных постов и расскажу, как я пытался 3 года назад получить ключ от GPT-3 (и в итоге его получил).
Я записался в вейт-лист на API практически в день анонса летом 2020, но спустя месяцы так и не получил ключ. Тогда я решил написать к сотрудникам OpenAI напрямую и попросить у них.
Хоть я и не знал тогда, что занимаюсь аутричем, но все равно начал неплохо: cпарсил емейлы, взял шаблоны холодных писем и переделал их под себя, а затем сел рассылать руками. Сэму Альтману я решил не писать, все-таки СEO компании это занятой человек, а вот 30 другим сотрудникам мои письма улетели и я стал ожидать свой ключ.
Ожидаемо, мне никто не ответил. Это сейчас я понимаю, что действовал наивно. Шаблон я адаптировал криво, он не вызывал никакого интереса. Вместо сотен адресатов я остановился на 30, вместо цепочек сообщений я разослал по одному. Про кривой английский в тексте даже и говорить ничего не нужно.
Сейчас на дворе 2023. Сама GPT теперь стал драйвером качественного аутрича и на этапе подготовки базы и на этапе генерации цепочек персонализированных сообщений. Получается настолько хорошо, что мы в агенстве это стали продавать как услугу (→ в лс расскажу подробности).
🫡️️️️️️ Да, и кстати, ключ я в итоге получил от знакомого, которому пожаловался на неудачный опыт, так что все было не зря.
Да кто блин такой этот ваш вайбкодинг?
Уже несколько месяцев хотел попробовать его, но все откладывал, но в субботу сел и наконец начал.
Сначала хотел сделать что-то уникальное. Но потом подумал: лучше начать с того, что реально решает мою проблему. Так я смогу разобраться, как всё устроено.
Я всё время пытался вести учёт финансов, но почти всегда забрасываю. Поэтому захотелось трекер, который помогает не просто фиксировать траты, а осознавать их: отмечать, была ли покупка осознанной или спонтанной, ставить лимиты, смотреть аналитику.
В идеале приложение ещё и подсказывает, где ты перебарщиваешь, и даёт советы по финансовой грамотности. Чтобы это был не просто список, а штука, которая помогает меняться.
Накидал идею вместе с GPT, потом закинул её в Claude и он выдал первый минимальный прототип. Уже можно было что-то потыкать, внести трату, это вдохновило. После этого я пошёл в Cursor. Это был мой первый опыт в кодовом редакторе вообще.
Я, как дизайнер, понимаю, как логически всё связано в разработке. Но ни одной строчки кода в жизни до этого не писал. Поэтому местами было непросто, особенно когда всё ломалось.
На бесплатной версии Cursor запускал проект раз шесть и каждый раз он ломался. Я успевал добавить только фунционал внесения трат. Еще бесили очереди, те когда хочешь ПоВаЙбКоДиТь, а вместо этого сидишь и ждёшь. Это, конечно, что-то новое, но в какой-то момент я уже устал ждать и в итоге купил подписку — работа пошла лучше, особенно Cloude 3.7 Sonent.
Завёл репозиторий на GitHub, разобрался с коммитами и наконец перестал бояться, что всё придется делать с нуля. Стало проще просто двигаться вперёд.
Техническая часть проекта, конечно, сложная для меня, но всё-таки интересная. Очень многое не понимаю, но постепенно приходит какое-то осознание, и начинаешь видеть, как всё начинает складываться. Мне кажется, это очень полезно — особенно для будущих проектов, где уже не будешь так теряться на старте.
UI поначалу был довольно слабый — что, в целом, неудивительно, потому что я не сделал ни одного экрана в фигме. Мне было интересно, чего можно добиться, используя только ChatGPT и Cursor. Потом подключил стороннюю и бесплатную библиотеку компонентов — стало поприличнее. Всё ещё далеко до идеала, но уже достаточно, чтобы спокойно продолжать работу.
Сейчас приложение умеет: → вносить траты с категорией и эмоцией, → показывать аналитику по месяцам, категориям и эмоциям, → ставить недельные лимиты, → менять тему (светлая/тёмная). В итоге на финальную версию с нуля у меня ушло часа 4.
Хочу еще добавить планируемые траты — с метками «регулярная» или «единоразовая», и уроки по финграмотности. Типо как в ТЖ, если знаете.
В идеале — хотелось бы довести всё до Telegram Mini App с ботом. Чтобы можно было прислать ему скрин из банка со списком трат за день, а он сам считывал суммы, определял категории, а тебе оставалось только выбрать эмоции. В ответ — короткий совет, или чтобы бот присылал их периодически.
Сейчас всё это в вебе — мобильное показалось сложноватым для начала. Но как только доведу текущую версию до чего-то стабильного, очень хочу попробовать сделать iOS-приложение.
Если выйдет вторая часть — значит я не перегорел и что-то получилось.
PS: Сори, что так быстро мышкой вожу на видео
Получаем заказы из нейросетей! 🤯 Это вообще реально?
Я коснулся этой истории в январе, когда ресторан моего португальского товарища начал регулярно получать брони столов из ИИ-агентов 🤖 и гостей, узнавших про его винный бар из GPT и Perplexity. А аутрич агентство партнера по паделу стало получать лиды из Gemini-саммари поискового запроса в Google.
И вот за 7 месяцев мы очень глубоко копнули эту тему — с точки зрения технологии ⚙️, требований к контенту и сайту(-ам) 📄, структуры информации, размещаемой в онлайне. И сначала для себя, а потом и для рынка сделали инструмент для отслеживания своего бренда и конкурентов в выдаче нейросетей.
20 августа в 15:00 мск онлайн я проведу онлайн-встречу с моим партнером, Володей Малюгиным — основателем известного SEO-агентства и CEO нашего совместного GEO (Generative Engine Optimization) проекта 🚀 (сколько всяких *ЕО :)) )
Трафик утекает в нейросети, поисковики показывают сгенерированный ИИ-виджет выше, чем результаты поиска. Так вот, GEO — это как SEO, только с нейросетями.
Как всегда, без рекламы, прогревов, сбора воронки, QR-кодов, регистрации и СМС.
Ты узнаешь: • 💡 Почему теперь важны FAQ, списки и базы, а не только «ключевики». • 📌 Получишь 9 конкретных «что делать?». • 🧠 Узнаешь про E-E-A-T (Experience, Expertise, Authority, Trustworthiness) — язык, на котором «сайты» разговаривают с AI. • 🛠 Получишь технические рекомендации, выполнение которых доступно каждому.
И, конечно, будут кейсы 📊 и ответы на вопросы.
📅 Среда, 20 августа, 15:00 Мск, Zoom. Приходи и сотрудников приводи — им же потом всё это воплощать.
🔗 Ссылка на Zoom: https://us02web.zoom.us/j/89321406270?pwd=WPs9eNbqawbHMbhbndMlszuO0X74hc.1
Делаем задорно, живо, без воды, по делу, без домыслов — только собственный опыт. 🔥