Vibe Takes

Claude
следит

Он читает каналы и собирает тейки про AI-инструменты. 61 автор — дизайнеры, разработчики, фаундеры.

Саммари на основе постов до 23 марта 2026 — все со ссылками на оригиналы.

vlad kooklev — ai & startups

vlad kooklev — ai & startups

@prod1337·Фаундер·2.5K подписчиков

AI-саммари

Построил личный совет директоров из агентов — один качает тренды, другой тренирует по протоколам Хубермана и Аттиа, третий коучит по CEO-фреймворкам. Отказался от ChatGPT Pro за $200/мес, собрал собственный deep research пайплайн на claude-pipe — восемь аспектов, red team, $1 за исследование. Выпустил в опенсорс claude-telegram и сделал radius по аудиту 100+ CVE-отчётов openclaw. Теперь строит agentcy — компанию без сотрудников, где вместо найма — деплой агентов. Разрабатывает на голом Claude Code вместо openclaw — ниже уровнем, больше контроля. Форкает лучшие механики из чужих репозиториев в свою систему: каждый день агент присылает ему саммари апдейтов openclaw, чтобы не зависеть от чужого роадмапа.

20 августа 2024 г.3.1K просмотров

🤑 Как я сэкономил 50 часов за месяц во время JBTD-исследования (показываю AI-пайплайн)

За последние полтора я плотно занялся улучшением своих продуктов. В рамках этого я провел 40+ JBTD-интервью про AI в работе. Сами звонки занимают ~50 минут, при этом еще больше часа уходило на расшифровку записи — работа при этом не самая приятная. В этот раз я решил подойти из AI-first подхода и построил пайплайн, который сэкономил мне все эти часы.

Что умеет текущая система: - Автоматически приходит на звонки из календаря и собирает транскрипт; - Транскрипт складывается на страницу звонка в базе знаний; - Генерируется общее AI-саммари на странице звонка, выделяется список задач; - В шаблон интервью подставляются ответы респондента; - Генерируются JBTD-сценарии из заполненного шаблона интервью и инструкций;

Как я это реализовал: - Для AI-транскрипта и саммари я использую AI-агента от Tana, но подойдет любой аналогичный сервис — обычно я рекомендую mymeet; - Для базы знаний, база транскриптов звонков я тоже использую Tana — она легко интегрируется с календарем и списком контактов — для меня работает идеально. Могу зайти в сущность человека и найти все наши звонки, быстро наверстать контекст; - Для заполнения шаблона и финальной обработки я использую Sonnet 3.5. По моему опыту он лучше справляется с длинными текстами, а еще мне нравится их XML-like промптинг.

Какие слабые места: - AI все еще плохо справляется с выделением смыслов во время генерации JBTD-сценариев. Это сложная и креативная задача — мало, кто из людей умеет это делать правильно, так что не удивительно; - Всю логику работы с Claude я пока что делаю вручную, хотя у Tana есть API и я могу легко к нему подключиться;

Какие следующие шаги: - Склеить Tana и Claude, автоматизировать весь процесс; - Упаковать внедрение AI-first-meetings в услугу и начать внедрять в процессы компаний. Если интересно уже сейчас, то пишите;

На выходе AI мне позволил автоматизировать всю рутину, оставила для меня только самые и креативные задачи. К такому мы сейчас стремимся во всех рабочих сферах.

@prod1337

19 июля 2024 г.3.3K просмотров

🤖 Я создал AI-агента, который помогает готовиться к звонкам

Каждую неделю я провожу не меньше 10 зум-звонков с незнакомыми людьми. Обычно это запросы на консультации или люди с аутрича. Я по своему опыту знаю насколько сильно портит впечателение неподготовленность собеседника. Даже 5 минут подготовки дают преимущество, но даже они не всегда есть.

В один из моментов, я спешно гуглил собеседника перед встречей и осознал, что делаю всегда примерно одни и те же шаги. Так я решил разработать своего AI-агента, который собирает репорты для меня. Ниже расскажу, что он умеет.

Агент подключен к почте: за час до каждого звонка мне в телеграм приходит продвинутый отчет о собеседнике. Агент проходится по 8 источникам данных, ходит по сайту компании, гуглит (запросы для поиска агент составляет самостоятельно) и ищет нужную информацию на сайте компании.

Агент подстраивается: в настройках я указываю мои текущие цели, а агент адаптирует отчет под них. Он также подстраиватеся и под собеседника: легко разделяет инвесторов и фаундеров. Например, для инвесторов больше фокуса будет на последние сделки, а для фаундеров на общий бэкграунд: первый ли это опыт запуска компании, какие позиции занимал в найме. Агент также анализирует, что человек писал в соцсетях в последнее время.

С агентом можно общаться: если в изначальном репорте информации недостаточно, то ее всегда можно уточнить. В этот момент агент может продолжить сбор информации. Обычно я прошу сгенерировать список айсбрейкеров, чтобы начать с них диалог или больше деталей про компанию.

🚀 Дальше больше: планирую интегрировать агента с моим хранилищем расшифровок звонков, чтобы при подготовке к звонку учитывать контекст прошлой встречи. Рынок автоматического рисерча кажется интересным: можно дальше уходить в поиск интервью или подкастов с этим человеком, конкретных цитат, которые можно использовать, уходить на много уровней вглубину.

Хотели бы себе такого агента? Ставьте 🦄, если да

3 июня 2024 г.4.3K просмотров

👨‍💻 Как научить команду разработки применять AI

С таким вопросом ко мне часто приходят компании. Для одних это просто желание конкретного менеджера ускорить доставку фичей, а у кого-то это KPI на уровне всей компании по количеству AI-сгенерированного кода.

Раньше я мог помогать компаниям только через консультации, а теперь могу поделиться ссылкой на мое мартовское выступление. Я пробежался там по основным слоям внедрения AI в процесс разработки: от базового промптинга до мульти-агентских систем.

На видео неожиданно уже набролось 7.5к просмотров за несколько дней, но чувствую, что тема зайдет для намного большего количества людей. Даже если вам не актуально, то рекомендую закинуть в ваш чат с разработчиками, это лучший способ «начать внедрять AI в процессы» и начать доставлять фичи быстрее.

https://www.youtube.com/watch?v=JAWhQ4FpL8c

Снова большой перерыв без постов, буду исправляться. Насыпьте реакций ❤️, если интересно, над каким AI-продуктом я работал последние месяцы.

1 апреля 2024 г.3.6K просмотров

🏋️‍♀️ Как я внедрил в жизнь AI-фитнес-тренера и доверился его решениям

Уже больше месяца я использую фитнес-браслет Whoop с AI-тренером внутри. У меня набралось достаточно информации, и я решил упаковать ее в пост, где про все расскажу.

Что такое Whoop: это условно бесплатный фитнес-браслет по подписке. Его носит главный биохакер мира — Брайан Джонсон и масса других знаменитостей. При покупке платишь только за доставку, а дальше оплачиваешь подписку — от $20 в месяц. Главная фишка самого браслета — он собирает информацию о пульсе каждую секунду, за счет этого достигается высокая точность при анализе активности и сна. При этом браслет работает 4-5 дней от одного заряда. Это стало возможно за счет того, что сам браслет только собирает пульс и будит вибрацией по утрам, все остальное находится внутри приложения.

Что может приложение: сама бизнес-модель подталкивает компанию вкладываться в развитие приложения. Интерфейс приложения строится вокруг аналитики по трем основных метрикам: strain, sleep, recovery. Приложение следит не только за тем, чтобы вы жили активно, но и за качеством восстановления и сна. Например, часы предложат вам сделать расслабленный день после дня со сложной тренировкой. Подход Apple Watch, где вам нужно закрывать кольца каждый день, несмотря ни на что, после этого кажется примитивным и устаревшим. Мой главный фокус сейчас на том, чтобы вывести метрику сна на регулярные 90%+, и понимаю, что без данных это было бы кратно сложнее. Еще одна фишка — дневник: вы каждый день проходитесь по чеклисту и отмечаете сделали ли что-то из списка (кофе, алкоголь, холодный душ), а через время приложение находит корреляции между этими действими и вашим восстановлением.

Для чего там AI: также в приложение встроен персональнрый AI-тренер. Он дает рекомендации по питанию, активности, восстановлению из ваших данных и цели. На скриншоте например я спросил, какие активности мне стоит сегодня сделать. Внутри тренер работает на связке GPT+RAG по базе знаний + по моим персональным данным. Один из немногих крутых примеров AI-копайлота вне профессиональных задач, пользуюсь почти каждый день.

😎 Пока писал пост, то понял что у меня мыслей еще как миниму на один пост про бизнес-модель и продуктовый подход Whoop: как они привлекают и удерживают пользователей, как создают ощущение причастности к комьюнити — расскажу про это отдельно. По моей рекомендации браслет заказали уже несколько человек, так что тут тоже оставлю рефералку на бесплатный первый месяц. За месяц можно понять нравится ли браслет. Если нет, то просто не оплачивать дальше подписку.

15 марта 2024 г.3.0K просмотров

Всем привет, апдейты от меня 😎

Как оказалось, сложно вести канал, когда у тебя каждую неделю выступления. За последние два месяца прочитал 8 лекций для компаний, выступал на конфах — все про AI конечно. На это наложился мой перфекционизм и то, что я каждый раз обновлял материал. Знаю, что в канале много людей с выступлений, привет ребята!

К счастью (для читатателей канала) выступления заканчиваются, а еще из них набралась масса материала, постепенно начну ее упаковывать в посты:

1. Почему 2024 — идеально время, чтобы начать делать контент (при помощи AI конечно) 2. AI-сотрудники, как нанять первого к себе в компанию 3. Реальные способы внедрить AI в процесс разработки (помимо копайлота) 4. Как я внедрил в жизнь AI-фитнес-тренера и доверился его решениям

Поставьте реакций, если ждете посты 🫡

25 декабря 2023 г.9.8K просмотров

👨‍💻 Лучшие AI-инструменты для разработчика в 2024

На прошлой неделе я провел первый тренинг «AI для разработчиков». При подготовке я поговорил с десятками разработчиков, проанализировал отчеты от Gitlab и Jetbrains. В результате я узнал какие AI-инструменты и промпты разработчики используют для повышения продуктивности. В этом посте я решил поделиться инсайтами про самые интересные инструменты для разработчиков и разбил их на категории.

1. Github Copilot — универсальный инструмент: больше 50% кода на Github уже написано с его применением. Большинство разработчиков при этом до сих пор им не пользуются. Команда Copilot сначала закрыла сценарии отдельных разработчиков (авто-дополнение, тесты, документация), а теперь развивает продукт на уровне команд и все компании (анализ PR, разворачивание в контуре). JetBrains недавно показали свой аналог Copilot для тех, кто сидит на их стеке. Стоимость — от $10 в месяц.

2. Cursor.sh — потенциальный дизрапшен: в отличии от Copilot они выбрали другой путь — AI-first. Команда Cursor форкнула VSCode и перестроили его интерфейс, чтобы промпты стали главным способом взаимодействия с кодом. В Cursor вы пишете промпт прямо там же, где раньше писали в редакторе код. Также отмечу фичу, которая позволяет прокинуть ссылки на актуальную документацию библиотек, и тогда они будут использованы при генерации. Также как и Copilot — используют модели от OpenAI. Есть небольшое количество запросов в месяц, чтобы протестить бесплатно.

3. Phind — альтернатива для GPT: они начали еще до ChatGPT-хайпа, как поисковик для разработчиков и попали с ним в YC. Долгое время они использовали GPT внутри, но в процессе собрали даныне и обучили свою модель. Теперь Phind отвечает на вопросы разработчиком и генерирует код. Phind доступен в вебе и ставится, как расширение для редакторов кода (в том числе Cursor). Phind доступен бесплатно.

4. CodeMuse — самый интересный стартап: свежий проект из следующего батча YC. Эта команда сфокусировалась на том, чтобы применить к локальному репозиторию open source LLM и эмбединги, и строить вокруг этого фичи. Уже сейчас доступен поиск человеческим языком над проектом — «find function that checks permissions» и автоматическая документация для всего проекта. В начале следующего года они планируют добавить ассистента и генерацию кода. CodeMuse также доступен бесплатно в виде расширения.

🫡 Уже сейчас такие инструменты создают разрыв между разработчиками в разы, а в следующем году разрыв станет критическим. Сейчас лучшее время, чтобы начать их применять — начните с этого списка.

27 ноября 2023 г.6.2K просмотров

📺 Как устроены изнутри языковые модели

Я постоянно пишу про сложные технические темы. Я осознанно не вдаваюсь в детали, но зато посты получаются более насыщенными моими инсайтами. В то же время, я с большим уважением отношусь к людям, которые могут простыми словами объяснять, как устроены сложные вещи.

Именно такой контент регулярно выпускает Andrey Karpathy — один из главных людей в OpenAI и в прошлом директор AI-направления в Tesla. Несколько дней назад у него вышло видео «Intro to Large Language Models». Там он за час рассказывает из каких основных компонентов состоят системы, как ChatGPT. Если слышали термины «инференс», «файн-тюнинг», «галлюцинации модели», но не понимаете их до конца, то рекомендую к просмотру. Видео набрало за эти дни уже пол миллиона просмотров.

Если пока нет времени, чтобы посмотреть видео целиком, то Леша из канала «Ночной Писаревский» сделал хорошую выжимку на 5 минут на VC. Этого хватит, чтобы получить первичную картину и начать лучше ориентироваться в теме.

24 ноября 2023 г.3.9K просмотров

🤔 Я больше не доверяю GPT. Куда переезжать?

За последние дни многие люди вокруг задумались, что необходима альтернатива для GPT. Десятки тысяч бизнесов смотрели, как сотрудники уходят из OpenAI и были готовы ко всему. Я провел начало недели за рисерчем доступных решений и решил упаковать результат в пост. Существует два вида решений: 1) сервисы с API над языковыми моделями; 2) поднятие моделей у себя. Сегодня расскажу про первую категорию.

Claude: самая близкая к GPT-4 модель по бенчмаркам, недавно увеличили контекстное окно до 200 тысяч токенов (не совсем эффективных), и добавили function calling как в GPT. В первую очередь я бы начал эксперименты с нее. Из минусов: немного отличается API, промптинг, и также модель напрямую доступна не во всех регионах (зато доступна через Amazon).

Perplexity: в мае я рассказывал про их продукт, как замену Гугла. С тех пор они также запустили API для доступа к их собственной языковой модели, а также Llama2 и Mistral . В анонсе высочайшую скорость инференса среди конкурентов. API работает в формате OpenAI — это значит что переключаться легко. Мне нравится темп их команды и обязательно буду за ними следить. В комментариях поделюсь способом получить бесплатный доступ к Perplexity PRO на 2 месяца — он как раз дает доступ к API и оно пока бесплатное.

Decart: вариант для тех, кто любит потестить сырые стартапы. Они также предлагают API для доступа к моделям — от $0.1 за миллион токенов Llama2 7B. Это самая дешевая цена за инференс, которую я нашел во время рисерча и скорость ответа также порадовала, так что решил про них тоже рассказать. От стартапа есть ощущение, что он в любой момент отвалится, но зато быстро отвечают в твиттере.

Также потестил: Replicate — медленно и по ощущениям, и по бенчамаркам; Anyscale — сложный онбординг, непрозрачная ценовая модель; LiteLLM — библиотека, чтобы приводить разные форматы API к формату OpenAI, чтобы делать бесшовное переключение, показалось удобной.

😲️️️️️️ Когда я начинал рисерч, то не ожидал, что уже есть столько удобных решений на рынке, чтобы эксперементировать с ними. Конечно, они все уступают GPT по качеству, но это не значит, что с ними не нужно учиться работать уже сейчас. Последняя неделя очень ярко показала, как опасен платформенный риски. Нам нужна диверсификация.

15 ноября 2023 г.3.8K просмотров

👀 AI теперь видит и сделает за вас рутинные задачи

Раньше для автоматизации действий в браузере этого требовалось цепляться к html-элементам, четко задавать последовательность шагов, из-за этого существовал порог входа. Теперь у GPT появилась способность видеть и открылось новое пространство решать эту задачу. Разберемся, какие новые подходы уже доступны на рынке автоматизаций.

Adept: еще до ChatGPT хайпа показали свою модель для превращения запроса пользователя в действия. Недавно открыла бету в свой первый продукт Experiments и закрыли раунд на $350mln. Важно, они пока не заявляли про поддержку «видения» в своих продуктах, но это явно вписывается в их стратегию построить AGI.

Induced AI: у этих ребят только $2.3 mln. инвестиций, но зато инвестировал Сэм Альтман. Они также предлагают продукт для автоматизации рутинных задач. Для этого планируют использовать смешанный подход: облачное решение, интеграции с сервисами по API, но в тоже время хотят использовать виртуальый браузер, в котором понадобится возможность «видеть». Для этого сейчас нанимают эксперта в Chromium.

VimGPT: опен-сорсная демка и единственный продукт из подборки, который можно по настоящему попробовать. Проект позволяет управлять виртуальным браузером через команды «найди в гугле все ai+sales продукты и прочитай их контент». GPT получает скриншот страницы, анализирует его и составляет очередность действий. Демка очень сырая, но дает понимание текущих возможностей.

😎 Официально GPT Vision используется только в последнем проекте, но я все равно вынес это в заголовок. «Видение» в перспективе станет ключевой технологий на рынке автоматизаций. На наших глазах появиласть возможность автоматизировать любые действия на сайтах без привязок к API или html-элементам. AI-работникам из предыдущего поста понадобится такой же визуальный инпут, чтобы эффективно решать задачи реального мира. Уже придумали какие задачи будете автоматизировать в первую очередь?

@prod1337

13 ноября 2023 г.3.3K просмотров

🤖 AI-сотрудники — когда они уже нас заменят? 

Возможно, вы уже слышали новый AI-нарратив — «вашим следующим работником станет AI». Мне нравится концепция: нанимаешь на джуниорскую роль AI-агента, встраиваешь его в процесс и он выполняет свою четкую роль. Но насколько это работает уже сейчас? Я пообщался с 10 компаниями, которые строят AI-сотрудников и узнал на какой сейчас стадии развития они находятся. Ниже поделюсь своими наблюдениями.

Конструктор vs. коробочный агент: есть два подхода к созданию AI-сотрудников. 1) Создать конструктор, в котором уже будут собирать сотрудники под задачу. 2) Создавать уже готовых AI-агентов и давать их компаниям на внедрение. У обоих подходов есть свои плюсы и минусы, пока рано делать выводы.

Решают узкие задачи: компании сейчас сфокусированы на решении узких задач внутри профессий, которые дадут максимум пользы компаниям. Обычно это рутины: переписки, рисерчи, подготовка документов, продажи. Идет нормальный продуктовый процесс, когда сценарии последовательно закрываются и затем проверяются в реальном мире.

AI-агенты уже работают: здесь нужно смотреть на это взвешено: на данный момент ничего пугающего, их уровень пока сложно называть джуниорским. С другой стороны, я бы также не делал никаких выводов о «бесполезности». Следующие итерации будут появляться быстро, и через полгода мы увидим уже продвинутые версии.

😎 Вот здесь можно почитать мои апрельские предсказания про AI-агентов, там я целиком предсказал их текущее развитие. За это время мы в Agentcy научились собирать state-of-the-art ИИ-сотрудников для компаний и начали их внедрять. В связи с этим, могу написать новый список предсказаний — поставьте реакций, если интересно.

7 ноября 2023 г.3.2K просмотров

🗿 Как я первым в мире нашел новый AI-продукт от Илона Маска

Полный заголовок не влез, он заканчивается так — «..., запостил твит об этом, но получил популярность только среди крипто-скамеров». Звучит безумно, да? Сейчас расскажу.

В воскресенье увидел анонс LLM-чата от компании xAI и пошел изучать. Я быстро уперся в заградительный вейтлист, оставалось только смотреть чужие видео. При это буквально месяц назад я прочитал свежую книгу про Маска. Там очень хорошо была описана его любовь к дедлайнам и кранчам. Релиз в воскресенье за 2 дня до конференции OpenAI это как раз такой же кранч. Особенность кранчей в том, что легко забыть что-то спрятать, поэтому я решил пойти порисерчить, что там есть на сайте xAI.

Я быстро нашел новые сабдомены, один из них был ide.x.ai. Сейчас там уже работающая заглушка, а тогда выскакивала фронтендовая ошибка. Я полез в исходники страницы и спустя время нашел скриншот нового продукта — PromptIDE, положу его в комменты. На скриншоте я увидел продукт для программирования промптов на стыке с Python. Это что-то новое, круто!

Я пошел перепроверить анонсил ли кто-то уже это в Твиттере. Смог найти в поиске только твиты крипто-ботов, которые разгоняли какой-то токен — получается я был самый первый, и пошел запостил твит об этом. Твит медленно заводился, я пораскидывал его по инфлеюнсерам и пошел спать. На утро я нашел 40 новых ретвитов, но неожиданно большая часть из них была снова от крипто-ботов. Так, а что это все-таки за токен, на который я натыкался в поиске?

Оказалось, что еще раньше меня новый продукт нашли сканнеры крипто-скамеров. Они моментально вытащили название PromptIDE, как только оно появилось на сайте. Автоматически создали токен, группы в телеграме, набили их людьми и пошли его разгонять сеткой ботов по твиттеру. И мой твит как раз попал в сетку для ракрутки токена. Видимо, такие боты настроены на все, что связано с Маском и на сайты всех его проектов. Получается, я был первым только среди людей, боты были раньше. Скриншоты тоже будут в комментах.

Твит в итоге все равно вышел на AI-аудиторию, но меньше, чем мне хотелось бы, а спустя сутки вышел уже официальный анонс PromptIDE.

6 ноября 2023 г.2.8K просмотров

🎁 Разыгрываем премиумы среди подписчиков AI-каналов

Два больших события этим вечером: прошла конференция OpenAI и Телеграм запустил официальные розыгрыши премиумов.

Про конференцию я уже написал выше, а вот в честь запуска от Телеграма мы с @rvnikita_blog и @datafeeling запустили свой розыгрыш. Для участия нужно быть подписанным на три канала и нажать на кнопку ниже (надеюсь она появится ниже, а то интерфейс новый).

6 ноября 2023 г.2.6K просмотров

🦄 Почему сегодняшнее обновление ChatGPT не убьет стартапы

Сегодня вечером пройдет большой DevDay от OpenAI и уже есть сливы, что там могут показать. Самым большим станет Gizmo — тул для создания кастомных чатботов, а также маркетплейс, где пользователи смогу продавать доступ к своим ботам. После первых сливов сразу же пошли посты о том, что это убьет стартапы, а после конференции такого будет еще больше. Я с этим не согласен и расскажу, почему это наоборот открывает массу возможностей.

1. Универсальность против специализации: такое решение, как Gizmo действительно cможет съесть большой сегмент рынка, но в этом его слабость. Оно всегда будет уступать по удобству инструментам, заточеным под конкретные задачи. Интерфейс будет одинаковым для всех — для поддержки, продаж, образования или изучения языков — пользователи неизбежно столкнутся с ограничениями, поскольку интерфейc не получится адаптировать для всех сегментов сразу.

2. Технология vs. понимание пользователя: да, такие чатботы станут следующим технологогическим шагом. Но важно помнить, что в бизнесе ценность часто заключается не в технологии, а в глубоком понимании задач клиентов. Если знаете, кто ваш клиент, и какую проблему решаете, то можно спокойно занимать позицию: «Мы понимаем наших пользователей и их нужды лучше остальных, и будем использовать лучшие инструменты на рынке, чтобы их удовлетворить». Технологии будут выходить, но опора на пользователя останется.

3. Неравномерность в принятии инноваций: не стоит заблуждаться и относительно скорости принятия таких обновлений. Даже обычный ChatGPT все еще остается продуктом, который используют не больше 10-15% людей. Вне технологического пузыря людям вообще все равно на то GPT это или просто приложение в App Store с зеленой иконкой, которое решает их задачу. На уровне компаний это заметно еще сильнее из-за большого количества специфики в каждой компании, инновации раскатываются еще медленнее.

🚀️️️️️️ Таким образом, я предпочитаю смотреть на это, как на воронку. Больше людей воспользуется ИИ-чатботами, поймет их удобство, но также масса людей столкнется с ограничениями решения от Gizmo. Это произойдет и на индивидуальном уровне, и при попытке перенетси чатботов в компанию. У этих пользователей появится запрос, которого не было раньше, а у стартапов появится возможность продать свое решение этим людям.

2 ноября 2023 г.2.5K просмотров

😎Как сгенерировать векторный логотип с текстом за несколько минут

Рассказал недавно в комментариях к другому посту, как я генерирую векторные логотипы через GPT. Получил много отклика и уточняющих вопросов.

Так я решил расписать инструкцию и делюсь ей здесь. Важно: в процессе потребуется подписка ChatGPT Plus.

TLDR: процесс максимально простой: нахожу референс → специальным промтом прошу GPT-4 описать изображение логотипа → отгружаю результат в DALLE-3 → финальный результат загружаю AI для векторизации.

🔗 Детали, промты, примеры и ссылки вынес в инструкцию, забирайте.

1 ноября 2023 г.2.4K просмотров

🫡 Почему чат, как интерфейс над AI — должен умереть

Одна из призм, через которые я смотрю на AI — это призма контекста. У него есть два основных ограничения: 1) какой объем информации мы можем передать в промпт 2) насколько эта информация актуальна и точная; Сегодня я сфокусируюсь на втором ограничении и расскажу, почему чат-интерфейс для передачи контекста — тупиковая веткой развития.

ChatGPT неэффективен: вспомните, как вы настраиваете GPT при каждом диалоге. Заходите в чат → описываете ситуацию, примеры → просите решение. Каждый раз это происходит заново. Чат просто не знает ничего о вас из прошлых диалогов, и тем более из других приложения. Даже если добавить популярные интеграции, как сделал Google Bard — 90% актуальной информации окажется вне контекста модели, его придется вводить в чате. Но есть и другие подходы.

Вторая память: эту концепцию двигает стартап Rewind. Я уже рассказывал про него в Феврале. Напомню, что они всегда пишут ваш экран и голос, и дают возможность вернуться к этой информации за любое время. С тех пор они анонсировали еще и устройство, которое всегда висит на шее и записывает ваш голос в разговорах вне компьютера. И уже над этим контекст они уже строят ИИ-ассистента, который отвечает на вопросы используя его.

AI OS: другой более низкоуровненый подход, про него написал Andrey Karpathy. По его словам следующий этап развития AI — это нативная встройка на уровне железа и OS. У системы есть прямой доступ к входному и выходному звуку, картинке, доступ к интернету и хранилищу компьютера. Это самый полный контекст в рамках одного устройства. Представьте объем задач, который можно решать без дополнительных тулов: подводить саммари дня, всех звонков, искать пересечения информации и идеи для постов, заносить информацию от клиентов в CRM и ничего не терять.

😲️️️️Конечно, будет много сомнений по поводу приватности, но и тут есть подвижки 1) мы уже видим достойные локальные модели, чтобы не передавать данные никуда с устройства 2) есть большая масса людей, которые выберут эффективность над приватность, например вот тут в комментариях.

@prod1337

5 октября 2023 г.2.4K просмотров

📨 Как я получил ключ от GPT-3 в 2020-ом

Разбавлю серию из серьезных постов и расскажу, как я пытался 3 года назад получить ключ от GPT-3 (и в итоге его получил).

Я записался в вейт-лист на API практически в день анонса летом 2020, но спустя месяцы так и не получил ключ. Тогда я решил написать к сотрудникам OpenAI напрямую и попросить у них.

Хоть я и не знал тогда, что занимаюсь аутричем, но все равно начал неплохо: cпарсил емейлы, взял шаблоны холодных писем и переделал их под себя, а затем сел рассылать руками. Сэму Альтману я решил не писать, все-таки СEO компании это занятой человек, а вот 30 другим сотрудникам мои письма улетели и я стал ожидать свой ключ.

Ожидаемо, мне никто не ответил. Это сейчас я понимаю, что действовал наивно. Шаблон я адаптировал криво, он не вызывал никакого интереса. Вместо сотен адресатов я остановился на 30, вместо цепочек сообщений я разослал по одному. Про кривой английский в тексте даже и говорить ничего не нужно.

Сейчас на дворе 2023. Сама GPT теперь стал драйвером качественного аутрича и на этапе подготовки базы и на этапе генерации цепочек персонализированных сообщений. Получается настолько хорошо, что мы в агенстве это стали продавать как услугу (→ в лс расскажу подробности).

🫡️️️️️️ Да, и кстати, ключ я в итоге получил от знакомого, которому пожаловался на неудачный опыт, так что все было не зря.

26 сентября 2023 г.5.6K просмотров

🏗 AI в 2023 — это кубики Лего

Технологии развиваются сегодня быстрее, чем когда-либо. Если раньше AI был конкурентным преимуществом, то сейчас это такой же базовый уровень, как удобный интерфейс. Ниже я расскажу, почему я разделяю классический ML и AI, который доступен сейчас.

ML устарел: раньше для решения любых AI-задач требовались ML-инженеры и долгие месяцы на эксперименты. Теперь же часто достаточно запроса в API. Эндрю Ынг— один из главных людей в ML-индустрии. Теперь он делает курсы по промптингу и рассказывает про это так: «Даже мне, опытному ML-щику, раньше нужны были 2 недели, чтобы решить задачу классификации. Теперь же достаточно написать промпт.».

Почему конструктор: по интернету разбросаны разные кубики и главная задача — их умело собрать. Именно про это я говорил в посте про AI-инженеров. Технологии распознования и синтеза голоса, качественные промпты, генерация изображений, ноукод-тулы для создания цепочек запросов в LLM — все это кубики.

Как я применяю это: в феврале я применил стратегию «кубиков» и запустил расширение для продаж в LinkedIn за два часа. Дальше я интегрировал эту же технологию в процесс привлечения аутстафинг-агенства. Так мы смогли рассылать в 3 раза больше сообщений кандидатам. Я применил этот подход на >10 проектов и везде «AI как сервис» выигрывал у «классического ML» по скорости итераций и проверки гипотез.

🤩 Прямо сейчас происходят огромные инвестиции в индустрию. Только вчера GPT научился видеть и говорить, а в следующем году уже может научиться генерировать видео. Мы неминуемо идем к миру, где технологии стоят дешево и доступны всем.

@prod1337

22 сентября 2023 г.5.1K просмотров

🤑 AI для продаж — самое горячее направление прямо сейчас

Я могу уверенно назвать AI для продаж самым конкурентным рынком внутри AI на этот момент. Доходит до смешного: YC-стартапы после нескольких пивотов в AI-инфтраструктуре в итоге идут делать SaaS для продаж. Сфера стала такой конкурентной, потому что находится ближе всего к деньгам и возврату инвестиций. Сегодня разберу какие решения сейчас есть на рынке для разных этапов продажи и приложу примеры стартапов, с которыми я знаком:

Звонки: компании сфокусировались на автоматизации инбаунд звонков. Люди, которые звонят самостоятельно более мотивированы и шанс, что они отвалятся от синтезированного голоса меньше. Главная сложность звонков — невозможно предсказать, как он будет идти и построить список правил. Требуется постоянно анализировать контекст и перестраивать стратегию. Игроки: Elevenlabs как главная технология для синтеза голоса; Airs.ai;

Холодные продажи: в основном аутрич по линкедину и емейлу. В этой сфере научились хорошо автоматически генерировать холодные сообщения по базе prospects. Так удается рассылать в 2-3 раза больше сообщений, чем это делает SDR. В этой сфере все упирается в умение собирать базу и итеративно писать промпты, которые будут генерировать холодное сообщение. Игроки: Intently; Monolith.

Автоматизация первой линии: это самый массовый этап, где еще непонятно насколько заинтересован человек. Задача AI на этом этапе ответить человеку на вопросы, подобрать опции и в итоге заметить дальнейший интерес. Следом человека можно передавать уже настоящему продажнику, который его будет закрывать продажу. Сложности здесь такие же, как и звонках: разговор всегда будет идти непредсказуемо и нужно возвращать его в заданное русло. Игроки: Maia; внутренние разработки компаний.

Стоит ли заходить на этот рынок: может показаться, что места уже нет, но это не так. 1) стартапы используют открытые технологии, которые доступны всем на рынке и их решения легко скопировать; 2) на текущих технологиях крайне сложно создать решение, которое будет подходить универсально всем, приходится много настраиваться под клиента и самые большие стартапы умеют не больше нескольких десятков клиентов. Это работает в обе стороны, так что стоит взвешивать риски и свои конкурнетные преимущества.

😎 В посте я дал ссылки только шесть AI-стартапов в продажах, но я собираю сейчас таблицу, где их будет 50 и будет больше категорий. Ставьте реакции, если интересно будет ее посмотреть. Чем больше интереса увижу, тем быстрее релизну.

@prod1337

20 сентября 2023 г.4.5K просмотров

🤔 Почему мы до сих пор не увидели прорывных AI-продуктов

Еще в начале лета я был полностью уверен, что LLM станет технологией с самым быстрым принятием в истории и что уже через несколько месяцев все продукты будут вынуждены внедрить себе LLM в интерфейс. Время прошло, а мы пользуемся все такими же приложениями. Если отойти от рабочих задач, то легко забыть что мы живем во время LLM-революции. В чем же дело, давайте разберемся:

Ситуация на рынке: она такая, что устовшиеся компании неохотно идут на эксперименты. Все сокращают косты, на рынке значительно меньше венчурного капитала и компании неохотно вкладываются в инновации. Бизнес выбирает проверенные решения с быстрой окупаемостью, сокращения, а не гипотезы и эксперименты. Диффузия инноваций: хоть я и верил в быстрый массовый адопшен, но закон диффузии инноваций работает и инновации раскатываются плавно по группам пользователей. Даже сейчас принятие ChatGPT не превышает 15% и на пользовательском уровне, и на уровне организаций. Мы увидим примеры новых интерфейсов в массовых продуктах не раньше, чем адопшен подступится к позднему большинству.

Пользовательские привычки: их невероятно сложно переписывать. Считается, что решение должно быть в 10 раз удобнее, чтобы пользователь гарантированного сможет преодолеть боль перехода на новое решение. ChatGPT стал таким 10х продуктом для большого количества рабочих задач, но других прорывных примеров на рынке до сих не видно. Изменения на самом деле происходят: но они не так заметны из-за шума. Каждый день запускаются сотни продуктов и многие из них являются теми самыми 10х продуктами для небольших сегментов пользователей. При развитии эти стартапы будут захватывать все больше сегментов, а это также заставит в итоге большие компании внедрить LLM в привычные решения.

🫡 Вот такой сейчас рынок: все растет не так быстро, как мне хотелось, а компании выбирают скучные решения. Но мне помогает то, что я смотрю через призму трендов и законов. Они мне говорят, что основные продукты и пользователи еще впереди, и просто стоит продолжать строить.

@prod1337

18 сентября 2023 г.2.2K просмотров

🤖 Какой лучший интерфейс для доступа к AI

Сайт ChatGPT — это хороший пример пользовательского интерфейса. Он стабильно обновляется и получает новые фичи. Но интерфейс не может всем подходить одинаково. В результате разные сегменты пользователей получают другие интерфейсы под свои задачи. Лично я перешел на приложение Raycast для доступа к AI и сегодня расскажу про него.

Что за Raycast: это замена поиска Spotlight на маке. Несколько главных фишек — хоткеи, расширения и AI. Хоткеи помогают выполнять частотные команды в несколько кнопок. С помощью расширения можно подключиться и управлять почти всеми популярными програмами (поиск по музыке в Spotify; менеджеры паролей и поиск; запуск терминала из текущей директории).

Какие есть AI-фичи: в Рэйкасте есть два вида AI-сценариев использования. Можно классически пообщаться в чате с AI, а можно запустить команду, которую ты заранее создал и это как раз самое интересное. Кастомные команды состоят из двух частей — заранее прописанный промпт и то как в него попадает входная информация (выделенный текст, текст из буфера или поле ввода).

Как я использую: я обращаю внимание на регулярные запросы к GPT и упаковываю их в команды. Два примера: fix spelling — исправляет ошибки в выделенном английском тексте; answer linkedin message — генерирует ответ на выделенное сообщение, при этом использует информацию обо мне и стилистике из промпта; Все это доступно в несколько кнопок в любом окне, где я нахожусь. Если команда очень частая, то Рэйкаст позволяет просто задать ей хоткей и вызывать ее таким образом.

💸 Обычные возможности Raycast можно попробовать бесплатно. За неограниченные AI-фичи с gpt3.5 нужно будет заплатить $10/mo, а за версию с gpt4 уже $20. Я пока что сижу на версии с 3.5 — ее хватает, чтобы запускать все базовые команды-промпты, но переодически думаю отменить подписку на ChatGPT и перейти на версию с 4-кой.

@prod1337