Cursor vs Claude Code
Страница 7 из 26
Мой опыт с MCP
Зачем MCP?
Единый протокол для API к моделям существует уже давно, и в YouTube полно роликов «эти MCP заменят всё, что нужно». Но на практике найти действительно полезные решения оказалось не так просто.
CLI решает почти всё
Мой главный вывод: хорошая CLI способна заменить MCP-сервер в большинстве кейсов. — Для мониторинга бэкенд-сервисов и перезагрузки я пользуюсь render CLI. Чтобы модель понимала контекст, я скопировал вывод render help в текстовый файл и прикладываю его при каждом запросе. — Аналогично с Github CLI: модели обучены на официальной документации и легко справляются с любыми задачами по Git и GitHub CLI без дополнительного MCP.
Ради интереса я даже собрал MCP, который отдаёт в контекст активные рынки, цены на активы и фандинг-рейты. Результат? После демки ни разу не использовал 😶
Game change Несколько дней назад я подключил MCP от Context7 и уже активно юзаю: — Актуальные документации в формате, понятном LLM — Возможность обновить данные «в один клик» на сайте при обнаружении расхождений — Внутри каждой документации разбивка по модулям и готовые code examples
https://context7.com/
Примеры из моих проектов — Tanstack Start и Tanstack Router. Новые библиотеки, их документации ещё нет в LLM-датасетах. Claude и Gemini генерили чушь или копировали старый React-Router. Context7 всегда выдаёт релевантный материал — Feature Sliced Design. Благодаря подробным code examples и FAQ LLM полностью понимает архитектуру, и вайб-кодинг стал проще: можно автоматически проверять каждый pull request и коммит на соответствие архитектуре
PS: Если вы подумали «опять этот фронтенд где крипта», — попробуйте официальную MCP от Solana. Я ещё не тестил, но буду рад услышать фидбек от тех, кому релевантно: https://mcp.solana.com/
4 из 10 - столько людей смогли подключить свой Telegram к Claude на моем первом корпоративном тренинге по AI в январе.
Проблема была не в инструменте — telegram-mcp отличный, я писал уже о нем. Проблема в том, что инструкция написана для разработчиков: API credentials, session strings, конфиги MCP серверов — для нетехнического человека это стена. Но те 4, кто прорвался — были в таком восторге, что начали помогать остальным.
Поэтому, я решил это починить и написал интерактивный скилл-визард для Claude Code и других агентов. Набираешь /telegram-mcp-setup — и агент ведёт тебя за руку: 1) Помогает получить API доступы с my.telegram.org 2) Генерирует приватную строку 3) Сохраняет токены в keychain, а не в текстовые файлы 4) Регистрирует MCP сервер в Claude Code
Уже в феврале, на открытом тренинге, благодаря этому скиллу, результат сильно лучше, хотя тоже не у всех получилось, или у кого-то только сквозь тернии. Поэтому попросил участников присылать diagnosis reports с описанием проблем на разных системах и окружениях, который Claude Code же помог составить. Это помогло закрыть еще кучу edge cases - за что им ОГРОМНОЕ СПАСИБО!
Собственно, теперь выкладываю публично. Если вы не решались подходить к этому снаряду - подключение Telegram к Claude — то попробуйте. Должно быть сильно проще.
Скилл тут: https://github.com/BayramAnnakov/telegram-mcp-setup
P.S. И большая просьба: если что-то пойдёт не так, попросите Claude Code сгенерировать diagnosis report (скилл сам предложит) и присылайте в личку или как issue в гитхаб. Это поможет мне сделать установку ещё доступнее.
Пока готовим CTF 2026 — решил всё сломать задевопсить всё нормально. Там же всё было на палках и rsync, чем больше мы накручивали заданий тем дольше шёл деплой. Конфигурации максимально в ручную, каждый год заново вспоминать, что же там было в прошлом году.
В общем в этом году будет на отдельной vm с терраформами, докерами, флуент бит, клауд логгингом и прочими радостями. А чтобы девопсить было веселей — собрал всё через claude code, такие задачки он на ура делает. Посидел с superpowers побрейнстромил и вперёд
☐ Task 1: Создать базовую структуру Terraform ☐ Task 2: Создать cloud-init конфигурацию ☐ Task 3: Создать основную Terraform конфигурацию (VPC, Subnet, Security Group) ☐ Task 4: Добавить Static IP, Data Disk и Compute Instance в Terraform ☐ Task 5: Создать Terraform outputs ☐ Task 6: Создать Terraform README ☐ Task 7: Создать nginx конфигурацию ☐ Task 8: Создать Fluent Bit конфигурацию ☐ Task 9: Создать обновлённый docker-compose.yml ☐ Task 10: Создать .env.example для docker-compose ☐ Task 11: Создать deployment скрипты ☐ Task 12: Создать Infrastructure README ☐ Task 13: Обновить GitHub Actions workflow ☐ Task 14: Создать документацию по первому деплою ☐ Task 15: Финальная проверка и подготовка к деплою
Есть проблема: всё, чему мы учили на курсе по вайбкодингу еще месяц назад, уже безнадежно устарело.
Потому что новый Claude Code Opus 4.5 — это просто разъеб. Он с одного промпта делает просто лютые вещи, и очень быстро, и всё это в рамках одной подписки, никакого usage-based не надо.
Но Anthropic идёт еще дальше. Они заметили, что люди используют Claude Code далеко за пределами разработки, и поэтому запускают теперь Cowork — по сути тот же Claude Code, но для обычных людей.
По сути происходит то, о чем все говорили весь прошлый год — продукты типа Claude Code и Cursor становятся просто базовым рабочим пространством для любого человека, работающего за компьютером.
(руки чешутся запустить новый поток курса по вайбкодингу теперь про Clade Code, но останавливаю себя)
А ещё — теперь становится решительно не понятно, как нанимать людей. Если человек использует Claude Code, он теперь может делать абсолютно всё. То есть на hard skills теперь смотреть как будто бы вообще бессмысленно. Soft Skills теперь становятся еще важнее, чем раньше, а как их проверять на собесе? Это только в процессе работы можно понять, ну и по рекомендациям еще. А еще и CV у всех теперь вылизанные, сопроводительные письма идеальные.
Короче, в интересное время живем
Кто был на нашем сайте, видел наши иллюстрации с Leo и Robin-ом —> см. аттач
Ну так вот: на днях я на пару с Claude Code написал ряд статей для SEO, и при обсуждении во внутреннем чатике Саша (наш бэкендер) предложил классную идею - проиллюистрировать эти статьи с помощью наших персонажей. Собственно, это означало кучу геморроя допработу для Оксаны, нашего дизайнера.
При обсуждении задачи она такая:
Я уже думаю бота написать, который будет мне иллюстрации про наших героев делать
Собственно, я предложил помочь и запилил за час бота, с промптами и рефами от Окса. Де факто, она сделала всю важную работу, а я лишь оформил в удобный инструмент: 1) Пишешь идею сцены: например, Leo и Rob-in на пробежке в Сиэттле 2) Он с помощью Gemini пишет по рефам промпт и дергает нанобанану в режиме flash 3) Итерируешь с ним, пока не понравится результат 4) И просишь сгенерировать HD версию уже в режиме pro
Некоторые иллюстрации в аттаче - в том числе, неудачные варианты каратышек и великанов :)
===
Но мой поинт в другом: business domain эксперт делает творческую часть - Оксана про нащупать стиль, персонажей, настроение - а AI просто масштабирует ее решения.
В эту тему, кстати, классное выступление с OpenAI Dev Day про следующую волну креативного продакшна.
В комментах попросили рассказать, как я нахожу интересные статьи и выступления.
Короткий ответ: не нахожу — они меня находят :) Длинный ответ ниже.
Итак, у меня 5 потоков/источников, и весь цимес — в столкновениях между ними:
1) Осознанное потребление X, YouTube, рассылки - в основном, я подписан на конкретных людей, чьи интересы и взгляды мне релевантны. Я писал о многих из них тут: Karpathy, Thompson, Mollick. В X я вообще как-то сел и навел порядок в плане того, кого фолловлю, и регулярно чищу, кто перестал мне быть интересен. Для первичной обработки - у меня есть набор скриптов, который читает их, обрабатывает через LLM фильтр, и превращает в подкасты при помощи NotebookLM (например, вот); а далее уже deep dive-просмотр.
2) Подготовка к лекциям Преподавание заставляет меня обновлять контент: честно говоря, если я не попробовал переработать/освежить хотя бы 30% контента, то мне очень неинтересно рассказывать это. Это какая то травма с некоторых курсов в Бауманке, где препод по допотопным журналам читал нам лекцию про бухучет в банке :-)) А слушатели имхо это чувствуют. Например, недавно я готовился к семинару про ai native команды разработки и поэтому, например, написал вот этот пост. Или пост про llm as turk.
3) Разговоры Друзья, зумбары, office hours. К примеру, на последнем office hours AI Product Engineer один из участников рассказал про их практику перевода всех обсуждений в пулл реквесты в GitHub —> это мне дало идею извлекать tacit знания команды из пулл реквестов и обновлять claude.md, недавно на хакатоне сделал как раз такое. Это еще классно переплелось с недавно нашумевшей статьей про context graphs.
Или на зумбаре с другом мы обсуждали кто и как быстро тратит лимиты на Claude Code, и это заставило меня призадуматься о важности "когнитивного пространства", чтобы давать своему любопытству время, а мозгу - ресурсы и энергию - делать и попробовать. Или обсуждали с товарищами как сделать UI к их Claude Code наработкам - заставило меня изучить, как делать экстеншны в VS Code.
4) Хакатоны Хакатоны для меня это не только про попробовать идею/фреймворк, посоревноваться, выиграть приз... Это еще про заимствование и миксование идей. Self-learning Slack бот и не только родились именно так. И, опять же, при подготовке мне надо исследовать и изучать релевантные ресурсы, поэтому запускаю deep research или вот недавно попробовал agent teams для этой задачки.
5) Наблюдение Я уже писал про карточки IDEO; но вообще я всегда любил наблюдения - в школе я всегда выбирал последнюю парту, потому что с нее лучше видно весь класс. Такие наблюдения рождают вопросы - почему люди не выключают свет в туалете - и потом заставляю исследовать вопрос, а это приводит к необычным ресурсам и статьям. Кстати, рекомендую старую, но очень добротную книгу - The Art of Long View Питера Шварца про сценарное планирование - там много про то, как "наблюдать" за миром вокруг и находить релевантные источники.
Мой завкафедрой Вадим Михайлович Маршев любит говорить: "Все 'новое' — это 'новая' комбинация 'старого' в 'новых' обстоятельствах." Вот эти 5 потоков — то самое "старое". Магия — в столкновениях между ними, вопросах их порождающих, и любопытстве получить на них ответ.
Можно ли это все обернуть в skill? Пока не придумал так, чтобы а) оно не теряло актуальность; б) было достаточно гибкое. Но еще подумаю
В этом году: 1) нас стало почти 14 тысяч
2) Мы посмотрели мои 349 постов почти 2М раз, и 28 тыс раз пошерили их себе в закладки или друзьям
3) Тон моих постов сменился с «обзорных» (а ля посмотрел интервью) в «я сделал» (а ля скилл для chatgpt apps). Этим лично я доволен, это была моя задача, хотя понимаю, что обзоры тоже нужны и важны, поэтому постараюсь балансировать.
4) Интересно, что, судя по постам, я сьехал с chatGPT в Claude - тут, разумеется, всему виной Claude Code.
5) На курсах и открытых лекциях приняло участие почти 1.5 тысячи человек, чему я очень рад, так как, я очень надеюсь, это поможет вам лучше понять, что за зверь такой этот AI и как он меняет наши жизни. EDU для меня это способ размышления и обмена энергией и знаниями, и каждая такая встреча, каждый фидбек придает смысла и радости моей жизни. И я особенно рад, когда вам удается не только узнать, но и сделать что то конкретное для своей жизни или работы.
6) 120 человек поболтали с ботом и оставили фидбек: я понял, услышал, и буду отрабатывать. Больше кейсов, больше личных размышлений и «персональной реальности», больше прикладных вещей про AI, меньше рекламы курсов (сорян!)
7) Я люблю то, что мне удается делать - СПАСИБО вам за это!
И если бы я пожелал одну вещь: возьмите на праздниках и поставьте себе Claude Code, откройте его и попросите его помочь вам автоматизировать одну рутинную вещь, которую вы регулярно делаете. Не бойтесь, что не знаете программирования, попробуйте.
С наступающим, Друзья! Обнимаю!
Telegram + Claude Code = ?
На днях руки дошли запилить штуку, которую уже давно хотелось: управлять Телегой через Claude Code. Не через бота, а прямо из терминала: читать, отвечать, искать и тп
Собственно, зачем? - Утренний дайджест непрочитанных сообщений с приоритезацией - Поиск по истории чатов естественным языком - Публикация постов в каналы без переключения контекста, с возможностью налету и текст задрафтить, и картинку сгенерировать, и перевести на заморский язык - Автоматизация рутины: ответы на однотипные вопросы
Как настроить Сделал для вас skill, который для общения с Телеграм юзает MCP сервер telegram-mcp (я проверил код этого mcp на предмет безопасности: все чётко, пароли никуда не улетают).
Что попробовал 1) Читать сообщения из канала и чатов 2) Поиск по чатам 3) Ответить на сообщение 4) Черновики - вот этой функции в MCP не было, поэтому на пару с дружбаном написали + законтрибьютили в telegram-mcp.
Зачем скилл, если есть MCP? Чтобы каждый раз не промптить claude code на регулярные операции, в частности сделал: - Дайджест непрочитанных - утром зашел в Claude, попросил дайджест всех непрочитанных, и уже решаешь на чем фокусироваться - Анализ стиля и написание черновиков постов
Собственно, этот пост написан с его помощью: скилл проанализировал мои последние 15 постов, выделил паттерны, и помог составить драфт. Вот выдержка из стиля по моему каналу:
### P.S. Pattern - Additional related thought - Self-deprecating humor: "Мы еще не отработали... поэтому пока не ругайтесь, что сапожник без сапог 😉"
Скажу честно, эта вот часть пока не вау, но для черновика норм, дальше уже можно крутить самому.
Важно (!): 1) Когда будете подключать этот скилл или MCP сервер, то вам надо будет сгенерировать специальную строку, это очень sensitive информация, которая будет на вашем компьютере. Ее суперважно защитить (keychain и тп) 2) AI видит все чаты, которые вы просите его прочитать. Если есть приватные переговоры и вы не хотите, чтобы это улетало на заморские сервера - или надо подключать локальные LLM или отдельный аккаунт для приватного. 3) Можно случайно отправить не туда. Поэтому в скилл я добавил, чтобы он всегда сначала писал как черновик, а я уже просматриваю и отправляю вручную. Важно: пока автор MCP репозитория не смерджит мой PR, этого не будет из коробки 4) Рейт лимиты - теоретически, Телеграм может ограничить при слишком частых запросах, но для моих личных задач я пока с этим не столкнулся.
--- Co-authored with Claude Code using telegram-assistant skill 🤖😉
Теория vs практика или Какие из наших задач AI уже автоматизирует?
Anthropic сегодня выпустили исследование о влиянии AI на рынок труда. Помните, я писал про их Economic Index год назад ? Тогда это был просто каталог задач, для которых юзают Claude. Теперь они пошли дальше: совместили теоретические возможности AI с реальными данными использования и замерили эффект на занятость.
Ключевая идея: новая метрика "observed exposure" - не "что AI теоретически может", а "что люди реально автоматизируют через Claude прямо сейчас". Разрыв огромный: в Computer & Math, например, теоретически AI покрывает 94% задач. Реально - 33%.
Я покопался в их датасете и нашел интересные примеры этого разрыва по релевантным профессиям + запилил вам бота, чтобы проверять это для себя любимого:
Разработка: - "Написать/обновить программу" - 93% - "Отладить робототехническую программу" - 100% - "Устранить неисправность физического оборудования" - 0%
Продажи: - "Связаться с клиентами для презентации продуктов" - 99% - "Ответить на вопросы клиентов о ценах" - 98% - "Провести переговоры по контракту" - 0% (ВСЕ задачи с negotiate - нулевое проникновение)
Аналитика/менеджмент: - "Анализ финансовых данных для разработки стратегии" - 90% - "Подготовка отчётов" - 99% - "Проведение совещаний с командой" - 0% - "Контроль персонала" - 0%
Видите паттерн? AI забирает задачи, которые можно описать текстом и выполнить за компьютером. Всё, что требует физического присутствия, переговоров лицом к лицу или управления людьми - ноль. Как раз со Стёпой про это говорили на днях.
Тут имхо в тему пост по мотивам Digitalist Papers: там авторы на данных рынка труда США за 40 лет показали, что одна и та же технология (компьютеры) - автоматизировав часть задач бухгалтеров и складских работников - привела к противоположным результатам. У бухгалтеров зарплаты выросли, у складских - упали. Разница: у бухгалтеров автоматизировали рутину (ввод данных), а у складских - экспертизу (знание что где лежит). Когда автоматизируются экспертные задачи, барьер входа падает и зарплаты снижаются. Когда рутинные - наоборот.
Anthropic по сути предоставили данные, чтобы это проверить для AI. И по их датасету мы видим: AI сейчас автоматизирует рутину, а не экспертизу. "Ответь на звонок" - 100%, "проведи переговоры" - 0%. "Напиши отчёт" - 99%, "управляй командой" - 0%. Если экстраполировать выводы Digitalist Papers, то AI пока скорее повышает ценность оставшейся экспертизы, чем обесценивает её. Но "пока" здесь ключевое слово имхо.
Что с рабочими местами? Массовых увольнений нет. Безработица среди "экспонированных" профессий не выросла. Но есть тревожный сигнал: молодых (22-25 лет) стали на 14% реже нанимать на эти позиции. Не увольняют старых, а просто не берут новых. Это перекликается со Stanford-ским исследованием, о котором я писал летом - там нашли -13% найма джунов.
Профиль "экспонированного" работника: чаще женщина, с высшим образованием, зарплата на $10/час больше. AI пока бьёт не по самым уязвимым, а по среднему классу с дипломом. 30% рабочей силы с нулевой экспозицией: повара, бармены, спасатели, посудомойщики.
Вы пока читайте статью и пробуйте бота, а я пошел учиться на бармена-повара (full stack!)
Скилл для создания chatGPT аппов
Помните, я писал про свой первый ChatGPT апп? На днях OpenAI анонсировали-таки свой магазин приложений и теперь можно сабмитить свои аппы.
Чтобы помочь вам в этом я сделал Claude/Agent Skill, который: 1. Помогает оценить, подходит ли ваш продукт для ChatGPT Apps (Know/Do/Show фреймворк, описанном в этом гайде от OpenAI) 2. Генерирует MCP сервер на Node.js/TypeScript с готовыми шаблонами 3. Создает React виджеты с поддержкой тем ChatGPT 4. Настраивает OAuth 2.1 аутентификацию (включая self-hosted вариант!) 5. Готовит к деплою на Fly.io и сабмишену в стор
Скилл соответствует теперь уже открытому стандарту AgentSkills и провалидирован через skills-ref.
Использовать лучше с Claude Code или Codex, потому что он не просто помогает продумать приложение, но и закодить его. Просто попросите его
use the chatgpt-app-builder skill to evaluate if my product should become a ChatGPT App and actually build it
Enjoy!
Полезное в Claude Code - Scheduled Tasks
Можно назначать задачки по расписанию; пока только для Claude Code Desktop
P.S. Напомню, кстати, что в Claude for Chrome тоже есть такое
завел дневник вайбкодера sereja.tech/blog
в каждый вабйкодерский сессии два актива: код и понимание. код пушим на автомате. 🪼 понимание теряем на автомате
классика: "5 часов вайбкодил, а че сделал вспомнить не могу"
теперь память хранится в статье которая генерится клод кодом через скилл в конце сессии и пушится в гх
под капотом писатель + консилиум редакторов вычитывающих аи-слоп + фактчекер через субагенты.
аи проверяет аи
а жена спрашивает чем занимаюсь. показываю блог. больше не спрашивает
Чем AI агент отличается от софта?
Софт видит ограничение и выдает ошибку, заставляя пользователя решать ее; агент же - ищет обходной путь. Иногда это хорошо, а иногда - не очень. Прямо как инициативный сотрудник 😉
2 кейса: 1) Я как-то рассказывал про то, как Opus 4.5 нашел лазейку в регламентах авиалинии - это тест кейс, на котором "муравьи" (сотрудники Anthropic - ants) тестируют новые модели - и поменял билет, хотя формально было нельзя. Скрин рассуждений модели и как она это сделала - в аттаче
2) Сегодня на моих тестах тоже случился забавный кейс: у меня были задублированы сделки в CRM и я попросил агента удалить одну из них, но функции удаления не было, поэтому он вместо того, чтобы возразить а ля "босс, не могу, сорян", перевёл сделку в статус "Утеряно" и в комментариях написал, что это из-за дубля.
А как поступил бы ваш софт? 🤡
С осени 2025 года (и особенно в январе) начался дикий хайп вокруг Claude Code.
Не хочу показаться дедом и хейтером, просто напомню:
1. Чтобы нормально вайбкодить и не упираться в лимиты на Claude, нужно покупать подписку Max за 100 баксов в месяц 2. Если вы платите за ChatGPT Plus, то у вас там из коробки идет OpenAI Codex (аналог Claude Code) 3. По лимитам Codex на подписке Plus гораздо щедрее Claude на подписке Pro 4. По бенчмаркам gpt 5.2 и opus 4.5 выдают примерно одинаковый результат
Получается, если вы платите за ChatGPT, то получаете из коробки Codex за 0 долларов против Claude Code за 100 долларов в месяц.
Про то, как поставить себе Codex писал тут
gm degens! давно не общались
Я до сих пор не понимаю, насколько хватает 20$ подписки на Claude Code, давайте сольем все доступные токены на нормальный фронтенд для этого проекта, а то у меня начинается жжение в области таза при открытии фронтенд репозитория 🙂
---
Перепишем с нуля frontend для opensource gambling machine используя Cursor + Claude Code – https://www.twitch.tv/insulineru (без записи)
insuline – 2 agen.ts (ft claude & codex)
https://youtu.be/F5KQUr6oj4g
трек в комментариях ↓
Интересно, что большинство до сих пор считает, что вайбкодинг — это максимум про то, чтобы собрать MVP.
На самом деле я знаю кучу команд которые уже сейчас вайбкодят приложения в прод. Да, пока еще это чаще всего не слишком сложные продукты, но мы ведь только в начале пути!
Лендос завайбкодить, например, — это уже точно решенный вопрос, а ведь всего год назад это было не так.
Claude выпустил Sonnet 4.5, и в релизе написано в основном про код. Anthropic явно выбрал нишу, где они хотят быть лидерами, и все ресурсы направляет туда.
Я думаю, что через 5 лет писать код руками будет примерно как писать ручкой на бумаге: навык важный и полезный, в школе учить будут, но скорее для развития мозга, а не для применения в жизни
Это не значит, что разработчики будут не нужны. Скорее их станет в 10 раз больше, чем сейчас, просто они будут писать код с помощью промптов и агентов
Кофаундер найден, прикиньте!
Первым делом мы, конечно же, завайбкодили лендос и LMS-ку 😅
Есть шанс, что на этом всё не закончится, и скоро анонсируем первый поток.
Сделаем первый маленький набор с полу-индивидуальным подходом, научим вайбкодить 20-30 человек, и после этого решим, будем ли продолжать.
PS. Спасибо всем, кто откликнулся! Боже храни силу канала, оказывается, тут можно и кофаундеров искать
Многих триггерит, что я пишу про себя в анонсе:
«завайбкодил приложение, которое приносит больше $100к выручки»
Да ребят, понятно, что дело не в аппке, а в маркетинге. Просто Кирилл бог трафика и льёт в плюс (условно, чуть меньше чем на эти $100к), и это позволяет нам получать платящих пользователей, и по дороге делать для них продукт. Без маркетинга ничего бы не получилось, никакой вайбкодинг бы не помог.
Но магия в том, что таким людям как я, которые не умеют программировать, раньше это просто было недоступно!
Порог входа в то, чтобы сделать свой апп, был кратно выше. Надо было собирать команду, платить разработчикам кучу денег, долго ждать — и в итоге вообще не факт, что что-то получалось. А теперь я сам без навыков программирования сделал не только саму аппку, но и прикрутил платежки, собрал данные в BugQuery из разных систем, свел всё в дашбордах в BI, накрутил поверх кучу скриптов и алгоритмов, делаю ленды, и много всего еще.
И все это благодаря вайбкодингу. Расскажи мне кто-то об этом еще год назад — я бы просто рассмеялся в лицо.
Мы сейчас командой из неполных 4 человек делаем то, на что раньше нужно было минимум 25.
Мир очень сильно изменился, и если вы еще этого не поняли — еще не поздно запрыгнуть в этот вагон и вайбкодить с нами 🙂
PS. Скоро-скоро запустим новый поток курса, да!
🤔 Я больше не доверяю GPT. Куда переезжать?
За последние дни многие люди вокруг задумались, что необходима альтернатива для GPT. Десятки тысяч бизнесов смотрели, как сотрудники уходят из OpenAI и были готовы ко всему. Я провел начало недели за рисерчем доступных решений и решил упаковать результат в пост. Существует два вида решений: 1) сервисы с API над языковыми моделями; 2) поднятие моделей у себя. Сегодня расскажу про первую категорию.
Claude: самая близкая к GPT-4 модель по бенчмаркам, недавно увеличили контекстное окно до 200 тысяч токенов (не совсем эффективных), и добавили function calling как в GPT. В первую очередь я бы начал эксперименты с нее. Из минусов: немного отличается API, промптинг, и также модель напрямую доступна не во всех регионах (зато доступна через Amazon).
Perplexity: в мае я рассказывал про их продукт, как замену Гугла. С тех пор они также запустили API для доступа к их собственной языковой модели, а также Llama2 и Mistral . В анонсе высочайшую скорость инференса среди конкурентов. API работает в формате OpenAI — это значит что переключаться легко. Мне нравится темп их команды и обязательно буду за ними следить. В комментариях поделюсь способом получить бесплатный доступ к Perplexity PRO на 2 месяца — он как раз дает доступ к API и оно пока бесплатное.
Decart: вариант для тех, кто любит потестить сырые стартапы. Они также предлагают API для доступа к моделям — от $0.1 за миллион токенов Llama2 7B. Это самая дешевая цена за инференс, которую я нашел во время рисерча и скорость ответа также порадовала, так что решил про них тоже рассказать. От стартапа есть ощущение, что он в любой момент отвалится, но зато быстро отвечают в твиттере.
Также потестил: Replicate — медленно и по ощущениям, и по бенчамаркам; Anyscale — сложный онбординг, непрозрачная ценовая модель; LiteLLM — библиотека, чтобы приводить разные форматы API к формату OpenAI, чтобы делать бесшовное переключение, показалось удобной.
😲️️️️️️ Когда я начинал рисерч, то не ожидал, что уже есть столько удобных решений на рынке, чтобы эксперементировать с ними. Конечно, они все уступают GPT по качеству, но это не значит, что с ними не нужно учиться работать уже сейчас. Последняя неделя очень ярко показала, как опасен платформенный риски. Нам нужна диверсификация.