Gemini vs Claude

Страница 7 из 29

Ночной Писаревский14 января 2026 г.4.3K просмотров

Есть проблема: всё, чему мы учили на курсе по вайбкодингу еще месяц назад, уже безнадежно устарело.

Потому что новый Claude Code Opus 4.5 — это просто разъеб. Он с одного промпта делает просто лютые вещи, и очень быстро, и всё это в рамках одной подписки, никакого usage-based не надо.

Но Anthropic идёт еще дальше. Они заметили, что люди используют Claude Code далеко за пределами разработки, и поэтому запускают теперь Cowork — по сути тот же Claude Code, но для обычных людей.

По сути происходит то, о чем все говорили весь прошлый год — продукты типа Claude Code и Cursor становятся просто базовым рабочим пространством для любого человека, работающего за компьютером.

(руки чешутся запустить новый поток курса по вайбкодингу теперь про Clade Code, но останавливаю себя)

А ещё — теперь становится решительно не понятно, как нанимать людей. Если человек использует Claude Code, он теперь может делать абсолютно всё. То есть на hard skills теперь смотреть как будто бы вообще бессмысленно. Soft Skills теперь становятся еще важнее, чем раньше, а как их проверять на собесе? Это только в процессе работы можно понять, ну и по рекомендациям еще. А еще и CV у всех теперь вылизанные, сопроводительные письма идеальные.

Короче, в интересное время живем

EDU16 января 2026 г.4.3K просмотров

Кто был на нашем сайте, видел наши иллюстрации с Leo и Robin-ом —> см. аттач

Ну так вот: на днях я на пару с Claude Code написал ряд статей для SEO, и при обсуждении во внутреннем чатике Саша (наш бэкендер) предложил классную идею - проиллюистрировать эти статьи с помощью наших персонажей. Собственно, это означало кучу геморроя допработу для Оксаны, нашего дизайнера.

При обсуждении задачи она такая:

Я уже думаю бота написать, который будет мне иллюстрации про наших героев делать

Собственно, я предложил помочь и запилил за час бота, с промптами и рефами от Окса. Де факто, она сделала всю важную работу, а я лишь оформил в удобный инструмент: 1) Пишешь идею сцены: например, Leo и Rob-in на пробежке в Сиэттле 2) Он с помощью Gemini пишет по рефам промпт и дергает нанобанану в режиме flash 3) Итерируешь с ним, пока не понравится результат 4) И просишь сгенерировать HD версию уже в режиме pro

Некоторые иллюстрации в аттаче - в том числе, неудачные варианты каратышек и великанов :)

===

Но мой поинт в другом: business domain эксперт делает творческую часть - Оксана про нащупать стиль, персонажей, настроение - а AI просто масштабирует ее решения.

В эту тему, кстати, классное выступление с OpenAI Dev Day про следующую волну креативного продакшна.

EDU20 февраля 2026 г.4.3K просмотров

В комментах попросили рассказать, как я нахожу интересные статьи и выступления.

Короткий ответ: не нахожу — они меня находят :) Длинный ответ ниже.

Итак, у меня 5 потоков/источников, и весь цимес — в столкновениях между ними:

1) Осознанное потребление X, YouTube, рассылки - в основном, я подписан на конкретных людей, чьи интересы и взгляды мне релевантны. Я писал о многих из них тут: Karpathy, Thompson, Mollick. В X я вообще как-то сел и навел порядок в плане того, кого фолловлю, и регулярно чищу, кто перестал мне быть интересен. Для первичной обработки - у меня есть набор скриптов, который читает их, обрабатывает через LLM фильтр, и превращает в подкасты при помощи NotebookLM (например, вот); а далее уже deep dive-просмотр.

2) Подготовка к лекциям Преподавание заставляет меня обновлять контент: честно говоря, если я не попробовал переработать/освежить хотя бы 30% контента, то мне очень неинтересно рассказывать это. Это какая то травма с некоторых курсов в Бауманке, где препод по допотопным журналам читал нам лекцию про бухучет в банке :-)) А слушатели имхо это чувствуют. Например, недавно я готовился к семинару про ai native команды разработки и поэтому, например, написал вот этот пост. Или пост про llm as turk.

3) Разговоры Друзья, зумбары, office hours. К примеру, на последнем office hours AI Product Engineer один из участников рассказал про их практику перевода всех обсуждений в пулл реквесты в GitHub —> это мне дало идею извлекать tacit знания команды из пулл реквестов и обновлять claude.md, недавно на хакатоне сделал как раз такое. Это еще классно переплелось с недавно нашумевшей статьей про context graphs.

Или на зумбаре с другом мы обсуждали кто и как быстро тратит лимиты на Claude Code, и это заставило меня призадуматься о важности "когнитивного пространства", чтобы давать своему любопытству время, а мозгу - ресурсы и энергию - делать и попробовать. Или обсуждали с товарищами как сделать UI к их Claude Code наработкам - заставило меня изучить, как делать экстеншны в VS Code.

4) Хакатоны Хакатоны для меня это не только про попробовать идею/фреймворк, посоревноваться, выиграть приз... Это еще про заимствование и миксование идей. Self-learning Slack бот и не только родились именно так. И, опять же, при подготовке мне надо исследовать и изучать релевантные ресурсы, поэтому запускаю deep research или вот недавно попробовал agent teams для этой задачки.

5) Наблюдение Я уже писал про карточки IDEO; но вообще я всегда любил наблюдения - в школе я всегда выбирал последнюю парту, потому что с нее лучше видно весь класс. Такие наблюдения рождают вопросы - почему люди не выключают свет в туалете - и потом заставляю исследовать вопрос, а это приводит к необычным ресурсам и статьям. Кстати, рекомендую старую, но очень добротную книгу - The Art of Long View Питера Шварца про сценарное планирование - там много про то, как "наблюдать" за миром вокруг и находить релевантные источники.

Мой завкафедрой Вадим Михайлович Маршев любит говорить: "Все 'новое' — это 'новая' комбинация 'старого' в 'новых' обстоятельствах." Вот эти 5 потоков — то самое "старое". Магия — в столкновениях между ними, вопросах их порождающих, и любопытстве получить на них ответ.

Можно ли это все обернуть в skill? Пока не придумал так, чтобы а) оно не теряло актуальность; б) было достаточно гибкое. Но еще подумаю

vlad kooklev — ai & startups17 апреля 2026 г.4.3K просмотров

мы запускаем новый поток курса по вайбкодингу, стартуем 23-го апреля

все последние месяцы я рассказывал вам про свои наработки с claude code, агентами, скиллами. теперь пришло время упаковать это в курс и запустить новый набор.

мы уже провели два потока: 200 выпусников, работающие проекту уже после первого воркшопа, 90% учеников без технического опыта, многие без опыта в IT. но к этому потоку я пересобираю курс с нуля, в таком мире мы сейчас живем, все слишком быстро меняется. выпускники прошлых потоков получат доступ и к этому обновлению, получается такая долгосрочная инвестиция в то, чтобы поддерживать AI-знания актуальными.

когда мы начинали, то вайбкодинг был универсальным для всех, идешь и вайбкодишь. за это время индустрия развилась, инструментов и подходов стало больше, вайбкодят уже буквально все. поэтому в этот раз я хочу сделать больше упора на персонализацию. ученики в начале обучения проходят квиз, а страница урока подстраивается под тебя, подсвечивает специфичные инсайты. тоже самое и с библиотекой эфиров, гайдов, инструкций (их уже 50, включая наши конференции) — мы подсвечиваем на что персонально тебе стоит обратить внимание. релизим это аккурат к старту курса.

с каждым днем все больше ощущения, что курс уже совсем не про вайбкодинг, а про мышление через агентов, скиллы, и новые способы делегирования. и конечно это нужно любому человеку, чья работа проходит в компьюетер.

если вам интересно, но вы не уверены до конца, то напишите мне в личку @vladkooklev, я подскажу

подробности и запись по ссылке

EDU31 декабря 2025 г.4.3K просмотров

В этом году: 1) нас стало почти 14 тысяч

2) Мы посмотрели мои 349 постов почти 2М раз, и 28 тыс раз пошерили их себе в закладки или друзьям

3) Тон моих постов сменился с «обзорных» (а ля посмотрел интервью) в «я сделал» (а ля скилл для chatgpt apps). Этим лично я доволен, это была моя задача, хотя понимаю, что обзоры тоже нужны и важны, поэтому постараюсь балансировать.

4) Интересно, что, судя по постам, я сьехал с chatGPT в Claude - тут, разумеется, всему виной Claude Code.

5) На курсах и открытых лекциях приняло участие почти 1.5 тысячи человек, чему я очень рад, так как, я очень надеюсь, это поможет вам лучше понять, что за зверь такой этот AI и как он меняет наши жизни. EDU для меня это способ размышления и обмена энергией и знаниями, и каждая такая встреча, каждый фидбек придает смысла и радости моей жизни. И я особенно рад, когда вам удается не только узнать, но и сделать что то конкретное для своей жизни или работы.

6) 120 человек поболтали с ботом и оставили фидбек: я понял, услышал, и буду отрабатывать. Больше кейсов, больше личных размышлений и «персональной реальности», больше прикладных вещей про AI, меньше рекламы курсов (сорян!)

7) Я люблю то, что мне удается делать - СПАСИБО вам за это!

И если бы я пожелал одну вещь: возьмите на праздниках и поставьте себе Claude Code, откройте его и попросите его помочь вам автоматизировать одну рутинную вещь, которую вы регулярно делаете. Не бойтесь, что не знаете программирования, попробуйте.

С наступающим, Друзья! Обнимаю!

EDU26 декабря 2025 г.4.3K просмотров

Telegram + Claude Code = ?

На днях руки дошли запилить штуку, которую уже давно хотелось: управлять Телегой через Claude Code. Не через бота, а прямо из терминала: читать, отвечать, искать и тп

Собственно, зачем? - Утренний дайджест непрочитанных сообщений с приоритезацией - Поиск по истории чатов естественным языком - Публикация постов в каналы без переключения контекста, с возможностью налету и текст задрафтить, и картинку сгенерировать, и перевести на заморский язык - Автоматизация рутины: ответы на однотипные вопросы

Как настроить Сделал для вас skill, который для общения с Телеграм юзает MCP сервер telegram-mcp (я проверил код этого mcp на предмет безопасности: все чётко, пароли никуда не улетают).

Что попробовал 1) Читать сообщения из канала и чатов 2) Поиск по чатам 3) Ответить на сообщение 4) Черновики - вот этой функции в MCP не было, поэтому на пару с дружбаном написали + законтрибьютили в telegram-mcp.

Зачем скилл, если есть MCP? Чтобы каждый раз не промптить claude code на регулярные операции, в частности сделал: - Дайджест непрочитанных - утром зашел в Claude, попросил дайджест всех непрочитанных, и уже решаешь на чем фокусироваться - Анализ стиля и написание черновиков постов

Собственно, этот пост написан с его помощью: скилл проанализировал мои последние 15 постов, выделил паттерны, и помог составить драфт. Вот выдержка из стиля по моему каналу:

### P.S. Pattern - Additional related thought - Self-deprecating humor: "Мы еще не отработали... поэтому пока не ругайтесь, что сапожник без сапог 😉"

Скажу честно, эта вот часть пока не вау, но для черновика норм, дальше уже можно крутить самому.

Важно (!): 1) Когда будете подключать этот скилл или MCP сервер, то вам надо будет сгенерировать специальную строку, это очень sensitive информация, которая будет на вашем компьютере. Ее суперважно защитить (keychain и тп) 2) AI видит все чаты, которые вы просите его прочитать. Если есть приватные переговоры и вы не хотите, чтобы это улетало на заморские сервера - или надо подключать локальные LLM или отдельный аккаунт для приватного. 3) Можно случайно отправить не туда. Поэтому в скилл я добавил, чтобы он всегда сначала писал как черновик, а я уже просматриваю и отправляю вручную. Важно: пока автор MCP репозитория не смерджит мой PR, этого не будет из коробки 4) Рейт лимиты - теоретически, Телеграм может ограничить при слишком частых запросах, но для моих личных задач я пока с этим не столкнулся.

--- Co-authored with Claude Code using telegram-assistant skill 🤖😉

EDU6 марта 2026 г.4.3K просмотров

Теория vs практика или Какие из наших задач AI уже автоматизирует?

Anthropic сегодня выпустили исследование о влиянии AI на рынок труда. Помните, я писал про их Economic Index год назад ? Тогда это был просто каталог задач, для которых юзают Claude. Теперь они пошли дальше: совместили теоретические возможности AI с реальными данными использования и замерили эффект на занятость.

Ключевая идея: новая метрика "observed exposure" - не "что AI теоретически может", а "что люди реально автоматизируют через Claude прямо сейчас". Разрыв огромный: в Computer & Math, например, теоретически AI покрывает 94% задач. Реально - 33%.

Я покопался в их датасете и нашел интересные примеры этого разрыва по релевантным профессиям + запилил вам бота, чтобы проверять это для себя любимого:

Разработка: - "Написать/обновить программу" - 93% - "Отладить робототехническую программу" - 100% - "Устранить неисправность физического оборудования" - 0%

Продажи: - "Связаться с клиентами для презентации продуктов" - 99% - "Ответить на вопросы клиентов о ценах" - 98% - "Провести переговоры по контракту" - 0% (ВСЕ задачи с negotiate - нулевое проникновение)

Аналитика/менеджмент: - "Анализ финансовых данных для разработки стратегии" - 90% - "Подготовка отчётов" - 99% - "Проведение совещаний с командой" - 0% - "Контроль персонала" - 0%

Видите паттерн? AI забирает задачи, которые можно описать текстом и выполнить за компьютером. Всё, что требует физического присутствия, переговоров лицом к лицу или управления людьми - ноль. Как раз со Стёпой про это говорили на днях.

Тут имхо в тему пост по мотивам Digitalist Papers: там авторы на данных рынка труда США за 40 лет показали, что одна и та же технология (компьютеры) - автоматизировав часть задач бухгалтеров и складских работников - привела к противоположным результатам. У бухгалтеров зарплаты выросли, у складских - упали. Разница: у бухгалтеров автоматизировали рутину (ввод данных), а у складских - экспертизу (знание что где лежит). Когда автоматизируются экспертные задачи, барьер входа падает и зарплаты снижаются. Когда рутинные - наоборот.

Anthropic по сути предоставили данные, чтобы это проверить для AI. И по их датасету мы видим: AI сейчас автоматизирует рутину, а не экспертизу. "Ответь на звонок" - 100%, "проведи переговоры" - 0%. "Напиши отчёт" - 99%, "управляй командой" - 0%. Если экстраполировать выводы Digitalist Papers, то AI пока скорее повышает ценность оставшейся экспертизы, чем обесценивает её. Но "пока" здесь ключевое слово имхо.

Что с рабочими местами? Массовых увольнений нет. Безработица среди "экспонированных" профессий не выросла. Но есть тревожный сигнал: молодых (22-25 лет) стали на 14% реже нанимать на эти позиции. Не увольняют старых, а просто не берут новых. Это перекликается со Stanford-ским исследованием, о котором я писал летом - там нашли -13% найма джунов.

Профиль "экспонированного" работника: чаще женщина, с высшим образованием, зарплата на $10/час больше. AI пока бьёт не по самым уязвимым, а по среднему классу с дипломом. 30% рабочей силы с нулевой экспозицией: повара, бармены, спасатели, посудомойщики.

Вы пока читайте статью и пробуйте бота, а я пошел учиться на бармена-повара (full stack!)

EDU22 декабря 2025 г.4.3K просмотров

Скилл для создания chatGPT аппов

Помните, я писал про свой первый ChatGPT апп? На днях OpenAI анонсировали-таки свой магазин приложений и теперь можно сабмитить свои аппы.

Чтобы помочь вам в этом я сделал Claude/Agent Skill, который: 1. Помогает оценить, подходит ли ваш продукт для ChatGPT Apps (Know/Do/Show фреймворк, описанном в этом гайде от OpenAI) 2. Генерирует MCP сервер на Node.js/TypeScript с готовыми шаблонами 3. Создает React виджеты с поддержкой тем ChatGPT 4. Настраивает OAuth 2.1 аутентификацию (включая self-hosted вариант!) 5. Готовит к деплою на Fly.io и сабмишену в стор

Скилл соответствует теперь уже открытому стандарту AgentSkills и провалидирован через skills-ref.

Использовать лучше с Claude Code или Codex, потому что он не просто помогает продумать приложение, но и закодить его. Просто попросите его

use the chatgpt-app-builder skill to evaluate if my product should become a ChatGPT App and actually build it

Enjoy!

EDU7 марта 2026 г.4.2K просмотров

Полезное в Claude Code - Scheduled Tasks

Можно назначать задачки по расписанию; пока только для Claude Code Desktop

P.S. Напомню, кстати, что в Claude for Chrome тоже есть такое

рис. AI11 января 2026 г.4.2K просмотров

завел дневник вайбкодера sereja.tech/blog

в каждый вабйкодерский сессии два актива: код и понимание. код пушим на автомате. 🪼 понимание теряем на автомате

классика: "5 часов вайбкодил, а че сделал вспомнить не могу"

теперь память хранится в статье которая генерится клод кодом через скилл в конце сессии и пушится в гх

под капотом писатель + консилиум редакторов вычитывающих аи-слоп + фактчекер через субагенты.

аи проверяет аи

а жена спрашивает чем занимаюсь. показываю блог. больше не спрашивает

Миша Наер16 апреля 2026 г.4.2K просмотров

Opus 4.7 вышел

Подросли бенчи по agentic coding и vision, остальное без особых изменений

https://www.anthropic.com/news/claude-opus-4-7

рис. AI16 апреля 2026 г.4.2K просмотров

Claude Opus 4.7 стрим четверг, 16 апреля, 20:00 мск

https://youtube.com/live/tqDBIhMjo8w?feature=share

EDU25 декабря 2025 г.4.1K просмотров

Чем AI агент отличается от софта?

Софт видит ограничение и выдает ошибку, заставляя пользователя решать ее; агент же - ищет обходной путь. Иногда это хорошо, а иногда - не очень. Прямо как инициативный сотрудник 😉

2 кейса: 1) Я как-то рассказывал про то, как Opus 4.5 нашел лазейку в регламентах авиалинии - это тест кейс, на котором "муравьи" (сотрудники Anthropic - ants) тестируют новые модели - и поменял билет, хотя формально было нельзя. Скрин рассуждений модели и как она это сделала - в аттаче

2) Сегодня на моих тестах тоже случился забавный кейс: у меня были задублированы сделки в CRM и я попросил агента удалить одну из них, но функции удаления не было, поэтому он вместо того, чтобы возразить а ля "босс, не могу, сорян", перевёл сделку в статус "Утеряно" и в комментариях написал, что это из-за дубля.

А как поступил бы ваш софт? 🤡

Миша Наер25 января 2026 г.4.1K просмотров

С осени 2025 года (и особенно в январе) начался дикий хайп вокруг Claude Code.

Не хочу показаться дедом и хейтером, просто напомню:

1. Чтобы нормально вайбкодить и не упираться в лимиты на Claude, нужно покупать подписку Max за 100 баксов в месяц 2. Если вы платите за ChatGPT Plus, то у вас там из коробки идет OpenAI Codex (аналог Claude Code) 3. По лимитам Codex на подписке Plus гораздо щедрее Claude на подписке Pro 4. По бенчмаркам gpt 5.2 и opus 4.5 выдают примерно одинаковый результат

Получается, если вы платите за ChatGPT, то получаете из коробки Codex за 0 долларов против Claude Code за 100 долларов в месяц.

Про то, как поставить себе Codex писал тут

dev.insuline.eth10 июня 2025 г.4.1K просмотров

gm degens! давно не общались

Я до сих пор не понимаю, насколько хватает 20$ подписки на Claude Code, давайте сольем все доступные токены на нормальный фронтенд для этого проекта, а то у меня начинается жжение в области таза при открытии фронтенд репозитория 🙂

---

Перепишем с нуля frontend для opensource gambling machine используя Cursor + Claude Code – https://www.twitch.tv/insulineru (без записи)

dev.insuline.eth16 марта 2026 г.4.0K просмотров

insuline – 2 agen.ts (ft claude & codex)

https://youtu.be/F5KQUr6oj4g

трек в комментариях ↓

рис. AI24 апреля 2026 г.4.0K просмотров

🔥 За апрель вышли пять основных китайских LLM моделей.

Вот они, слева направо: Kimi K2.6, DeepSeek V4, Xiaomi MiMo v2.5, GLM 5.1, Qwen 3.6.

Сегодня в 20:00 МСК на эфире разбираемся насколько эти ребята полезны в деле и насколько они могут заменить Claude и GPT

Формат стрима: → быстрая прогонка на LMArena — что модели умеют «из коробки» → карточки моделей и цены за 1M токенов → реальная задача: Telegram мини апп для подготовки к экзамену на вождение → сравнение с Claude Opus 4.7 и GPT-5.5 как эталоном

Сквозной сценарий: сбор данных → PRD → архитектура → MVP в телеграмме.

Страница эфира со всеми моделями, ценами и ссылками (обновляется во время эфира): https://live.sereja.tech/chinese-models/

Эфир 👉 https://youtube.com/live/eAek19gPfTI?feature=share

Ночной Писаревский1 октября 2025 г.4.0K просмотров

Интересно, что большинство до сих пор считает, что вайбкодинг — это максимум про то, чтобы собрать MVP.

На самом деле я знаю кучу команд которые уже сейчас вайбкодят приложения в прод. Да, пока еще это чаще всего не слишком сложные продукты, но мы ведь только в начале пути!

Лендос завайбкодить, например, — это уже точно решенный вопрос, а ведь всего год назад это было не так.

Claude выпустил Sonnet 4.5, и в релизе написано в основном про код. Anthropic явно выбрал нишу, где они хотят быть лидерами, и все ресурсы направляет туда.

Я думаю, что через 5 лет писать код руками будет примерно как писать ручкой на бумаге: навык важный и полезный, в школе учить будут, но скорее для развития мозга, а не для применения в жизни

Это не значит, что разработчики будут не нужны. Скорее их станет в 10 раз больше, чем сейчас, просто они будут писать код с помощью промптов и агентов

Ночной Писаревский14 ноября 2025 г.3.9K просмотров

Многих триггерит, что я пишу про себя в анонсе:

«завайбкодил приложение, которое приносит больше $100к выручки»

Да ребят, понятно, что дело не в аппке, а в маркетинге. Просто Кирилл бог трафика и льёт в плюс (условно, чуть меньше чем на эти $100к), и это позволяет нам получать платящих пользователей, и по дороге делать для них продукт. Без маркетинга ничего бы не получилось, никакой вайбкодинг бы не помог.

Но магия в том, что таким людям как я, которые не умеют программировать, раньше это просто было недоступно!

Порог входа в то, чтобы сделать свой апп, был кратно выше. Надо было собирать команду, платить разработчикам кучу денег, долго ждать — и в итоге вообще не факт, что что-то получалось. А теперь я сам без навыков программирования сделал не только саму аппку, но и прикрутил платежки, собрал данные в BugQuery из разных систем, свел всё в дашбордах в BI, накрутил поверх кучу скриптов и алгоритмов, делаю ленды, и много всего еще.

И все это благодаря вайбкодингу. Расскажи мне кто-то об этом еще год назад — я бы просто рассмеялся в лицо.

Мы сейчас командой из неполных 4 человек делаем то, на что раньше нужно было минимум 25.

Мир очень сильно изменился, и если вы еще этого не поняли — еще не поздно запрыгнуть в этот вагон и вайбкодить с нами 🙂

PS. Скоро-скоро запустим новый поток курса, да!

vlad kooklev — ai & startups24 ноября 2023 г.3.9K просмотров

🤔 Я больше не доверяю GPT. Куда переезжать?

За последние дни многие люди вокруг задумались, что необходима альтернатива для GPT. Десятки тысяч бизнесов смотрели, как сотрудники уходят из OpenAI и были готовы ко всему. Я провел начало недели за рисерчем доступных решений и решил упаковать результат в пост. Существует два вида решений: 1) сервисы с API над языковыми моделями; 2) поднятие моделей у себя. Сегодня расскажу про первую категорию.

Claude: самая близкая к GPT-4 модель по бенчмаркам, недавно увеличили контекстное окно до 200 тысяч токенов (не совсем эффективных), и добавили function calling как в GPT. В первую очередь я бы начал эксперименты с нее. Из минусов: немного отличается API, промптинг, и также модель напрямую доступна не во всех регионах (зато доступна через Amazon).

Perplexity: в мае я рассказывал про их продукт, как замену Гугла. С тех пор они также запустили API для доступа к их собственной языковой модели, а также Llama2 и Mistral . В анонсе высочайшую скорость инференса среди конкурентов. API работает в формате OpenAI — это значит что переключаться легко. Мне нравится темп их команды и обязательно буду за ними следить. В комментариях поделюсь способом получить бесплатный доступ к Perplexity PRO на 2 месяца — он как раз дает доступ к API и оно пока бесплатное.

Decart: вариант для тех, кто любит потестить сырые стартапы. Они также предлагают API для доступа к моделям — от $0.1 за миллион токенов Llama2 7B. Это самая дешевая цена за инференс, которую я нашел во время рисерча и скорость ответа также порадовала, так что решил про них тоже рассказать. От стартапа есть ощущение, что он в любой момент отвалится, но зато быстро отвечают в твиттере.

Также потестил: Replicate — медленно и по ощущениям, и по бенчамаркам; Anyscale — сложный онбординг, непрозрачная ценовая модель; LiteLLM — библиотека, чтобы приводить разные форматы API к формату OpenAI, чтобы делать бесшовное переключение, показалось удобной.

😲️️️️️️ Когда я начинал рисерч, то не ожидал, что уже есть столько удобных решений на рынке, чтобы эксперементировать с ними. Конечно, они все уступают GPT по качеству, но это не значит, что с ними не нужно учиться работать уже сейчас. Последняя неделя очень ярко показала, как опасен платформенный риски. Нам нужна диверсификация.