Инструменты
Подборка AI-инструментов. Только то, что работает.
OpenAI-совместимое API для Amazon SageMaker: инструкция по интеграции без SigV4
Пошаговая инструкция по настройке SageMaker endpoint для приема запросов в формате OpenAI API. Избавьтесь от SigV4 подписи, используйте bearer token. Примеры дл
Новые возможности SageMaker Feature Store: Iceberg, streaming и Lake Formation для ML-пайплайнов
Обзор новых возможностей Amazon SageMaker Feature Store: Apache Iceberg, стриминг фич и интеграция с Lake Formation. Как это меняет ML-пайплайны.
Новые встроенные инструменты llama.cpp server: exec_shell, edit_file и другие — полный обзор
Полный обзор новых агентных функций llama.cpp: exec_shell, edit_file. Как они меняют локальный AI. Примеры, риски, альтернативы.
Мета-трансформеры: архитектура внимания, которая переворачивает игру с ног на голову
Разбор Meta-Transformers — альтернативы классическому Transformer с нелинейным механизмом внимания. Где скачать веса, как тестировать и кому это нужно.
CodeGraph: граф кода для Claude Code вместо grep — обзор архитектуры, бенчмарков и сравнение с SocratiCode
Разбор open-source MCP-сервера CodeGraph: tree-sitter + SQLite, бенчмарки 92% точности, сравнение с SocratiCode и архитектурные особенности.
Как исправить теги thinking в Gemma 4 31B с помощью Jinja-шаблона для llama.cpp
Пошаговый гайд: исправляем баг с незакрытыми тегами рассуждений в Gemma 4 31B. Используем кастомный Jinja-шаблон из репозитория на HuggingFace. Работает в llama
Как добавить диаризацию и временные метки в Cohere Transcribe: дообучение модели для улучшенного распознавания речи
Пошаговое руководство по дообучению Cohere Transcribe для поддержки диаризации и временных меток. Сравнение с Whisper, примеры кода и ссылка на готовую модель н
Zero от Vercel: agent-first язык — новый стандарт или маркетинг?
Разбираем Zero от Vercel: синтаксис, бенчмарки, сравнение с Mojo и CodeSpeak. Agent-first подход — прорыв или очередной хайп Vercel? Анализ критики и перспектив
Как обучить детектор промпт-инъекций с ml-intern и DeepSeek v4 Flash для работы в браузере
Пошаговый гайд: тренируем детектор атак на LLM с ml-intern и DeepSeek v4 Flash, экспортируем в ONNX и запускаем в браузере. Безопасность AI-агентов.
Специализация vs масштаб: как модель 3B параметров обходит гигантов на 50x дешевле — разбор DharmaOCR
Разбираем, как специализированная OCR-модель DharmaOCR с 3B параметрами обходит гигантов в 50 раз дешевле. Сравнение с Qianfan-OCR, GLM-OCR, примеры использован
ztok: мультипоточный токенизатор на Zig, который рвет tiktoken как тузик грелку
Обзор ztok — токенизатора на Zig с поддержкой tiktoken, HF и SentencePiece. Ускорение в 2-5 раз, мультипоточность, примеры. Кому нужен и как использовать.
Локальный запуск LLM: как стать «quasi-local summoner» — пошаговое руководство сообщества LocalLLaMA
Полное руководство по запуску больших языковых моделей на арендованных GPU с полным локальным контролем. Команды, конфиги, сравнение с альтернативами.