Инструменты для работы с AI

O

OpenAI-совместимое API для Amazon SageMaker: инструкция по интеграции без SigV4

Пошаговая инструкция по настройке SageMaker endpoint для приема запросов в формате OpenAI API. Избавьтесь от SigV4 подписи, используйте bearer token. Примеры дл

Обзор

Н

Новые возможности SageMaker Feature Store: Iceberg, streaming и Lake Formation для ML-пайплайнов

Обзор новых возможностей Amazon SageMaker Feature Store: Apache Iceberg, стриминг фич и интеграция с Lake Formation. Как это меняет ML-пайплайны.

Обзор

Н

Новые встроенные инструменты llama.cpp server: exec_shell, edit_file и другие — полный обзор

Полный обзор новых агентных функций llama.cpp: exec_shell, edit_file. Как они меняют локальный AI. Примеры, риски, альтернативы.

Обзор

М

Мета-трансформеры: архитектура внимания, которая переворачивает игру с ног на голову

Разбор Meta-Transformers — альтернативы классическому Transformer с нелинейным механизмом внимания. Где скачать веса, как тестировать и кому это нужно.

Обзор

C

CodeGraph: граф кода для Claude Code вместо grep — обзор архитектуры, бенчмарков и сравнение с SocratiCode

Разбор open-source MCP-сервера CodeGraph: tree-sitter + SQLite, бенчмарки 92% точности, сравнение с SocratiCode и архитектурные особенности.

Обзор

К

Как исправить теги thinking в Gemma 4 31B с помощью Jinja-шаблона для llama.cpp

Пошаговый гайд: исправляем баг с незакрытыми тегами рассуждений в Gemma 4 31B. Используем кастомный Jinja-шаблон из репозитория на HuggingFace. Работает в llama

Обзор

К

Как добавить диаризацию и временные метки в Cohere Transcribe: дообучение модели для улучшенного распознавания речи

Пошаговое руководство по дообучению Cohere Transcribe для поддержки диаризации и временных меток. Сравнение с Whisper, примеры кода и ссылка на готовую модель н

Обзор

Z

Zero от Vercel: agent-first язык — новый стандарт или маркетинг?

Разбираем Zero от Vercel: синтаксис, бенчмарки, сравнение с Mojo и CodeSpeak. Agent-first подход — прорыв или очередной хайп Vercel? Анализ критики и перспектив

Обзор

К

Как обучить детектор промпт-инъекций с ml-intern и DeepSeek v4 Flash для работы в браузере

Пошаговый гайд: тренируем детектор атак на LLM с ml-intern и DeepSeek v4 Flash, экспортируем в ONNX и запускаем в браузере. Безопасность AI-агентов.

Обзор

С

Специализация vs масштаб: как модель 3B параметров обходит гигантов на 50x дешевле — разбор DharmaOCR

Разбираем, как специализированная OCR-модель DharmaOCR с 3B параметрами обходит гигантов в 50 раз дешевле. Сравнение с Qianfan-OCR, GLM-OCR, примеры использован

Обзор

z

ztok: мультипоточный токенизатор на Zig, который рвет tiktoken как тузик грелку

Обзор ztok — токенизатора на Zig с поддержкой tiktoken, HF и SentencePiece. Ускорение в 2-5 раз, мультипоточность, примеры. Кому нужен и как использовать.

Обзор

Л

Локальный запуск LLM: как стать «quasi-local summoner» — пошаговое руководство сообщества LocalLLaMA

Полное руководство по запуску больших языковых моделей на арендованных GPU с полным локальным контролем. Команды, конфиги, сравнение с альтернативами.

Обзор