Что это за ящик с инструментами на случай конца света?
Идея проста до гениальности: собрать в одно приложение для Android всё, что может понадобиться энтузиасту локального искусственного интеллекта. Бенчмаркинг моделей? Есть. Создание датасетов для тонкой настройки? Пожалуйста. Управление Ollama и работа с агентами? Берите. AI Doomsday Toolbox не пытается быть самым красивым приложением — оно пытается быть самым полезным в ситуациях, когда нужно быстро что-то проверить, протестировать или собрать без лишних танцев с бубном вокруг Termux.
На момент марта 2026 года проект активно развивается. Если в 2024-2025 он фокусировался на распределенном inference между телефонами, то сейчас превратился в универсальную рабочую станцию для мобильных AI-экспериментов.
Чем он занимается, кроме предсказания апокалипсиса?
Запускаете Llama 3.2 или новую Qwen2.5 на своем Snapdragon 8 Gen 4 и хотите понять, насколько это медленно? Toolbox умеет прогонять стандартные бенчмарки (MMLU, HellaSwag) прямо на устройстве, показывая не только сырые scores, но и реальное время ответа, потребление памяти и нагрев процессора. Цифры иногда пугают, но это честные цифры.
1 Бенчмаркинг без пафоса
Интерфейс выглядит так, будто его делал инженер, а не дизайнер (что, впрочем, правда). Выбираете модель из поддерживаемых форматов — GGUF, SafeTensors, через интеграцию с Ollama. Запускаете тест. Видите, как телефон превращается в грелку, а на экране появляются цифры. В 2026 году это особенно актуально с учетом новых квантованных форматов, которые обещают работу 7B-модель на среднем смартфоне без экстрима.
2 Создание датасетов на лету
Хотите сделать тонкую настройку модели под свои нужды, но нет датасета? Toolbox умеет генерировать данные в формате Alpaca (инструкция-вход-выход) из ваших текстовых файлов, заметок или даже субтитров. Интеграция с Whisper (последняя стабильная версия на 2026 год) позволяет транскрибировать аудио и сразу превращать диалоги в обучающие примеры. Это не замена профессиональным инструментам вроде Axolotl, но для быстрых экспериментов — то что надо.
3 Интеграция с Termux и Ollama
Это самая мощная часть. Вместо того чтобы вручную ковыряться в Termux, устанавливать Python-пакеты и настраивать окружение, Toolbox предоставляет готовые скрипты и интерфейс для управления локальным Ollama-сервером. Скачали модель через интерфейс — она появляется в Ollama. Запустили агента — он работает в фоне через Termux:Bot. В теории звучит гладко, на практике иногда приходится поправлять конфиги руками (особенно если у вас не root-доступ).
А что с конкурентами? Есть ли они вообще?
Прямых аналогов с таким набором функций для Android я не встречал. Но есть инструменты, которые делают часть работы лучше:
| Инструмент | Для чего | Чем отличается от Toolbox |
|---|---|---|
| KernelAI | Запуск моделей на iPhone | Более полированный интерфейс, но только для iOS. Нет бенчмаркинга и создания датасетов. |
| EdgeDox + MNN | Офлайн-RAG на Android | Специализируется на поиске по документам. Менее универсален, но лучше делает свою одну задачу. |
| Termux с ручной настройкой | Любые AI-эксперименты | Дает полный контроль, но требует времени и знаний. Toolbox упрощает 80% рутины. |
Главное преимущество AI Doomsday Toolbox — в его подходе «всё в одном». Не нужно переключаться между пятью приложениями, когда делаешь типичный пайплайн: скачать модель → протестировать скорость → собрать датасет из своих данных → запустить тонкую настройку где-нибудь в облаке. Первые три шага делаются здесь.
Для кого этот инструмент, а кому лучше пройти мимо?
Он создавался не для всех. Если вы:
- Любите поковыряться в настройках локальных LLM, но не хотите каждый раз возиться с консолью
- Тестируете производительность разных квантованных версий моделей на своем железе (Snapdragon, MediaTek, Tensor)
- Собираете небольшие датасеты из личных данных для экспериментов с fine-tuning
- Хотите иметь мобильную «лабораторию» для быстрых AI-проверок без доступа к десктопу
...то это ваш выбор. Интерфейс местами сыроват, документация на любителя, но функционал работает.
Не стоит ожидать, что Toolbox заменит полноценную рабочую станцию с видеокартой. Запуск 13B-модели на смартфоне даже в 2026 году — это медленно (если только у вас не флагман с 24 ГБ RAM). Но для 7B-8B моделей, которые стали значительно умнее за последние два года, уже комфортно.
Важный момент на март 2026: многие новые модели (например, Llama 3.2 с её 405B параметрами в квантованном виде) требуют специфических оптимизаций под мобильные NPU. Toolbox поддерживает основные бэкенды — llama.cpp, MLX для Android через эмуляцию, но всегда проверяйте совместимость конкретно с вашим чипсетом.
Как это выглядит в реальной жизни?
Представьте ситуацию: вы читаете статью про новую модель DeepSeek-V3, выложенную в открытый доступ. Хотите проверить, как она будет работать на вашем телефоне.
- Через встроенный менеджер моделей качаете GGUF-файл q4_k_m версии (8.5 ГБ, ждете 20 минут на хорошем Wi-Fi).
- Запускаете бенчмарк MMLU — Toolbox грузит модель, прогоняет тестовые вопросы, выдает score 68.4 и среднее время ответа 4.2 секунды.
- Параллельно собираете датасет из ваших заметок в Obsidian: Toolbox конвертирует markdown-файлы в 500 примеров формат ChatML.
- Эти данные можно выгрузить для тонкой настройки где-то в Google Colab или на своем сервере.
Вся эта цепочка делается в одном приложении, без переключения контекста. Это экономит время и нервы.
Что не так с этим идеальным миром?
Без недостатков не обошлось. Во-первых, проект открытый, но не коммерческий — обновления выходят, когда у разработчиков есть время. Во-вторых, некоторые функции требуют root или сложных манипуляций с ADB (особенно для фоновой работы агентов). В-третьих, интерфейс иногда говорит с вами языком ошибок Python, а не человеческим языком.
И главное: инструмент мощный, но не волшебный. Он не заставит ваш среднебюджетный смартфон 2023 года запускать 70B-модели с приемлемой скоростью. Аппаратные ограничения остаются ограничениями, даже с лучшими квантованиями мира.
Тем не менее, для своего нишевого использования — мобильная AI-лаборатория в кармане — AI Doomsday Toolbox в 2026 году не имеет прямых конкурентов. Он делает скучные технические задачи проще, а это именно то, что нужно энтузиастам.