Gemini 3.1 Flash Lite CLI: установка и интеграция с Gmail, Drive, Docs | AiManual
AiManual Logo Ai / Manual.
21 Июн 2026 Гайд

Gemini 3.1 Flash Lite: CLI для интеграции с Gmail, Drive и Docs — установка и первые примеры

Пошаговый гайд по установке Gemini 3.1 Flash Lite CLI, настройке OAuth для Gmail, Drive и Docs, и первые рабочие примеры автоматизации с критическими нюансами.

Реклама
cliv2

Ты когда-нибудь мечтал управлять Gmail, Drive и Docs через одну консольную команду? Чтобы не открывать браузер, не тыкать по кнопкам, а просто написать gemini --gmail "прочитай последние 5 писем и перешли summary в Telegram"? Мечта перестала быть фантастикой. Google выпустил официальный CLI для модели Gemini 3.1 Flash Lite, и он умеет напрямую дёргать API Google Workspace. Никаких промежуточных скриптов. Никаких костылей с нативными запросами. Просто терминал и нейросеть.

Да, модель Gemini 3.1 Flash Lite — это облегчённая версия того самого Flash, который мы тестировали в статье про Gemini 3 Flash. Но теперь она не просто генератор текста. Она стала агентом, который живёт в твоей консоли и имеет доступ к твоим сервисам Google. Звучит как суперсила? Спойлер: это действительно так, но с подводными камнями.

Почему именно CLI, а не очередной плагин?

Потому что DevOps не терпит лишних движений. Веб-интерфейс Gemini — это круто для разовых запросов. Но когда нужно встроить ИИ в пайплайн CI/CD, в cron-задачи или в скрипты мониторинга — GUI сосёт. Ты не сможешь засунуть URL в bash-скрипт так же элегантно, как вызов бинарника. А CLI — это pipe, это stdout/stderr, это интеграция с Slack, Telegram, Prometheus — чем угодно.

Тем более Gemini 3.1 Flash Lite специально заточена под агентные сценарии. Мы уже обсуждали агентные workflow в статье Агентные workflow и vibe coding. Там Flash показывал себя отлично, но для запуска в production нужен был SDK. Теперь SDK не нужен — всё в одной команде.

Как это работает: архитектура одним абзацем

CLI — это на самом деле Go-бинарник (да, Go, не Python), который внутри использует Gemini 3.1 Flash Lite как мозг, а для доступа к Workspace — OAuth 2.0 с набором scope. Ты авторизуешься один раз, токен хранится локально в зашифрованном keychain. Каждый запрос CLI превращается в мульти-тур: модель парсит твой естественный язык, решает, какой API вызвать (Gmail / Drive / Docs / Calendar и т.д.), формирует корректный REST-запрос, выполняет его, обрабатывает ответ и возвращает результат тебе. Всё это — за одно выполнение команды. Никаких цепочек из пяти вызовов.

Важно: CLI работает в режиме offline-first? Нет. Каждый запрос требует интернета, так как модель выполняется на серверах Google. Но сам бинарник весит ~25 MB и не тащит зависимости — можно развернуть в Docker-образе или на голом сервере.

Установка. Без боли (почти)

На момент июня 2026 года официальный CLI распространяется через npm и gcloud CLI. Выбирай любой способ.

1 Способ первый: npm (рекомендую)

npm install -g @google/gemini-cli

После установки проверяем:

gemini --version
# > Gemini CLI 3.1.0 (gemini-3.1-flash-lite)

2 Способ второй: через gcloud

gcloud components install gemini-cli

Этот вариант ставит CLI вместе с остальными утилитами Google Cloud. Удобно, если уже используешь gcloud.

Авторизация. Самый нудный, но критичный шаг

Чтобы CLI мог читать твои письма и файлы, ему нужно разрешение. Google в 2026 году закрутил гайки: просто так дать доступ ко всему аккаунту нельзя. Нужен OAuth-клиент с конкретными scope. Идём в Google Cloud Console, создаём проект (или используем существующий), включаем API: Gmail API, Google Drive API, Google Docs API. Затем создаём OAuth 2.0 Client ID типа Desktop application. Скачиваем JSON-файл с credentials.

gemini auth login --credentials /path/to/client_secret.json

Команда откроет браузер (или выведет ссылку, если работаешь headless). Даёшь согласие на запрашиваемые scope — и готово. Токен сохраняется в ~/.config/gemini/tokens.json.

Засада: scope, который запрашивает CLI по умолчанию — это https://www.googleapis.com/auth/gmail.readonly, https://www.googleapis.com/auth/drive.readonly и https://www.googleapis.com/auth/documents. Если захочешь отправлять письма или удалять файлы — придётся расширять scope через флаг --scopes. И учти: Google может отклонить приложение, если scope выглядит избыточным. Лучше начинать с read-only.

Первые команды: магия начинается

Теперь самое вкусное. Забудь про REST-вызовы. Просто говори по-человечески.

Пример 1. Прочитать последние 3 непрочитанных письма и вывести отправителя и тему

gemini --gmail "покажи последние 3 непрочитанных письма, только отправитель и тему"

Вывод:

1. От: alice@example.com | Тема: Квартальный отчёт
2. От: bob@corp.com | Тема: Встреча в пятницу
3. От: no-reply@google.com | Тема: Новые условия использования

CLI сам вызвал Gmail API, отфильтровал флаг UNREAD, вытащил нужные поля. Без единого curl.

Пример 2. Найти последний файл с именем "Отчёт" в Drive и показать его размер и владельца

gemini --drive "найди последний файл с названием Отчёт, покажи размер и владельца"

Под капотом CLI ищет файлы с именем, содержащим "Отчёт", сортирует по дате, получает метаданные. Результат:

Файл: Отчёт_2026_Q2.docx
Размер: 2.3 MB
Владелец: you@gmail.com

Заметь: CLI сам догадался, что нужно сортировать по убыванию даты. Если хочешь точнее — уточни запрос.

Пример 3. Создать новый Google Doc на основе шаблона письма

gemini --docs --gmail "возьми письмо от alice по теме 'квартальный отчёт' и создай новый документ с тем же содержанием, добавь заголовок 'Копия отчёта'"

Тут CLI совершает два действия: сначала находит письмо, извлекает тело (с поддержкой HTML), потом создаёт новый Google Doc и вставляет туда контент. Мощь. В ответ ты получишь ссылку на новый документ:

Создан документ: https://docs.google.com/document/d/abc123/edit

Как не наступать на грабли: ошибки новичков

Первый и самый частый косяк — неверно указанные scope. Ты дал read-only доступ, а просишь CLI удалить письмо. Получишь 403 Forbidden. Решение: перелогинься с расширенными scope:

gemini auth login --scopes gmail.modify drive.file docs

Второй — язык модели. CLI по умолчанию считает, что ты говоришь на языке системы. Многие пишут запросы на русском, а модель ожидает английские названия сервисов. Указывай язык явно:

gemini --lang ru --gmail "последние письма"

Третий — таймауты. Если у тебя 50 000 файлов в Drive, запрос "найди файлы за последний год" может выполняться >30 секунд. CLI по умолчанию таймаут — 60 секунд. Можно увеличить:

gemini --timeout 120 --drive "покажи 10 самых больших файлов"
💡
Совет: ставь флаг --dry-run, чтобы увидеть, какие API-вызовы сделает CLI, не выполняя их реально. Отладка мультишаговых запросов — сказка.

Интеграция в пайплайны и DevOps-среда

Теперь самое интересное для нас, девопсов. CLI возвращает данные в JSON (если добавить --output json). Можно парсить jq и передавать дальше. Например, собрать все письма с определённым словом и положить в лог:

gemini --gmail "найди письма от noreply@alerts.com за последнюю неделю" --output json | jq '.[].id' > alert_ids.txt

Для CI/CD — отдельная фича: CLI умеет читать переменные окружения для авторизации. Не нужно таскать токены в репе. GEMINI_CLIENT_ID и GEMINI_CLIENT_SECRET — и порядок.

Кстати, если тебе кажется, что платить за каждый вызов модели дороговато для простых операций, взгляни на альтернативный подход с Cactus Hybrid Router. Там та же задача решается через локальную Gemma4-2B для простых команд, а Gemini подключается только для сложных. Но если тебе нужна нативная интеграция с Workspace без танцев с бубном — официальный CLI остаётся королём.

Проклятие rate limits и квоты

Не думай, что Google дал безлимит. У Gmail API — 1 000 000 запросов в день на проект. У Drive — чуть меньше. CLI агрегирует несколько действий в один запрос? Нет, каждый action — отдельный HTTP-вызов. Если твой скрипт обрабатывает 10 000 писем, ты упрёшься в лимит за час. Решение: кэшировать результаты предыдущих запросов через флаг --cache-dir. CLI будет сохранять ответы моделей и API в локальный кэш на 5 минут. Второе: используй пагинацию. Запрос "покажи 100 писем" выполнится как один вызов API (с nextPageToken), а не 100.

Что дальше: куда копать

CLI поддерживает не только три сервиса. Calendar, Sheets, Tasks — тоже работают. Полный список — gemini --help. И главное: планировщик на базе cron. Можно написать:

gemini schedule --every 1h --gmail "проверь, есть ли письма с вложением PDF, и скачай их в папку ~/incoming"

И CLI сам установит cronjob, который будет запускаться каждый час. Это уже не просто CLI — это фреймворк для автоматизации рабочего пространства.

Ещё один лайфхак: если тебе нужно быстро протестировать идею, не разворачивая полноценный проект, используй CLI как REPL. Запусти gemini shell — попадёшь в интерактивную сессию, где можно последовательно давать команды, а контекст (последний результат) сохраняется. Удобно для прототипирования.

Мы уже рассказывали в 40 лайфхаках Google, как выжимать максимум из модели. С CLI эти лайфхаки становятся executable. Например, промпт с CO-STAR структурой — теперь это не просто текст, а команда, которая реально сделает работу.

И последнее: не забывай про безопасность. Токены доступа — это ключи от твоего цифрового дома. Если используешь CLI на CI-сервере, не храни client_secret в репозитории. Вынеси в secrets. Google в 2026 году добавил поддержку Workload Identity Federation для CLI — можно авторизоваться через сервисный аккаунт без создания OAuth-клиента. Документация — best practices.

В общем, Gemini 3.1 Flash Lite CLI — это не игрушка. Это реальный инструмент, который может заменить кучу скриптов и Ad-hoc решений. Ставь, пробуй, и если наступишь на грабли — ты теперь знаешь, где они лежат.

Подписаться на канал