Gemini CLIを使ってみた。導入とVSCodeでの実行まで

最近話題になっているGemini CLI、忙しくて「いつか調べなきゃ」と思っている間に世間の知見が溜まってきているようなので、それを参考にとりあえず始めてみることにしました。

「Gemini CLI がわからない」
「とりあえずはじめてみたい」

という方向けの記事です。ITが得意でない方でも読めるよう書いているつもりです。

VSCodeについては分かる方、気になる方だけ読んでください。「VSCodeとは?」みたいなところには触れません。

目次

Gemini CLIとは

まずGemini CLIについて簡単に書いておきます。

私がどういう認識でGemini CLIについて語っているかを理解していただけると嬉しいです。

CLI(Command Line Interface)とは

Gemini CLIはCLIで動作するGeminiです。これだけでは説明になっていませんね。

CLIはざっくり言うとCommand Line Interfaceの略で、コマンドライン(ターミナル)上で動作させることで、つまりGemini CLIはGeminiをターミナル上で実行するアプリということです。

Gemini CLIはGUIのGeminiとどう違う?

CLIに対して、これまで私たちがブラウザやスマホアプリなどで使っていたGeminiはGUI(Graphical User Interface)上で動作していると言えます。

なので基本的にGeminiはGeminiであり、本体はさほど大きな違いはありません(と私は思っています)。

「じゃあCLIである必要なくない?」
「画面上で操作するほうが楽じゃない?」

となると思いますが、CLIであることにもメリットがあります。例をいくつかあげると以下になります。

  • テキストエディタなどの他アプリに組み込んでGeminiのサポートが受けられる
  • ローカル(PC内部)のファイルに対してGeminiが直接処理できる
  • 自動処理にGeminiを組み込みやすい

エンジニアやライターの方であれば何かしらのエディタを入れているでしょう。この後言及するVSCodeはエンジニアなら誰しも触れたことのあるエディタであるかと思います。

これらでコードやブログ記事、ドキュメントを作成する際に、わざわざブラウザにテキストをコピーして貼り付けてといった手間をかけずに同一画面内で実行できれば、とても便利だと思いませんか?

そういった点にGemini CLIの強みがあります。

Gemini CLIの注意点

Gemini CLIはとても便利ですが、注意しておく点があります。

  1. 無料枠は学習に利用される
  2. ローカルの操作ができる→破壊的な処理をされるリスクがある

Gemini CLIはGoogleアカウントがあれば無料で使い始められますが、無料枠での利用はAIの学習に利用されます。

そのため、機密情報や個人情報などは入力したり読み込ませたりしないよう意識してください。

社内で利用する場合は情報漏洩リスクがあることを考慮して、エンタープライズ版などのプランで契約して学習に利用させないことが必須となるでしょう。

また、ローカルの操作ができることは破壊的な処理をされるリスクがあるということです。

基本的にPC環境に致命的なダメージを与えるような事はしないようになっているでしょうし、実行前に許可を求めてくるのでまずありえないことですが、それ自体が可能になりうるということは頭に入れておきましょう。

Gemini CLIを導入する

ではGemini CLIを導入してみましょう。

前提:Node.jsの18以上が必要

まず、PCにNode.jsのバージョン18以上が必要になります。

ターミナル上でnode -vを実行して、現在のnodeバージョンを確認してください。

nodeコマンド自体が実行できない場合はNode.jsのインストール、バージョンが古い場合はバージョンを上げてください。今回はGemini CLIについてが主軸なので手順は割愛します。

Gemini CLIのインストール

ではGemini CLIをインストールしましょう。

インストールのコマンドは以下のとおりです。

npm install -g @google/gemini-cli

これでインストール完了です。

なお、インストールなしでとりあえず使ってみることも可能です。

npx https://github.com/google-gemini/gemini-cli

「実際に使うつもりはないけどお試しだけ…」という方はこれでいいかもしれませんね。

Geminiの初回実行・設定

ついに実行です。以下のコマンドを実行して、Gemini CLIを立ち上げてみましょう。

gemini
Gemini CLI初回実行画面
Gemini CLI初回起動時画面

このような画面が表示されます。最近のAIのCLI起動画面良いですよね。

内容を見てみると、Select Themeと書いてあります。まずはテーマ(配色)を決めるらしい。

上下キーでテーマを選んでエンターで決定します。これは好みでOKです。

ログイン方法の選択

続いて認証(ログイン)方法の選択です。

選択肢は以下になります。

  • Login with Google: Googleアカウントでログイン。無料で利用できる。
    • ブラウザでログインする形
  • Use Gemini API Key: GeminiのAPIキーを使う。スクリプトに組み込みたい場合などで使用する。APIキーの発行が必要
  • Vertex AI: GCP環境に紐づけたい場合。プロダクト向けっぽい。

よくわからない人はとりあえずLogin with Googleになると思います。

今回はLogin with Googleを選択します。

Enterキーで決定するとブラウザが開かれ、Google認証とAI利用の同意画面が表示されます。
それぞれチェックを通しましょう。

認証完了画面。Geminiが始められる。
ログイン完了。Gemini CLIが使い始められます

これで完了です!Geminiの利用が開始できます。

なお、無料枠での利用に関しては2025年7月現在、1分あたり60リクエスト1日あたり1,000リクエストという制限下で利用可能です。

Gemini CLIを使ってみる

では、使ってみましょう。

入力ボックスが出ているので、任意の指示を出してみます。今回は以下の質問をしてみました。

Gemini cliって何ができるの?

(ちゃんと使いこなしたい方はこんな雑なプロンプト入力しないでね!)

Enter prompt to gemini cli.
Gemini CLIに指示をだしてみた

ちゃんと回答を得られていますね。

このような依頼にも応えてくれます。

Documentディレクトリのファイル一覧を表示して。

ローカル(PC内部)ファイルの情報も取得できている

私のDocumentディレクトリ(フォルダ)の中身をお見せするのは恥ずかしいので隠してますが、ファイル一覧がきちんと表示されています。これはCLIならではの指示ですね。

VSCode上で動かしてみる

VSCode(Visual Studio Code)内で使ってみます。前述のとおり「VSCodeとは?」には触れません。

ここでは任意のプロジェクトを開いて、そこでGemini CLIを実行してみます。

対話モード

対話モードはここまで説明してきた実行の仕方です。VSCodeでも同様に試してみます。

VSCodeを立ち上げてターミナルを開いて普通にgeminiを実行すれば動きました(これまで使っていたターミナルとVSCodeのターミナルが異なる場合は別途設定が必要かもしれません)。

gemini

以下のように@でファイルを指定して、その中身を読ませることも可能です。

ファイルの全文をコピーして質問するよりはるかに楽ですね。

ソースコードや文章の修正を依頼すると、実際に変更してくれます。Diffの確認も可能。

最後に終了するときはCtrl + Dを二回押せば抜け出せます。

非対話(コマンドライン)モード

毎回立ち上げてわかりづらい画面表示は面倒な場合はgeminiコマンドにプロンプトを入れて実行します。

hoge% gemini --prompt "@models.py このファイルの役割は何?"

(node:20801) [DEP0040] DeprecationWarning: The `punycode` module is deprecated. Please use a userland alternative instead.
(Use `node --trace-deprecation ...` to show where the warning was created)
Loaded cached credentials.
この `models.py` ファイルは、アプリケーションのデータベース構造を定義する役割を担っています。

具体的には、`Flask-SQLAlchemy` を使って `Memo` という名前のデータベースモデルを定義しています。このモデルは、データベース内の `memos` テーブルに相当し、以下の3つのカラム(属性)を持っています。

*   `id`: メモの一意なID(整数、主キー)
*   `title`: メモのタイトル(文字列、50文字まで、必須)
*   `content`: メモの内容(テキスト)

このモデルを通じて、アプリケーションはデータベースと連携し、メモの作成、読み取り、更新、削除(CRUD操作)を行います。

対話モード同様に動いていそうです。対話ではないので連続したやりとりはできませんが、手軽に使えますね。

自動処理についてもこの方法で実行する形になると思います。

一点ネックなのは対話モードより遅い気がする点。なんでだろう。

使い始めるのは意外と簡単

意外と簡単に使い始められました。

ターミナル自体に慣れていない人には難しいかもしれませんが、これぐらいなら一回慣れてしまえば案外誰でも使いこなせるのではないでしょうか。

音声指示を変換してGemini CLIに指示出してPC作業を自動化とかできたら楽しそうですよね。CLIは色々と夢が膨らみそうです。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

Author

都内Edtech企業のコーポレートエンジニア。
業務改善・自動化についての開発をしています。
エンジニア歴13年、コーポレートエンジニア歴6年ぐらい。

目次