NodeJSでGeminiの実装

この記事は約4分で読めます。
スポンサーリンク

やりたいこと

Googleの生成AIであるGeminiをNodeJSで使用します。

スポンサーリンク

実装

API key の作成

以下のページにアクセスしてAPI keyを取得します

Sign in - Google Accounts

プロジェクトの作成

ここでは以下の記事を用いてNodeJS+Viteのプロジェクトを作成しました。

続いて以下のコマンドを実行し、generative-aiをインストールします。

npm install @google/generative-ai

HTMLの作成

Srcフォルダにindex.htmlを作成します。

内容は以下のようにしました。

<!DOCTYPE html>
<html>
 <head>
  <meta charset="UTF-8">
  <title>Gemini</title>
 </head>
 <body>
    <script type="module" src="main.js"></script>
 </body>
</html>

JavaScriptの作成

Srcフォルダにindex.htmlで読み込んでいるmain.jsを作成します。

内容は以下のようにしました。Your API keyの箇所は取得したAPI keyに置き換えてください。

またAPI keyは見えるところ(つまりScript)に書かないでください。ここでは試験のためにハードコードしています。環境変数から取得するのがいいようです。

let api_key = "Your API key"

import { GoogleGenerativeAI } from "@google/generative-ai";

const genAI = new GoogleGenerativeAI(api_key);
const model = genAI.getGenerativeModel({ model: "gemini-1.5-flash" });

const prompt = "GoogleのAIのGeminiに関して教えて。";

const result = await model.generateContent(prompt);
console.log(result.response.text());
スポンサーリンク

結果

以下を実行して、ブラウザで実行すると

npm run dev

コンソールに以下の内容がログされました。(数秒から数10秒かかります)

## GoogleのAI、Geminiについて

Geminiは、Googleが開発中の次世代AIシステムです。Bardの後継であり、Googleの最新のAI技術を搭載し、より高度な能力を持つとされています。

**Geminiの特徴:**

* **マルチモーダル:** テキスト、画像、音声、動画など、さまざまな種類の情報を理解し、処理できる能力を備えています。
* **高度な言語理解力:** 自然言語処理能力が向上し、複雑な文脈を理解し、人間に近い自然な文章を生成できます。
* **推論能力:** 複雑な問題を分析し、論理的な推論を行い、適切な回答を導き出すことができます。
* **コード生成能力:** プログラミングコードの理解、生成、修正など、ソフトウェア開発に役立つ機能も備えています。

**現時点での情報:**

* **まだ開発段階:** Geminiは現在開発中で、正式なリリース日は未定です。
* **具体的な機能:** 公開されている情報は限られており、具体的な機能の詳細や性能については不明です。
* **競合との比較:** Geminiは、OpenAIのChatGPTやMicrosoftのBing AIなどの競合サービスと比較され、性能や機能面で優位性を競うことになるでしょう。

**期待される影響:**

* **様々な分野への応用:** Geminiは、翻訳、情報検索、顧客サポート、教育など、さまざまな分野で活用されることが期待されています。
* **より高度なAI体験:** 人間とAIのインタラクションがより自然になり、より高度なAIサービスが提供される可能性があります。
* **技術革新への貢献:** Geminiの開発は、AI技術のさらなる発展と革新に貢献する可能性があります。

**今後の動向:**

* Geminiの開発状況やリリース時期に関する情報は、Googleの公式発表を待ちましょう。
* 今後、より詳細な情報や具体的な機能が公開されることが期待されます。

**まとめ:**

Geminiは、Googleが開発中の次世代AIシステムで、マルチモーダル、高度な言語理解力、推論能力、コード生成能力などを備えています。正式なリリースは未定ですが、今後AI技術の発展に大きく貢献する可能性を秘めています。

GUIは下の記事で作成します。

スポンサーリンク

参考にさせていただいたサイト

Gemini API クイックスタート  |  Google AI for Developers
Gemini API のスタートガイド

コメント

タイトルとURLをコピーしました