Gemini について調べてみた。画像生成はできるの?できないの?Gemini Advancedとの違いは?

AI

みなさん、こんにちは。土方のおじさんです。AIに興味を持ち始めてはや1年以上、仕事を言い訳になかなか勉強できずにいますがコツコツ継続はしております。今回は、よく聞くGemini Advancedについて、一生懸命調べてみましたので、お話しさせていただきます。

はじめに

このGemini Advancedは、今年の2月8日に登場した新しいAIサービスなんです。Googleが開発した「Gemini」というAIの高性能版で、月額約2,800円(19.99ドル)で使えるそうです。普通のGeminiよりも賢くて、難しい質問にも答えられるし、長い文章も書けるんだとか。

最初は画像も作れるって話だったんですが、5月になって突然その機能が使えなくなっちゃったみたいなんです。それで、みんなちょっと困っているようですね。

でも、画像以外のことはまだまだすごいみたいで、文章を書いたり、翻訳したり、複雑な計算をしたりできるそうです。それに、8時間分の音声や100ページ分の文書を理解できるって聞きました。すごいですよね。

ただ、私みたいな素人には、まだまだ難しい部分も多そうです。でも、これからの時代、こういうのを少しずつ勉強していかないとね。では、もう少し詳しく見ていきましょう。

Gemini と Gemini Advancedで今できること:

Geminiの基本版とAdvanced版の機能を比較した表を作成し、補足情報を加えてみます。

機能Gemini (無料版)Gemini Advanced
文章生成基本的な文章生成より長く複雑な文章生成が可能
質問応答一般的な質問に回答専門的で深い質問にも対応
翻訳基本的な翻訳より高精度な翻訳が可能
コード生成簡単なコード生成複雑なプログラミングコードの生成や解説が可能
データ分析基本的なデータ解釈より広範なデータソースからの情報収集と高度な分析
文書理解短い文書の理解100ページ分の長文書を理解可能
音声処理基本的な音声認識8時間分の音声を理解可能
画像生成利用不可現在は利用不可(2024年5月14日に停止)

補足情報:

  1. 文章生成:Gemini Advancedは、学術論文やビジネスレポートなど、より専門的で構造化された文章を生成できます。文脈を理解し、一貫性のある長文を作成する能力が向上しています。
  2. 質問応答:Advanced版は、複雑な質問や多段階の質問に対して、より詳細で正確な回答を提供します。また、ユーザーとの対話を通じて理解を深めることができます。
  3. 翻訳:Advanced版は、ニュアンスやイディオムをより正確に翻訳し、専門用語の適切な使用にも対応します。
  4. コード生成:Advanced版は、より複雑なアルゴリズムや大規模なプロジェクトのコードを生成できます。また、コードの最適化や問題解決の提案も可能です。
  5. データ分析:Advanced版は、大量のデータを処理し、複雑な統計分析や予測モデルの構築をサポートします。
  6. 文書理解と音声処理:これらの機能は、法律文書の分析や長時間の会議録の要約など、ビジネスや学術分野で特に有用です。
  7. 画像生成:残念ながら、この機能は現在両方のバージョンで利用できません。Google社は具体的な理由を公表していませんが、技術的な課題や倫理的な懸念が原因である可能性があります。

おじさんとしては、これらの機能を見ると本当にすごいなと思います。特に、Advanced版の長文理解や専門的な内容の扱いは、仕事や勉強に役立ちそうですね。ただ、画像生成ができなくなったのは少し残念です。これからどんな進化をしていくのか、楽しみでもあり、少し不安でもあります。

なぜ画像が作れなくなってしまったのか?

おじさんが一生懸命調べた感じで、画像生成機能の停止理由と代替の画像生成AIについて、もう少し詳しく説明してみますね

Google社ははっきりとした理由を公表していないんですが、おじさんが色々調べてみたら、こんな可能性が考えられるようです:

  1. 技術的な課題:高品質な画像を作るのは、思った以上に難しいみたいです。
  2. コストの問題:画像を作るには、たくさんの電気や機械が必要で、お金がかかるんだとか。
  3. 倫理的な懸念:悪用されて、フェイク画像が広まる心配があるみたいです。
  4. 著作権の問題:他の人が作った絵や写真を勝手に使っちゃう可能性があるそうです。
  5. 品質管理:作られる画像の質にばらつきがあって、管理が大変だったのかもしれません。

実は、他の会社のAIサービスでも似たような問題があったそうです。例えば、Meta社(昔のFacebook)のAIも、一時期画像生成を止めていたんだとか。

他に画像生成AIができるAIもある

Gemini Advancedで画像が作れなくなっちゃいましたが、他にも画像を作れるAIがあるみたいです。おじさんが調べた主なものをまとめてみました:

AI名会社特徴料金
DALL-E 2OpenAI高品質な画像生成、細かい指示が可能使用量に応じて課金
MidjourneyMidjourney芸術的な画像生成が得意月額10ドルから
Stable DiffusionStability AIオープンソース、無料で使える基本無料(自分でホスティング)
Adobe FireflyAdobeデザイン向け、Adobe製品と連携Creative Cloud会員は利用可能

まとめ

画像生成AIは便利そうですが、使い方には気をつけないといけないみたいですね。著作権のことや、人の顔を勝手に使っちゃいけないこととか、難しいこともあるみたいです。

おじさんにはまだまだ難しいことばかりですが、これからの時代、こういうのをちょっとずつ勉強していかないとね。みなさんも、良いところを上手に使っていけるといいですね。

間違っているところがあったら、ぜひ教えてください。これからも一生懸命勉強して、また報告させていただきますね。

コメント

タイトルとURLをコピーしました