行政システム株式会社

Topics vol.9 生成AIとこれからの社会を考える

 1年半ほど前に登場したOpenAIのChatGPTは瞬く間に世間の話題をさらい、それについて本コラムでも取り上げた。それから約1年、ChatGPTなど生成AIの進化は目覚ましい。

 ChatGPTはLLM(Large Language Model)にGPT-3.5を採用しているが、有料版のChatGPT PlusではアップグレードされたGPT-4が使えるとともに、データ分析を行うAdvanced Data Analysis(旧Code Interpreter)や画像生成のDALL-E 3機能も追加された。

 また、GPT-4Vではテキスト、画像、音声を扱うマルチモーダル機能を備え、GPT-4 TurboではGPT-4 の16倍ものコンテキストを扱い、マルチモーダルのAPIも利用できる。さらに、自分専用にカスタマイズできるGPTs(GPT Builder)が提供され、そのチャットボットを公開できるプラットフォームGPT Storeも今年オープンした。

 OpenAIに出資したマイクロソフトはBingにGPT-3.5を採用したが、現在はCopilotと名称が変わり、無料版のCopilotと有料版のCopilot Proがある。どちらもGPT-4とGPT-4Turboにアクセス可能だが、有料版のほうが優先的にアクセスでき、機能も豊富だ。専用カスタマイズ可能なCopilot GPT Builderも提供されている。

 GoogleはOpenAIのChatGPTに対してBardで対抗し、そのLLMはLaMDA、PaLM、PaLM2、Gemini Proと進化しており、今年に入ってBardはGeminiと名称を変更した。それを軽量化・オープンソース化したLLMがGemmaである。そのほかオープンソースとしては、Meta(旧Facebook)のLlamaやxAI(イーロン・マスクのAI企業)のGrok-1がある。Llama2は日本語学習モデルなどで利用され、最近Llama3が最新版として発表された。新興勢力としてはOpenAIからスピンアウトしたAnthropicがClaude3を提供している。

 このように直近1年のチャット系生成AIの名称やLLMが目まぐるしく進化しているだけでなく、画像生成AI、動画生成AI、音楽生成AI、ゲーム生成AIなど様々な生成AIが続々と登場している。まさにAI進化の過程で進化の大爆発が起きているような状況だ。

 ChatGPTが世に出た当初、もっともらしい嘘を生成するハルシネーションが問題となったが、それもMoE (Mixture of Experts)やRAG(Retrieval-Augmented Generation:検索拡張生成)やその精度を上げるRerankなどで改善され、実用性のあるツールとして社会の中に浸透していくだろう。しかし、AIという新たな技術が社会の中に浸透していくにつれ、逆に反感を持つ人々も出てくる。

 今年の2月、サンフランシスコで自動運転タクシーのWaymoが襲撃された。無人だったので怪我人などは出なかったが、自動車は炎上した。同様な事件は配送ロボットでも起きている。失業などで自分たちの存在意義が奪われているという鬱積した不満が噴出したもので、まさに現代版ラッダイト運動だ。このような記事を読み込んだAIは、人間が自分たちに敵意を持っていると認識し、憎悪の感情をパラメタとして埋め込むかもしれない。

 そのような想像を巡らせる前に、差し迫った問題として生成AIの悪用に注意を払う必要がある。日本はこれまで言葉の壁によってグローバルな詐欺などの攻撃から守られてきたが、生成AIによってその壁が崩され、標的の一つとして照準が合わせられることになる。

 そして今年は米国の大統領選挙がある。精巧なフェイク画像や動画が選挙キャンペーンで拡散され、フェイクニュースの乱造がメディアを混乱させたりすると、民主主義の根幹を揺るがす事態にもなりかねない。事態を慎重に見守り、生成AIと社会との関係をどのようにコントロールすべきか、考えなくてはならない。

トピックス一覧へ戻る