Skip to content

人類の能力を超えるLLM技術

LLM(大規模言語モデル)

ChatGPT-3.5 の登場以降,大規模言語モデルが爆発的に普及し始めてからまだわずか数年ですが,すでに多くの産業分野で活用が進んでいます。 わずか 2−3 年前まではとても使い物にならないと思っていた方も,昨今の最新モデル(OpenAI o1 や Meta Llama3.1-405B や Qwen2.5-72B など)の知識の深さや能力の高さには圧倒されていると思います。

LLM はまだ誕生してから魔もない技術ですので未成熟な点も多々ありますが,多くのエンジニアが世界中で日夜開発を行い欠点を克服し,「使える」レベルの製品が多数登場しています。 特に LLM 開発で特徴的なのはオープンソースコミュニティーの貢献度の高さです。

オープンソースコミュニティ

LLM 開発のきっかけを作ったのは OpenAI や Google の研究者たちですが,それが普及する下地を作ったのは

  • Georgi Gerganov: llama.cpp の生みの親
  • AUTOMATIC1111: 画像生成 AI プラットフォーム Stable Diffusion Web UI
  • lllyasviel: Stable Diffusion Forge の生みの親
  • comfyanonymous: ComfyUI の生みの親 といった開発者や開発チームの影響が大きく,さらにこれに加えて,
  • HuggingFace: AI モデルリポジトリ
  • Civitai: AI モデルの中でも画像生成モデルに特化したリポジトリ といった LLM や AI コミュニティーの下地となるサイトの存在のおかげです。

これらのソフトウェア製品の下地となっているのはGithubの成功によって開発者コミュニティーが成熟したというのが大きいです。 Github では誰もが Commit できますが,共同開発リポジトリにマージするためには linter によるフォーマットチェックや単体テストツールによる品質チェックなどを経る必要があります。 オープンソースで多数が共同でソースコードをいじり,コンフリクトやデグレードなしにリリースできる体制が出来上がったからこそ,LLM で当たり前のように用いられている上記のソフトウェア製品群が世に登場したと言えるでしょう。

  • Gradio: Stable Diffusion Web UI などの WebUI 開発フレームワーク
  • Electron: デスクトップアプリ開発環境 などのツールの充実も製品のプロトタイプを早期にリリースできる体制が構築されている主要な要因です。

一人の開発者が 100%バックエンドからフロントエンドまで開発しなくても,オープンソースで公開されているモジュールを活用することで 80 点ぐらいの製品は作れるようになったというわけです。 その結果,ソフトウェアエンジニアは主要なコアとなる部分の開発に専念でき,またテストツールを活用することでクオリティを落とすことなく進化の早い LLM プラットフォームを次々にアップデートできているというわけです。

昔からフリーウェアやシェアウェアという名前で個人開発や少人数開発が行われることはありましたが,基本は個人中心でした。 でも今や世界中からコントリビューターが集まってバグだしや修正が 24 時間体制で行われています。

このオープンソースコミュニティでの共同開発による正の連鎖が,昨今の LLM の異常な進化速度に寄与しているのは疑いようがありません。

デジタルは陳腐化する

LLM や AI の登場によって明確になったことが一つあります。

デジタル化されているもの,デジタル化できるもの,すべて AI に取って代わられる

デジタル化(トークナイズ)でき,一定の規則性を有するものは,AI が人間よりも高い処理能力を発揮する

これは画像生成 AI(Stable Diffusion や Flux1.dev などのモデル)が絵師を超え始めている事実や,Qwen2.5-Coderのように 30 万円のグラフィックボード 1 枚で動くモデルが一流のプログラマーのスキルを部分的に超え始めている事実からも実証されつつあります。

人間より優れた AI

質的にも量的にも AI が人間を圧倒するであろう領域は以下の分野です。

  • 文章作成
  • 言語の翻訳
  • 音楽作成
  • 絵画作成
  • 映像作成
  • プログラムの生成やバグの原因箇所特定
  • 病気や疾患の診断
  • アミノ酸の設計
  • タンパク質の設計

これらの分野に共通する要素は以下の 2 つ。

  • 「デジタル化できる」
  • 自然言語の文法やプログラミング言語の文法やアミノ酸配列など「一定の規則性がある」

デジタル化と規則性の 2 つは AI が「学習」し「答え合わせ」することで繰り返し強化学習を行うための不可欠な要素です。 そして学習でき,学習効果を測定できるならば,計算リソースをつぎ込めばいくらでも能力を高められます。

すでに画像生成の分野では AI の生成する画像は質・量ともに Photoshop や Illustrator を超えつつあります。 もちろん細部に着目すれば粗はありますが,ど素人でもプロンプトを叩くだけで一見プロ級のカメラマン並の写真やエフェクトを再現できるのは事実であり,プロと AI の差も詰まりつつあります。

人間に残されたもの

では人間に残っている最大の要素はなにか? それはみなさんもご存知の「感情」でしょう。

楽しい・情けない・嬉しい・悲しい・寂しい・悔しい・羨ましい・憎たらしい・痛い・辛い・幸せ・感動・涙・吐き気・混沌

こういう複雑な感情だけは人間にしか備わっていないものであり,AI が獲得するのは最後の最後でしょう。もしかすると AI は一生感情を理解することは不可能かもしれません。 感情をエンコードしデコードし学習するのが困難なのは,感情こそ最も「規則性」に欠けるものだからです。

規則性のなさが人間の尊さであり美しさである

感情という不規則で再現性のないものが人間の価値である

このことを胸に当社では LLM を用いた製品開発に邁進していきます。 みなさんと一緒に AI や LLM の価値を高めつつ,身近な人とのつながりの価値を再認識する。

これが当社の夢であり,目指す山の頂です。