最終更新
TOPIC · AI FUNDAMENTALS

AIの基礎用語と最新動向|機械学習・LLM・RAG・エージェントの整理と2025-26技術トレンド【2026年版】

AIの話には専門用語が多く、整理しないと全体像がつかみにくくなります。本ページは前半でAI・機械学習・ディープラーニング・大規模言語モデル・Transformer・Embedding・Fine-tuning・RAG・エージェントといった基礎用語を平易に整理し、後半で2025年から2026年にかけて注目される技術動向をまとめます。例え話を使わず、実際のモデルや企業の例で直接説明します。用語を一通り押さえてから動向に進めるので、AIの入門にも、最新トレンドの確認にも使えます。挙げる技術や企業は代表例で、これが業界の全てではなく、日本企業の取り組みも断定を避けて整理します。

AIの基礎用語の整理

用語ごとに平易に説明 (LoRA・RAGは原典の定義を引用)

用語は「AIの中に機械学習、その中にディープラーニングがあり、その上に大規模言語モデルなどのモデルが乗り、さらにRAGやエージェントといった使い方が乗る」という層で整理できます。LoRAとRAGは文化庁の定義を引用したうえで平易に言い換えており、評価や予測は加えていません。

AI・機械学習・ディープラーニング

AIは人間の知的な作業をコンピュータで行わせる技術の総称です。機械学習はそのAIの一手法で、データからパターンを学び、明示的にプログラムしなくても判断や予測ができるようにする方法を指します。

ディープラーニング(深層学習)は機械学習の一種で、多層のニューラルネットワークを使う手法です。画像認識や言語処理で高い性能を出し、現在の生成AIの土台になっています。3つの関係は、AIという大きな枠の中に機械学習があり、その中にディープラーニングが含まれる、という入れ子で整理できます。

Transformerと大規模言語モデル(LLM)

Transformerは2017年に提案されたニューラルネットワークの構造です。文章を先頭から1語ずつ順に処理していた従来の手法と違い、文中の離れた単語どうしの関連を一度にまとめて見られる点が特徴で、長い文脈を保てるため文章生成や理解の精度が大きく向上しました。現在の大規模言語モデルの多くがこの構造をもとにしています。

大規模言語モデル(Large Language Model、LLM)は、大量のテキストで学習した巨大なモデルで、文章生成や質問応答を行います。OpenAIのGPT系、AnthropicのClaude系、国産ではNTTのtsuzumiやSakana AIのモデルなどが該当します。本ページは用語の位置づけの整理にとどめ、個別モデルの比較には踏み込みません。

EmbeddingとFine-tuning

Embedding(埋め込み)は、単語や文を、意味の近さを数値で比べられる形(数値の並び、ベクトル)に変換したものです。意味の似た文どうしは数値が近くなるため、似た文書を探す検索や分類の土台になります。

Fine-tuning(ファインチューニング)は、学習済みのモデルに追加のデータで学習させ(モデル内部の無数の数値=パラメータを調整し)、特定の用途に適応させる方法です。少ないデータで効率よく調整する技術としてLoRAがあり、文化庁はLoRAを次のように説明しています。「例えば、LoRA(Low Rank Adaptation)と言われる技術は、学習済みの生成AIに小規模なデータセットを用いて追加的な学習を行い、当該データセットに強い影響を受けた生成物の生成を可能とする技術」

平たく言えば、元のモデル全体を作り直さず、少量のデータで一部だけ微調整して特定の作風や用途に出力を寄せる軽量な手法です。

推論と学習の違い

学習(トレーニング)は、データからモデルのパラメータを作り込む工程です。大量の計算資源と時間がかかります。推論(インファレンス)は、できあがったモデルを使って実際に答えを出す工程で、サービス利用時に動くのは主にこちらです。

「学習に使うGPU」と「推論に使うGPU」は規模も使われ方も異なります。計算資源の話を読むときは、どちらの工程の話かを区別すると理解しやすくなります。

RAGとエージェント

RAG(検索拡張生成)は、モデルが外部のデータを検索し、その結果をもとに回答を生成する手法です。文化庁も同趣旨を次のように示しています。「検索拡張生成(RAG)その他の、生成AIによって著作物を含む対象データを検索し、その結果の要約等を行って回答を生成する手法(以下「RAG等」という。)」つまり、モデルの中の知識だけで答えるのでなく、関連する資料を都度参照して回答を組み立てる方式です。

エージェント(AIエージェント)は、目標を与えると自分で手順を考え、複数の処理を組み合わせて実行するAIの使い方を指します。後半で扱うAgentic AIはこの方向の動向です。

AIに関わる3つの立場 (開発者・提供者・利用者)

AI事業者ガイドラインは、AIに関わる主体をAI開発者・AI提供者・AI利用者の3つに区分しています。平易に言えば、AI開発者はモデルやシステムを作る側、AI提供者はそれを製品やサービスに組み込んで届ける側、AI利用者はそれを業務で使う側です。

この区分は固定ではなく、同じ企業が複数の立場を兼ねることもあります。たとえば自社で基盤モデルを開発し(開発者)、それをサービスとして提供し(提供者)、社内業務でも使う(利用者)企業があります。自分がどの立場でAIに関わるかを押さえると、規制やガイドラインのどの部分が自社に関係するかを判断しやすくなります。

2025-26の技術動向

2026年前後に注目される代表的な技術

これらは2025-26で注目される技術として整理されているもので、どれが主流になるという断定はしません。挙げた企業・モデルは代表例で、業界の取り組みを網羅したものではありません。技術動向は流動的で、特定の方向や企業が固定的に勝つと描けるものではありません。

Agentic AI (自律的に手順を組むAI)

Agentic AIは、目標を与えると自分で手順を計画し、複数のツールや処理を組み合わせて実行するAIの方向です。単発の質問応答から、複数ステップの作業を任せる使い方への広がりとして整理されています。

日本企業の例として、Sakana AIは自律的に研究を進めるAI Scientistを公表しています(AI Scientist (2026-03 Nature 掲載) / Namazu series (2026-03))。

Multi-modal (複数の種類の情報を扱う)

Multi-modalは、文章だけでなく画像・音声・動画など複数の種類の情報を一つのモデルで扱う方向です。文書画像の読解や、画像と質問を組み合わせた応答などに使われます。

日本企業ではPreferred NetworksがVision-languageモデルのPLaMo-VLを公開しています(PLaMo 2.2 Prime + PLaMo Translation (2026-05-13) / PLaMo-VL 8B+2B (2026-04-03))。

Reasoning models (思考の過程を経るAI)

Reasoning modelsは、答えを出す前に内部で考える過程を多く取る設計のモデルで、複雑な推論や数学・コーディングで性能を高める方向です。即答型のモデルとは応答の作り方が異なります。

複雑な数学やコーディング向けに、各社が推論特化のモデルを投入する動きとして整理されています。どのモデルが優れているという断定はせず、本ページは動向の整理にとどめます。

Inference scalingとSmall Language Model

Inference scaling(推論時のスケーリング)は、学習を大きくするだけでなく、推論時に計算をかけて性能を上げる考え方です。Reasoning modelsと関係が深い動向として整理されています。

Small Language Model(小規模言語モデル、SLM)は、軽量で運用しやすいモデルの方向です。1台のGPUやCPUで動かせる設計が特徴で、NTTのtsuzumiの軽量版などが該当例として挙げられます。大規模化と軽量化は対立でなく、用途に応じた選択肢として並行しています。

主要論点

用語が氾濫する中で本質をどう押さえるか?

AIの用語は次々に増えますが、「AI ⊃ 機械学習 ⊃ ディープラーニング」の包含関係と、「学習と推論の違い」「開発者・提供者・利用者の立場の違い」の3点を押さえると大半は整理できます。新しい用語が出ても、この枠組みのどこに位置するかで理解できます。

LoRAやRAGのように文化庁が定義を示している用語は、その定義を起点にすると曖昧さが減ります。用語の新しさに振り回されるより、土台の関係を固定して読むことが、入門者にも実務者にも有効です。

技術動向はどう見極めればよいか?

2025-26の動向はAgentic AI・Multi-modal・Reasoning models・Inference scaling・Small Language Modelに整理できますが、どれが主流になるかは断定できません。大規模化と軽量化のように、対立でなく用途に応じて並行する方向もあります。

見極めの軸は、その技術が「学習側の話か推論側の話か」「どの立場(開発者・提供者・利用者)に効くか」を切り分けることです。動向の名前を覚えるより、自社の用途にどう関わるかで読むと、流行語に流されずに判断できます。

日本企業はどう取り組んでいるか?

日本企業は代表例として、Sakana AIの自律研究AI、Preferred NetworksのVision-languageモデル、NTTの軽量モデルなど、各動向に対応した取り組みを進めています

特徴は、汎用モデルの規模競争に正面から張るより、自律性・マルチモーダル・軽量化など特定の方向で取り組む点に表れています。どの方向が成功するかは未確定で、本ページは取り組みの整理にとどめ、優劣の断定はしません。

中期見通し

近未来1-2年

2026-2027年は、Agentic AIやReasoning modelsへの関心が続く見通しです。基礎用語の枠組み(学習と推論、3つの立場)は大きく変わらず、新しい用語もこの枠組みで整理できると見られます。日本企業は特定方向での取り組みを続けると想定されます。

中期3-5年

2028-2030年は、大規模化と軽量化のどちらが用途ごとに定着するかが論点になります。技術の名前は移り変わっても、用途に応じた選択という構図は続くと整理できます。確定的にどの技術が主流かは見通せません。

長期5-10年

2031年以降は、現在の用語の枠組み自体が更新される可能性があります。本ページは現時点の基礎用語と動向の整理にとどめ、将来の特定技術の優劣は断定しません。用語が変わっても、土台の関係を押さえる読み方は有効であり続けると整理できます。

よくある質問

AIと機械学習とディープラーニングはどう違いますか?
「AI ⊃ 機械学習 ⊃ ディープラーニング」という包含関係です。AIは知的作業をコンピュータで行う技術の総称、機械学習はデータからパターンを学ぶ手法、ディープラーニングは多層ニューラルネットワークを使う機械学習の一種です。現在の生成AIはディープラーニングが土台です。
LLMとTransformerは何ですか?
Transformerは、文中の離れた単語どうしの関連を一度にまとめて見られるニューラルネットワークの構造で、長い文脈を保てる点が特徴です。大規模言語モデル(LLM)の多くがこれをもとにしています。LLMは大量のテキストで学習した巨大なモデルで、文章生成や質問応答を行います。OpenAIのGPT系、AnthropicのClaude系、国産のtsuzumiなどが該当します。
RAGとFine-tuningの違いは何ですか?
RAGは外部データを検索して回答に使う手法、Fine-tuningは追加データでモデル自体を特定用途に適応させる方法です。文化庁はRAGを「検索拡張生成(RAG)その他の、生成AIによって著作物を含む対象データを検索し、その結果の要約等を行って回答を生成する手法(以下「RAG等」という。)」と説明しています。Fine-tuningを少ないデータで効率よく行う技術がLoRAです。
2025-26で注目される技術は何ですか?
Agentic AI(自律的に手順を組む)・Multi-modal(複数種類の情報を扱う)・Reasoning models(思考過程を経る)・Inference scaling(推論時に計算をかける)・Small Language Model(軽量モデル)が整理されています。どれが主流になるという断定はせず、代表例として示しています。
情報の出典は何ですか?
LoRA・RAGの定義は文化庁「AIと著作権に関する考え方について」、3区分は総務省・経済産業省のAI事業者ガイドライン、技術動向の代表例は各社の公開情報が出典です。基礎用語は確立した技術用語の一般的説明で、架空の数値や統計は加えていません。

参考資料 / 一次ソース

  1. 1.
    文化庁 文化審議会著作権分科会「AIと著作権に関する考え方について」LoRA・RAGの定義 (逐語引用)
  2. 2.
    総務省・経済産業省AI事業者ガイドライン第1.2版AI開発者 / AI提供者 / AI利用者の3区分
  3. 3.
    各社公開情報 (基盤モデル提供者)2025-26技術動向の代表例 (網羅ではない)
データ出典
文化庁 文化審議会著作権分科会「AIと著作権に関する考え方について」総務省・経済産業省AI事業者ガイドライン第1.2版各社公開情報 (基盤モデル提供者)
📄 資料DL💬 無料相談