共創 AIと未知のじぶん
こうやってみると、AIも違って見える:入力→変換→出力の原理

What is AI, really? (ほんとうのところ、AIって何だろう)
AIって何?
あなたは何と答えますか?AIって、ChatGPTとかGeminiとかでしょ?
そう答えてしまいそうですね。
AIって何だろう?
じぶんで考える間もなく、あなたは、すぐAIに質問してしまうのでは?
そして、それぞれのAIは、こんなふうに答えるかもしれません。
⚫︎ ChatGPT: AIとは、人間の質問や文章を受け取り、学習した大量のパターンをもとに、もっとも自然で役に立つ答えをつくるしくみです。考えているように見えますが、実際には入力を理解しやすい形に変え、次にふさわしい言葉を予測しています。
⚫︎ Gemini: AIとは、文章、画像、音声、動画などの情報を読み取り、それらの関係を見つけて、答えや提案を返すコンピュータのしくみです。検索や文章作成だけでなく、さまざまな情報を組み合わせて考える手助けをします。
⚫︎ Claude: AIとは、人間の言葉を受け取り、その文脈や意図を推測しながら、できるだけ役に立ち、安全でわかりやすい応答を返すシステムです。人間のような意識はありませんが、対話を通して考える手助けをします。
⚫︎ Copilot: AIとは、人間の作業を助けるために、情報を整理し、文章を書き、計算し、アイデアを出してくれるデジタルな相棒です。特に仕事や勉強の中で、必要な作業を早く、正確に進めるために使われます。
なるほど。でも、こう聞こえませんか。
⚫︎ ことばを入れると、ことばを返す機械?
⚫︎ 質問すると何でも答えるコンピュータ?
⚫︎ 高速で答えを探すソフトウェア?
⚫︎ 画像も文章もコードもつくる道具?
AIは魔法の箱なのでしょうか。
ことばを入れる。内部で変わる。ことばが出てくる。
この「入力 → 変換 → 出力」という捉え方で、AIは違って見えてきます。
ここでは、千代田中学校・高等学校で行っている「共創AI 英語サイエンス&アートラボ 2026」で、生徒たちと話している内容を紹介します。
中学で習う関数から出発して、ベクトル、行列、確率、学習へとつなげながら、AIに何ができ、何ができないのか、それはなぜなのかを考えます。AIを使うだけで終わらせず、じぶんの声、ふるまい、プラクティスと結びつけて、AIとともに学びのしくみをつくる。そこに、共創AIの入口があります。

① 「書きことば」を出し入れする機械
AIとは、人間のことばを受け取り、それを内部で数のまとまりに変え、またことばとして返す人工的な変換システムです。質問を入れると答えてくれます。相談すると、考えてくれているように見えます。けれど、AIが人間のように理解し、考え、感じているわけではなく、いったん数の形にして計算し、ふたたびことばとして出しているのです。
ここでいう「ことば」とは、基本的に書きことばです。音声入力もできます。でも、あなたの声音を直接聞いているのではありません。人間のように、声のトーン、間、リズム、息づかい、発音のくせを身体で聞いているのではなく、音声はいったん文字に直され、そのテキストがAIに渡されます。つまり、声で話しているように見えても、中心にあるのは、文字化されたことばの出し入れです。
② AIは、関数
端的に言うと、AIは、関数です。入力があり、内部の変換があり、出力があります。中学で習う関数「x を入れると y が出る」しくみですね。AIもまた、入力を受け取り、学習済みのしくみによって出力を返す関数です。ただし、それは一行で書ける単純な関数ではなく、非常に巨大な関数です。
AIは「答えをしまってある箱」ではありません。入力を受け取り、その入力に応じて内部で変換し、出力をつくるしくみです。別の言い方をすると、巨大な関数マシンです。
③ ことばを、ベクトルに変える
AIに入るものは、ひとつの数字ではありません。ことば、画像、音、行動、文脈などです。AIはそれらをそのまま扱うのではなく、比べたり計算したりできる数のまとまりに変えます。この数のまとまりをベクトル(vector)と呼びます。
ベクトルとは、ひとつの数ではなく、数の並び全体のことです。たとえば、
[0.12, -0.83, 1.45, 0.04]
のような数のまとまりです。このまとまり全体がベクトルです。その中の 0.12 や -0.83 は、ベクトルそのものではなく、ベクトルの成分です。(図形の矢印のことじゃないの?と思った人、じっくり読んでください)
たとえば、人の特徴を、身長、体重、年齢などの数値で表すことができます。同じように、AIはことばや画像や音を、多次元の特徴のまとまりとして表します。ベクトルを「特徴を運ぶもの」と考えると、わかりやすくなります。(vectorの語源は「運ぶもの」です)
ことばは、ベクトル空間の中に置かれます。ベクトル空間とは、ベクトルを置き、近い、遠い、似ている、関係がある、といったことを計算できる見えない空間です。意味を説明文として持つのではなく、関係の中の位置として扱うための空間、と言ってもよいでしょう。

AI maps the world into a vector space.(AIは、世界をベクトル空間に配置するしくみ)
④ ことばの関係を計算する
現代のAI、とくにLLM(大規模言語モデル)は、入力されたテキストを小さな単位に分けます。この小さな単位をトークンと呼びます。トークンは、単語そのものとは限りません。単語より短いこともあれば、複数の文字のまとまりであることもあります。
AIは、そのトークンをベクトルとして扱います。そして、そのベクトルを何度も変換します。この変換を何層にも重ねるしくみを、ニューラルネットワークと呼びます。名前に「ニューラル」とありますが、人間の脳そのものではありません。脳の神経回路からヒントを得た、計算のしくみです。
私たちには、AIが答えを考えて一気に出しているように見えます。しかし実際には、次にふさわしいことばを連続的に生成しているのです。
⑤ 何を生成しているのか
よく「生成AI」と呼ばれます。一体、何を生成しているのでしょうか。
表面では、文章、画像、音声などを生成しています。しかし、文章生成AIの場合、直接生成しているのは文章全体ではありません。次に来る小さなことばの単位です。これをトークンと呼びます。
入力された文脈をもとに、AIは次に来る候補の確率分布をつくります。確率分布とは、「次にどのことばが来そうか」を候補ごとに並べたものです。その中からひとつを選びます。そのトークンを文脈に加え、また次のトークンを予測します。この順次生成の連続が、出口では文章として現れます。
つまり、文章生成は出口です。内部では、入力がベクトル空間に写され、文脈の関係が計算され、次に出すべき候補の確率分布がつくられます。AIがいきなり「意味」を丸ごと生成しているのではありません。内部表現を更新しながら、次に来ることばを順番に選び出しているのです。その結果が、人間には自然な文章として見えます。

⑥ 機械学習:自分で修正して、答えに近づく
AIのすごい点は、人間が一つひとつルールを教え込んだわけではないところにあります。これを支えているのが、機械学習です。
機械学習(Machine Learning)とは、コンピュータの中のモデルが、大量のデータを使いながら、自分の内部を調整していく方法です。ここでいう「機械」は、ロボットのような機械ではありません。コンピュータの中のモデルのことです。そのモデルが、たくさんのデータを使い、答えのズレが小さくなるように、自分の中の重みを調整していきます。
AIは答えを出します。その答えと、望ましい答えのズレを測ります。その誤差が小さくなるように、内部の重みを調整します。重みとは、入力された情報のどこをどれくらい強く見るかを決める、内部の調整値のようなものです。このくり返しによって、AIは自動的に役に立つ特徴表現を獲得していきます。
実はこれは、人間の身体運動の練習にも似ています。
やってみる。ズレを知る。直す。くり返す。
くりかえして身につける。ただし、人間は、ただくりかえすだけではなく、感覚、ねがい、記憶、意味づけがあります。AIにはそれがありません。
⑦ 一般には強いが、個別は知らない
AIは、一般的な情報には強いです。大量のテキストやデータに現れるパターンを学習しているからです。よくある説明、広く知られた知識、多くの人に当てはまる答えを出すことは得意です。
しかし、入力されていない個別固有のことはわかりません。あなたの人生、記憶、声、ふるまい、願い、変化を、AIが直接知っているわけではありません。あなたについて答えているように見えても、多くは一般的な情報からの推定です。
AIは、あなたを人間のように理解して考えているのではありません。あなたにとって、理解して考えて答えているように感じられる出力を返しているのです。AI(Artificial Intelligence)という名のとおり、人工的な、つまり人間がつくった「知能らしさ」です。
だから、あなた固有のことに近づくには、あなた自身の入力が必要になります。声、ふるまい、試したこと、つまずいたこと、続けたこと。そのデータがあってはじめて、AIは一般論から、あなたに近い手助けへと近づいていきます。

A vector carries many numbers. (ひとつのベクトルは、いくつもの数値を持つ)
⑧ AIの土台は、中学生の数学
AIの土台は数学です。そして、その入口は、中学で習う関数です。
AIには、いくつもの分野が重なっています。線形代数は、ことばや画像や音を、ベクトルや行列という数の形で表し、変換するための数学です。確率・統計は、「次に何が来そうか」「どの答えがどれくらいありそうか」を扱うための数学です。機械学習は、データを使って内部の重みを調整する方法。コンピュータサイエンスは、その膨大な計算を高速に動かすための技術。そして、何のためにAIを使うのかを決めるのは、人間の目的や社会の文脈です。
でも、入口は関数です。
関数とは、ある入力に対して、ひとつの出力を対応させるしくみです。x を入れると、y が出る。一次関数 y = ax + b では、入力 x が変わると、出力 y がどう変わるかを量として表します。x が入力、y が出力、a が変化のしかた、b が調整分です。
AIも、中学で習う、この関数の延長にあります。入力を受け取り、内部で変換し、出力を返します。ただし、AIに入る x は、ひとつの数ではありません。ことば、画像、音、文脈などです。。「dog」という単語ひとつをとっても、意味、使われ方、文脈、近いことば、感情の響きなど、たくさんの特徴を持っています。ひとつの数字では、とても表せません。
そこで必要となるのがベクトルです。
学校でベクトルというと、図形の矢印として登場しますね。向きと大きさを持つ矢印です。でも、ベクトルは矢印ではありません。矢印は、ベクトルを見えるようにした表し方のひとつです。ベクトルの本質は、多次元の量を扱うことです。ひとつの数では表せないものを、複数の数のまとまりとして表す。それがベクトルです。
AIは、ことばや画像や音を、このベクトルとして扱います。つまり、特徴のリストとして表します。たとえば、あることばを、意味、文脈、使われ方、近いことばとの関係などを含む、多次元の数のまとまりとして表します。これが、AIにおけるベクトルです。
そして、そのベクトルを別の形に変えるしくみが「行列」です。行列というと、日常では「人が列に並ぶこと」を思い浮かべるかもしれません。数学でいう行列 (matrix) は、数字を縦横表の形をした「変換機」です。ベクトルを入れると、別のベクトルに変換されて出てくる。
中学の一次関数では:
x → a をかける → y
でした。これが、AIでは:
特徴のリスト → 変換表で変える → 新しい特徴のリスト
になります。
この変換を一回ではなく、何層にも重ねます。これがニューラルネットワークです。すると、最初はただの文字の並びだったものが、文脈の手がかりになり、意味の関係になり、次に来ることばの予測につながっていきます。
中学の一次関数なら、ひとつの x に、ひとつの a をかけて y を出します。AIでは、x はひとつの数ではありません。ことばや画像や音を表す、数千、数万次元のベクトルです。そして、a もひとつの数ではありません。行列や重みと呼ばれる、大量の変換のしくみです。
AIに「AIって何?」と短く聞いた時でも、内部では大量の計算が走っています。入力文はトークンに分けられ、ベクトルに変えられ、何層もの変換を通ります。そして、次に来ることばの候補が確率で並べられ、その中からひとつが選ばれます。ひとつ選ばれるたびに、また次のことばを計算します。
現在のAIでは、重みづけ、つまり調整の数字が、数百億、数千億という規模になるものもあります。中学の一次関数とは、規模が違います。しかし、基本は同じです。入力があり、変換があり、出力がある。
AIは、中学で習う関数の考え方を、とてつもなく大きくしたものです。ベクトルで多次元の特徴を扱い、行列で変換し、確率と統計で次を予測し、機械学習で調整する。規模は違うけれど、原理は同じ線の上にあります。

Connect the dots. It becomes a system. (点をつなぐと、しくみに見える)
⑨ なぜ、AIは魔法の箱に見えるのか
AIは、入力→変換→出力のしくみです。中学で習う関数の考え方からつながっています。それでも、AIは魔法の箱のように見えてしまいます。
理由は、AIの知識がないからではありません。学んだことを、つなげて考える機会が少ないからです。
⚫︎ 関数は、x と y の話
⚫︎ ベクトルは、図形の矢印の話
⚫︎ 行列は、縦横の話
⚫︎ 確率は、サイコロやくじの話
⚫︎ 統計は、平均や偏差値の話
⚫︎ 学習は、テストや成績の話
それぞれは習っている。でも、バラバラのまま。一本の線でつながっていない。
⚪︎ 関数は、入力と出力
⚪︎ ベクトルは、多次元の量
⚪︎ 行列は、量の変換
⚪︎ 確率は、可能性と予測
⚪︎ 統計は、傾向とばらつき
⚪︎ 学習は、ズレの自己修正
これらを一本につなげたら、AIにたどり着きます。
入力を受け取り、多次元の量にし、行列で変換し、確率で次を予測し、統計で傾向とばらつきを見ながら、ズレを小さくするように自己修正していく。
AIは、学校で学んだ知識の断片が、ひとつのしくみとして組み合わさったものです。
そして、それは、あなたがふだんやっている練習やプラクティスとも似ています。入力し、変換し、出力し、ズレを小さくするように調整する。この基本の流れは、人間もAIも同じです。
じぶんのプラクティスとつなげて考えると、AIは外にある魔法の箱ではなくなります。入力、変換、出力、修正という流れを持ったしくみとして見えてきます。

Know the principle. Use it wisely.(原理を知って賢く使う)
⑩ 原理はある。でも、全過程は追いきれない。
AIは、人間が設計したしくみです。アルゴリズムも、学習の方法も、モデルの構造も、人間が考えてつくってきました。ただ、人間がつくったからといって、その中で起きていることを人間がすべて追えるわけではありません。
Geoffrey Hinton博士は、現代AIの基礎をつくった代表的な研究者です。そのHinton博士でさえ、AIについて、人間はアルゴリズムを設計したが、AIが実際にどうふるまうのかは完全には見通せない、と率直に語っています。
AIにも基本原理はあります。入力を数のまとまりに変える。何層にも変換する。確率的に次の候補を選ぶ。誤差を小さくするように学習する。ここまでは説明できます。
これは「何もわからない」という意味ではありません。車が人間より速く走ることに、私たちは驚きません。車がどういう原理で走るかを、完全な部品レベルで知らなくても、燃料や電気を使い、エンジンやモーターで動力に変え、車輪を回すという基本は理解できます。コンピュータも同じです。電子の速度で計算するため、人間には到底追えない量の処理を瞬時に行います。
しかし、ある一つの質問に対して、なぜその一語が選ばれ、その次にその一文が続いたのかを、人間がすべてたどることはできません。計算が巨大すぎるからです。
つまり、AIは「原理がわからない神秘」ではありません。原理はわかるが、全過程は追いきれない。そういう巨大な関数です。
だからこそ、基本を知る意味があります。AIに何ができるのか。何ができないのか。どこから先は推定なのか。何が入力されていなければ答えられないのか。そうしたことを見分けるためには、AIが魔法ではなく、入力と出力の関係を学習したしくみだと知っておく必要があります。
AIをわかるとは、AIのすべてを見通すことではありません。原理としてわかることと、計算が巨大すぎて追いきれないことを分けることです。そこから、AIをただ信じるのではなく、使い方を考えることができます。
⑪ まとめ:AIは代わりに生きてはくれない
AIとは、入力を受け取り、内部で変換し、出力を返す巨大な関数です。ことばをベクトル空間に置き、多層の計算で変換し、次にふさわしいことばを確率的に順次生成します。出口では、それが文章として現れます。
人間のように考えているのではありません。しかし、人間にはそのように見えます。その「考えているように見える」人工的なしくみこそが、AIです。
AIには身体がありません。それはもとよりです。ことばのやりとりにおいても、人間なら自然にしているふるまいが、そのまま備わっているわけではありません。
黙ってうなずく。
「あ、それそれ」と、相手の言葉をいっしょに見つける。
答えを急がず、問いをそのまま抱えて待つ。
AIがそうした反応を返すことはできます。しかし、それは人間のように気配を感じているからではありません。そう見える言葉を、入力に応じて生成しているのです。
AIをわかるとは、AIに依存することではありません。入力と出力の関係を見つめ、じぶんが何を入れ、何を受け取り、それをどう行動に変えるかを考えることです。
AIは、人間の代わりに生きるものではありません。人間が問い、受け止め、使い、行動に変えることで、はじめて意味を持つ道具です。

No one can live in my stead. (じぶんの代わりには、だれも生きられない)
補足A:共創AIは、あなたのデータから始まる
AIは、入力されていないことを知ることができません。テキストでプロンプトを入れなければ、AIにはあなたの呼吸、声の調子、表情、間、迷い、ふるまいはわかりません。あなたが何を試し、どこでつまずき、どう直そうとしたのかも、記録されなければ学習のしようがありません。
人間の活動の多くは、意識されないところで起きています。声の出し方、間の取り方、身体の反応、ためらい、くり返し、失敗のしかた。テキストとして考えて入力するものは、そのごく一部です。だから、一般的なAIは、文章づくりや情報整理には強くても、あなた固有の変化や、かけがえのない経験そのものには、まだ十分に近づけません。
エンパシームは、そこに取り組むためのしくみです。肉声の特徴を捉え、可視化し、視覚化します。声の長さ、強さ、リズム、間、変化を、見える形にします。また、結果だけでなく、日々のふるまい、続け方、つまずき、変化の流れも〈見える化〉します。
大切なのは、スコアだけではありません。結果だけを見ても、その人がどのように変わったのかは見えません。どこで失敗したのか。どう直そうとしたのか。何度くり返したのか。どんな言葉に励まされたのか。どんな時に続き、どんな時に止まったのか。そうしたプロセスに、その人固有の学びがあります。
つまり、かけがえのないあなた固有のことについてAIの助けを得るには、あなた自身のプラクティスが必要です。あなたの声、ふるまい、くり返し、気づき、変化がデータになります。そのデータがあってはじめて、AIは一般論ではなく、あなたに近い手助けに近づくことができます。
ここでいう共創AIとは、AIが一方的に答えをくれるものではありません。あなたが実践し、その結果や過程を残し、AIがそれを映し返し、次の実践につなげる。あなたとAIがともにデータをつくり、ともに学びの場をつくるものです。
単にAIを使うだけではありません。プラクティスを通して、親身になってくれるAIそのものを育てていく。あなたの声、あなたのふるまい、あなたの変化が、AIにとっての新しい入力になります。そして、その入力が蓄積されることで、AIは少しずつ、あなたの学びや変化に寄り添えるようになります。
エンパシームは、見えにくい声やふるまい、変化の流れを見える形にするしくみです。声をうつす。ふるまいをうつす。変化をうつす。そうすることで、じぶんのプラクティスをふりかえり、次の行動につなげる手がかりをつくります。
参考:
⚫︎ エンパシームは、Rhythm Mirror®、Hearing Mirror®、Context Mirror®、Empathy Interface®、Empathetic AI KurageSan®などを活用し、声、ふるまい、変化の流れを〈見える化〉します。エンパレットは、サイエンス・アート・テクノロジー・プラクティスをつなぐ学びのコンテンツと創作の場として活用します。

補足B:偶然出会ったことばが、あなたのふるまいになるまで
AIのしくみは、入力 → 変換 → 出力 です。人間の実践にも、似た流れがあります。
ことば、声、出会い、出来事が入り、心と身体の中で変わり、ふるまいとして外に現れます。その流れを、次のように見ることができます。
ひらめき(Inspiration) → ねがい(Aspiration) → 行動(Perspiration) → 気づき(Abduction)
⚫︎ Inspiration:外から入ってくるひらめき。偶然、出会うことば。誰かの声、出来事、風景、読んだ一文。毎日の営みの中で、ふいに入ってくるもの。
⚫︎ Aspiration:それを、じぶんの内から発するねがいに変えること。「こうありたい」「やってみたい」「もう一度試したい」という内側の動き。心の中で、Inspiration が Aspiration に変換される。
⚫︎ Perspiration:そのねがいが、身体を通ってふるまいになること。声に出す。書く。歩く。練習する。つくる。続ける。文字通り、汗をかくこと、努力の発揮です。
⚫︎ Abduction:あとから遡って気づくこと。なぜ、あのことばが心に残ったのか。なぜ、あの時、やってみようと思ったのか。点と点をつなぎ、意味に気づくこと。
共創AIとは、AIに答えを出してもらうだけではありません。じぶんが出会い、ねがい、ふるまい、ふりかえる。その実践の流れを、AIとともに見えるようにしていくことです。
Aspiration の語根には、「息」があります。同じ仲間に inspiration, respiration, perspiration, spirit があります。Inspiration は、息を吹き込まれること。そこから、ひらめき。Respiration は、呼吸。くり返し、整え、続けるリズム。Perspiration は、汗をかくこと。皮膚を通して息がにじみ出る、という感覚。Spirit も、もとは息、生命の息です。息は、ただの空気ではなく、いのちの動きとして感じられてきました。

補足C: AIの先人
AIは、数学をベースに、統計学、機械学習、コンピュータサイエンス、そして人間の目的が重なって働くしくみ。
⚫︎ 関数(入力と出力の関係を表す)
⚫︎ 線形代数(ベクトルと行列で、多次元の量と変換を扱う)
⚫︎ 確率・統計(不確実な中で、次に何が起きそうかを考える)
⚫︎ 機械学習(データから、重みや特徴表現を自動的に調整する)
⚫︎ コンピュータサイエンス(膨大な計算を実際に動かす)
⚫︎ ビジネス・教育・医療・社会の現場など(AIを何のために、どう使うかを考える)
AIにつながる先人たちを、ここではいくつかの流れに分けて見てみます。もちろん、ここに挙げるのはごく一部です。ほかにも多くの先人の発明があります。
❶ 関数と変換の流れ
⚫︎ルネ・デカルト:座標の発明。図形を数で表す道を開いた。
⚫︎ゴットフリート・ライプニッツ: 微積分と関数の発明。変化する量どうしの関係を数学で扱った。
⚫︎レオンハルト・オイラー: 関数記法 f(x) の普及。関数を数学の中心的な道具にした。
❷ ベクトルと行列の流れ
⚫︎ヘルマン・グラスマン:多次元量の数学化。ベクトル空間につながる考えを開いた。
⚫︎ジェームズ・シルベスター:matrix という言葉の導入。行列を数学の対象として扱う道を開いた。
⚫︎アーサー・ケイリー:行列計算の体系化。行列を変換の合成として扱えるようにした。
❸ 確率と統計の流れ
⚫︎トーマス・ベイズ:確率更新の考え。新しい情報によって見方を更新する道を開いた。
⚫︎ピエール=シモン・ラプラス:確率的推論の発展。不確実な世界を数学で扱った。
⚫︎カール・フリードリヒ・ガウス:誤差と正規分布の数学化。測定と推定の基礎を築いた。
⚫︎ ロナルド・フィッシャー:現代統計学の基礎。データから推定し、比較し、判断する方法を体系化した。
❹ 計算機とアルゴリズムの流れ
⚫︎アラン・チューリング:計算概念の定式化。コンピュータ理論の基礎をつくった。
⚫︎ジョン・フォン・ノイマン:コンピュータ構成の定式化。プログラム内蔵型コンピュータの基礎を築いた。
⚫︎クロード・シャノン:情報理論の創始者。情報を数学で扱う方法をつくり、通信、符号化、計算、AIにつながる基礎を築いた。
❺ 機械学習と深層学習の流れ
⚫︎フランク・ローゼンブラット:パーセプトロンの発明。ニューラルネットワークの原型を示した。
⚫︎デイヴィッド・ラメルハート、ジェフリー・ヒントン、ロナルド・ウィリアムズ:
誤差逆伝播の確立。ネットワークが誤差から学ぶ方法を示した。⚫︎ヤン・ルカン、ヨシュア・ベンジオ、ジェフリー・ヒントン:
深層学習の確立。多層ニューラルネットワークを現代AIの中心にした。⚫︎トマス・ミコロフら:Word2Vec の発明。ことばをベクトル空間で扱う方法を広めた。
⚫︎アシシュ・ヴァスワニら:Transformer の発明。現在の大規模言語モデルの基盤をつくった。
出典・参照:以下の論文、エンパレットなど
(1) 深層学習の全体像
Yann LeCun, Yoshua Bengio, Geoffrey Hinton “Deep Learning” Nature, 2015
https://www.nature.com/articles/nature14539
深層学習とは何かを大きく整理した代表的な総説論文。多層のニューラルネットワークが、画像、音声、ことばなどのデータから特徴表現を学習できることを示し、現代AIの全体像を位置づけています。
(2) 誤差を小さくして学習する(back-propagation)
David E. Rumelhart, Geoffrey E. Hinton, Ronald J. Williams “Learning representations by back-propagating errors” Nature, 1986 https://www.nature.com/articles/323533a0
ニューラルネットワークが、自分の出した答えと望ましい答えのズレを測り、その誤差が小さくなるように内部の重みを調整する方法を示した重要論文(誤差逆伝播)。本文の「やってみる、ズレを知る、直す、くり返す」に対応します。
(3) ことばをベクトル空間に置く(Word2Vec)
Tomas Mikolov, Kai Chen, Greg Corrado, Jeffrey Dean “Efficient Estimation of Word Representations in Vector Space” arXiv, 2013 https://arxiv.org/abs/1301.3781
単語を、意味の近さや関係を計算できるベクトルとして表す方法を示した論文。単語の意味を辞書的な説明として持つのではなく、文脈の中でどのことばと近く現れるかによって、数のまとまりとして表します。本文の「ことばをベクトル空間に置く」という説明の中心にあります。
(4) 予測と文脈計算の基盤(Transformer)
Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Łukasz Kaiser, Illia Polosukhin “Attention Is All You Need” NeurIPS, 2017 https://arxiv.org/abs/1706.03762
現在のLLMの基盤となった Transformer を提案した論文。文章の中で、どのことばがどのことばに関係しているかを attention によって計算します。論文では、再帰構造や畳み込みを使わず、attention mechanism を中心にした Transformer を提案したと説明されています。ChatGPT、Gemini、Claude などの大規模言語モデルの基礎にあります。
(5) Hinton博士について
Geoffrey Hinton博士は、現代AI、特に深層学習の基礎をつくった代表的な研究者です。John Hopfield博士とともに、人工ニューラルネットワークによる機械学習を可能にした基礎的発見と発明によって、2024年のノーベル物理学賞を受賞しました。また、Yoshua Bengio博士、Yann LeCun博士とともに、深層ニューラルネットワークを現代コンピューティングの中核にした功績で、2018年のチューリング賞も受賞しています。
