言語生成AIによる国語力低下というミスリード ~その技術的陥穽からみた言語スキルの行方~ (IISIA研究員レポート Vol.113)
今年(2023年)、我が国の企業では「ChatGPT」などの言語生成AIが続々と導入されている。たとえば、三井化学は化学素材の新たな用途を見つけ出すために「ChatGPT」を導入し、三井住友フィナンシャルグループは書類の作成などに援用することを目的に、日本マイクロソフトの協力を得て独自の言語生成AIを開発している(参考)。
また、企業だけではなく、官公庁にも導入の動きが広がっている。東京都庁は「ChatGPT」を今年(2023年)8月から全ての部局の業務に導入し、業務マニュアルの要約やQ&Aの作成などに使用するとのことである。さらに、小池百合子東京都知事は都議会で「様々な行政分野で活用を進める」と答弁した(参考)。
さらに、同様の流れは教育現場にも波及し、我が国の小中学校の理科や道徳の授業に導入されている。愛媛県の愛媛大学教育学部附属中学校では、理科の授業で教師は生徒に、授業の終盤で実験の成果や疑問などを「ChatGPT」に質問するように促した。この背景として、従来は教師が生徒一人一人にコメントを返すことで時間的コストがかかっていたことがあり、「ChatGPT」の導入によってかなりの時間短縮になり、生徒の側としても質問のハードルが下がるなど良い面も大いにあるという。しかしながら、言語生成AIが作成したコメントには誤りが含まれていることもあり、教師によるダブルチェックが必須だということである。
他方で、東京都の東京学芸大学附属小金井小学校では、道徳の授業で言語生成AIを取り入れた。「転校した友達から届いたはがきが料金不足だったことを友人に伝えるかどうか、悩む」というテーマで、「伝えるか、伝えないか」を児童が考えた後、言語生成AIに意見を聞き、回答に対して質問を繰り返すことで、友人への伝え方に結論を出すことができたという。さらに、北海道の函館市立万年橋小学校では、学芸会の出し物として劇を行うため、学級活動の時間に台本を言語生成AIに作らせたという事例がある。教師によると、劇や音楽などの構成をクラスでの話し合いで決めるのは時間がかかり、言語生成AIによって時間短縮ができることがメリットであり、オリジナリティはその後児童たちがクラスで起きた出来事を組み合わせることで担保できるということである(参考)。
(図表:言語生成AIが作成した劇の台本)
(出典:NHK)
我が国において言語生成AIの導入が加速する中で、先月(5月)に文部科学省で生成AIの教育現場での取り扱いについての議論がなされた。文部科学省は、専門家会議や政府全体の議論を踏まえ、使用に適切な年齢や禁止すべき場面、仕組みや活用法を学ぶ授業のアイディア、教員の校務の負担軽減などについてのガイドラインを今年(2023年)夏頃までに作成する予定である(参考)。
他方で、言語生成AIを巡っては、その使用による「言語能力の低下」を懸念する声もある。ある高校の国語教師は、「言語生成AIの登場で、もはや文章を書く力は必要なくなり、言語生成AIに何でも依頼すればいいと考える学生が増えているのではないか」と危惧している(参考)。
東京都教育委員会は、今月(6月)13日に、生成AIを児童らが使うことについて「知識や思考力が十分に身についていない状態で使うと、不正確な回答を信じたり、より深く考える機会を逸してしまったりする可能性が識者から指摘されている」とし、宿題を出す際、言語生成AIの回答をコピーして提出することのないよう、児童生徒への注意喚起が必要であるとの留意点を挙げた通知を都立学校に出した(参考)。
言語生成AIの使用と国語力、つまり言語表現能力の低下を結び付ける論は枚挙に暇がないが、実際に言語生成AIは国語力の低下を招くのだろうか。それに関して議論するには、そもそもどのようにして言語生成AIは機能しているかを知っておく必要がある。
言語生成AIの仕組みについて触れていく。言語生成AIは生成系AIの一種である。生成系AIモデルは、ニューラルネットワークを使用して大規模なデータセットからパターンを識別し、新たなオリジナルのデータまたはコンテンツを生成する(参考)。
その中でも「ChatGPT」などの言語生成AIは、「大規模言語モデル(LLM)」に基づく対話システムである(参考)。そもそも言語モデルとは、テキスト(文章)を予測することを中心としたコンピュータ・モデルであり、入力としていくつかのテキストが与えられると、出現の順序における各単語の確率を割り当てるものである。全ての言語モデルは、パラメータと呼ばれる入力テキストの特徴を認識するように訓練される。「大規模言語モデル(LLM)」の正体は、数十億個という非常に多くのパラメータから学習する言語モデルである(参考)。
多くの大規模言語モデルは、トランスフォーマーと呼ばれるニューラルネットワーク・アーキテクチャを使用している。このニューラルネットワークによって、過去の試行錯誤の結果などの様々な要因に基づいて、データの解釈や意味づけの方法を継続的に調整していくのである(参考)。
それゆえに、言語生成AIは、無から有を作り出しているわけではなく、大規模なデータからしらみつぶしに学習し、出力しているというわけなのである。つまり、入力以上の画期的でクリエイティヴな文章を生成しているというわけではない。
(図表:大規模言語モデル(LLM)の仕組み)
(出典:HC)
重要なのは、「ChatGPT」はInstructGPTをベースとしたモデルであり、そのInstructGPTの特徴は、人間のフィードバックをもとにモデルを学習させるという点である(参考)。
以上の事実を踏まえ、このようなことが考えられないだろうか:
人間が入力を与え、「ChatGPT」が出力し、その出力に対して人間がフィードバックをする。そして、その入力をもとにさらに、「ChatGPT」が出力をする…というサイクルで「ChatGPT」により良い出力を求めるということになってくると、入力する側、つまり使い手である人間側も向上を求められるのだ。
「ChatGPT」をはじめとした言語生成AIとそれを使う人間の関係は、部下と上司の関係に例えることができよう。仕事を始めたてで右も左も分からない部下に仕事を振るが、指示以上のことまではしてもらえない。つまり、人間の入力に対して出力を返す言語生成AIは、人間による入力以上に良い答えを返すことはない。言語生成AIの出力を向上させるためには、人間によるフィードバックが必要であり、そのフィードバックもより良いものにならなければならない。したがって、使う側の国語力やリテラシーが高くなければ言語生成AIを使いこなすことができない。
また、我が国企業においてはMicrosoft Office 365の方がGoogle Workplaceよりも2倍のシェアを占めており(参考)、日本語と大規模言語モデル(LLM)の関係の点からも、米系企業開発の生成AIを使う際に事前学習データとしてのGoogle経由の日本語データには限界があるため、日本人が直接言語生成AIを使うことで日本語データを学習させる必要がある運びとなる。
すなわち、今次の言語生成AIの興隆は、国語力低下の危機を招くどころか、新たなクリエイティヴィティを求めて使い手が国語力を伸ばし続ける流れを生む可能性が大いにあるのである。
グローバル・インテリジェンス・グループ リサーチャー
笠作 記史 記す
*本コラム内にある見解は、弊研究所の一致した見解ではなく、執筆者個人の見解を示すものである。
<無料メルマガ>
弊研究所についてより詳しく知りたい方は、こちらより是非、無料メルマガにご登録ください。
<コラムに関するアンケート>
こちらよりコラムに関するアンケートへご回答いただけますと幸いです。アンケートにご回答いただいた方に、弊研究所の分析ラインをまとめた「IISIAの見解」を無料でもれなくプレゼントいたします。
<これまでのコラム>