ChatGPT が世界を理解できない場合、人類を滅ぼすことができますか?
大規模言語モデル (LLM) の幻覚、その不安定性、解釈可能性の欠如についてよく議論されている問題に、有害なコンテンツの生成を強制する自動化された敵対的攻撃に対する脆弱性を追加できるようになりました。 しかし、これらは彼らの弱点の中でもほんのわずかです。 LLM が「超知性」になる前に、LLM が乗り越えなければならないのは、人間の世界に対する理解の深さです。
しかし、ChatGPTの作成者であるOpenAIによれば、この「人類がこれまでに発明した中で最も影響力のあるテクノロジー」は「この10年に到来」し、「人類の絶滅につながる」可能性があるという。
サポートサービスコンセプトのチャットボットサイン。
人間のような AI がもうすぐそこまで来ているということは、すでに何年も前に聞いていました。 1960年代後半にテリー・ウィノグラードが大学院に入学した当時、ほとんどの[知的で知識のある人間]は、「機械が見たり、聞いたり、話したり、動かしたり、その他人間のような仕事を実行するようになるまで、そう長くはかからないと信じていた」とジョン・マルコフは書いている。慈悲の機械で。
MIT での博士論文のために、ウィノグラードは SHRDLU を開発しました。これは、おもちゃのブロックとそれを動かすための「グリッパー」で構成される「マイクロワールド」という、でっち上げられた世界についての会話に参加できるコンピューター プログラムです。 グリッパーを使ってブロックを操作するという英語のコマンドに応答し、世界の状態に関する質問を「理解」しました。
ニルス・ニルソンは、人工知能の歴史の中で、SHRDLU の目覚ましいパフォーマンスによって一部の NLP 研究者が「将来の成功について楽観的」になったと述べています。 しかし、「ウィノグラードはすぐにこの分野の研究を放棄し、コンピューターと人間の相互作用に特化した研究を追求することにしました。 おそらく彼は、ブロックの世界のような単純なもので言語を理解するにはどれだけの知識が必要かを直接経験していたので、人間の言語能力の全範囲を再現するのに十分な知識をコンピュータに与えることには絶望していました。」
その後、2006 年にウィノグラード氏は、統計的言語理解、ニューラル ネットワーク、機械学習が AI 分野を人間とコンピューターの相互作用に対する彼の好むアプローチの方向に動かす新たな発展であると認識しました。 「賢明な試行錯誤は完璧な知性の計画を上回る」がこのアプローチの中心であり、「現実の人間世界の複雑さを知り、モデル化することの限界」を認めていると彼は書いた。
特に 2012 年の画像識別の分野における AI への統計分析アプローチのさらなる勝利により、知的で知識のあるほとんどの人間は、人間のような機械知能、さらには「超知能」が再びすぐそこまで来ていると信じるようになりました。
ほとんどですが、すべてではありません。 新しい AI の知能に疑問を抱く人々が使用する人気のあるツールの 1 つは、Winograd Schema Challenge として知られるようになりました。 これは、ウィノグラードの 1972 年の『Understanding Natural Language』で言及された意味論的曖昧さの例に基づいて、トロント大学の Hector Levesque が 2010 年に発案したものです。 「チューリング テスト」の限界を克服するために、レベスクは、ステートメント内のあいまいな代名詞を正しく解決することを要求する多肢選択テストを提案しました。 例えば、
茶色のスーツケースは大きすぎるため、トロフィーは入りません。 何が大きすぎるのでしょうか?
A. トロフィー
B. スーツケース
「この挑戦は、研究コミュニティと一般的な科学報道機関の両方からかなりの好意的な関心を集めました。 この問題は自然なものであるため、AI システムにとっては公平な問題でした。 関与する推論の複雑さにより、当時の現在のテクノロジーの範囲をはるかに超えていたようです」と「ウィノグラードスキーマチャレンジの敗北」(2023年1月)の著者らは書いている。
実際、2016 年に開催された「最初で最後の Winograd Schema Challenge の実行」では、参加した 6 つの AI プログラムのうち最も成功したプログラムが、テスト コレクションで 58% のスコアを達成しましたが、これは偶然よりわずかに優れているだけでした。 同年に開催された第 1 回オライリー AI カンファレンスでは、まもなく登場する「超人的な」無人運転車について話す人もいましたが、ディープラーニングのパイオニアであるヤン・ルカン氏を含む他の人は、ウィノグラード・スキーマをテストにおける未解決の課題として言及しました。世界がどのように機能するかについての機械の知識。