スピードテスト.jp ニュース なぜChatGPTは計算が苦手なのか?数学的ミスの秘密を解明

なぜChatGPTは計算が苦手なのか?数学的ミスの秘密を解明

人工知能は詩を書くことができるが、数学は苦手だ。なぜChatGPTや他のチャットボットは基本的な計算さえもできないのか?AIの数学的ミスの原因を、数字を理解できない断片に分解するトークン化から、数学において失敗する統計的アプローチまで解明します。

なぜChatGPTは計算が苦手なのか?数学的ミスの秘密を解明

人工知能、例えばChatGPTは詩を書いたり音楽を作ったりテキストを翻訳したりできます。それでも、単純な数学的問題でつまずくことがあります。なぜ複雑な言語課題を処理できるチャットボットが、小学校レベルの数学に苦労するのでしょうか?

トークン化:数字がバラバラになるとき

主要な問題の一つはトークン化です。このプロセスはデータを小さな単位、いわゆるトークンに分割します。これを単語を音節に分解するパズルのように考えてみてください。しかし、このプロセスを担うAIモデルのトークナイゼーションは数字の意味を理解していません。

例えば、数字の380は1つのトークンとして認識され、381は2つ(38と1)として認識されることがあります。その結果、数字の関係が崩れ、計算が複雑化してしまうのです。

数字に戸惑う統計的マシン

ChatGPTの数学的問題のもう一つの理由は、その統計的性質です。Chatbotは膨大な例をもとに学習し、パターンを見つけ出そうとします。例えば、「拝啓」と「この度」というフレーズが頻繁に続くことを学びます。

しかし、数学ではこのアプローチは問題に遭遇します。ChatGPTは、数が2で終わる場合に積が4で終わることを推測できますが、中間結果には対処できません。簡単に言えば、ChatGPTのモデルは正確な計算を行う代わりに、学習したパターンから結果を推測しようとするのです。

乗算という名の挑戦

ウォータールー大学のデング・ユンティアンによる研究は、ChatGPTが四桁を超える数の乗算に問題があることを示しました。計算のどのステップでもエラーが最終結果に現れるためです。

これをドミノ効果のように想像してみてください。一つのエラーが連鎖反応を引き起こし、結果が完全に外れてしまいます。しかし、将来的にChatGPTが改善される可能性があります。デングとその同僚は、論理的思考力を持つOpenAIの新しいモデルo1もテストしました。

このモデルは標準的なGPT-4oモデルよりもかなり良い結果を出し、9桁の数の乗算も正確に解決しました。モデルo1は問題を一歩一歩考えていくため、より正確な結果を出すことができるのです。

エロン・マスクとxAIは、新たな強力なAIモデルであるGrok 3を発表しました。このモデルはGPT-4oのような競合を超えています。Grok 3は、DeepSearchやベータ版の音声モードといった強化された機能をもたらします。さらにモデルは、前任者に比べて10倍の計算能力を活用しており、Xネットワークのユーザーに提供されています。

Appleは、フラッグシップモデルよりも低価格で高度な人工知能(AI)機能を備えた新しいiPhone 16eを導入しています。同社の高価なiPhoneにも搭載されているA18プロセッサを装備しており、高度なアプリケーションやゲームを処理する性能を提供します。主な魅力は、写真編集ツール、クイック検索、ChatGPTを含むApple Intelligenceの統合です。

家庭内のスマートデバイスの増加に伴い、セキュリティリスクも増加しています。スマート電球、ドアベル、冷蔵庫は親友よりも多くのことを知っています。スマートホームの快適さを楽しみながらプライバシーを守る方法をお伝えします。

人工知能はもはやSFの話ではなく、私たちにはいくつかの賢い助手が選べます。その中でも、ChatGPTと新人のDeepSeekがユーザーの注目を集めています。両者の違いは何でしょうか?どちらが最善でしょうか?

Code.orgスタジオは人気のあるオンラインツールで、子供たち(そして大人も)に楽しくインタラクティブなプログラミングレッスンのアクセスを提供します。ビジュアルブロックコマンドを使用して、アニメーション、ゲーム、およびアプリケーションを簡単に作成し、論理的思考を発展させ、創造性を強化します。

Kodu Game Labは、子供たちがビジュアルブロックコーディングを使用して独自のゲームを作成できる革新的なプラットフォームであり、ゲームデザインの実験、創造力、論理的思考の発展を支援します。