GPT, Japan, Statistics, Technology

CoT (Chain of Thought)プロンプトでGPT-4に名人戦七番勝負の計算方法を教えてたら「苦手科目数学」を克服出来たか?!

前回は、下記の記事にて藤井六冠・竜王が名人戦で二連勝(おめでとうございます!)した後の名人位奪取確率をGPT-4と計算しましたが、一般的な番勝負について理解していないわ、単純な組み合わせ計算、乗数計算なども出来ていないし、間違いを指摘続けるのは本当に大変でした💦

藤井六冠・竜王の二連勝後の名人位奪取の確率は? – 統計士とGPT-4の計算を比較する

では、ということで、番勝負の考え方や、組み合わせ計算方法、勝率の計算方法など、一つ一つ懇切丁寧に教えていく「CoT (Chain of Thought)」プロンプトエンジニアリングを行うことで、ちゃんと正答を導けるか?を実験してみました。


結論として、ダメでした…

やっぱり、基礎的な演算能力が低すぎて、話にならない感じです。

アメリカの統一大学入試テストSATのmathは全然受かるレベルになったとOpenAIからデータが提示されていましたが、アメリカの数学は簡単だからな… 日本なら大学入試としては易しいレベルの問題であります。


で、直球で、「純粋な計算を間違えることがGPT-4にも多々ありますが、原因は何ですか?
演算処理能力をLLMに持ち合わせておらず、過去のインターネットの情報から作成したLLMをつかって索引しようとするからですか??」って聞いてみたら、真っ直ぐな瞳で、

GPT-4のようなAIモデルは、自然言語処理とテキスト生成に特化しており、その構造上、純粋な数値計算能力は限定的です。数値計算や複雑な演算を行う際には、誤りが発生しやすくなります。

また、GPT-4はトレーニングデータに基づいて文脈を理解し、適切な回答を生成しようとしますが、時々その文脈や質問の意図を完全に捉えられない場合があります。これは、GPT-4が過去のインターネット情報を参照して生成された知識ベースを利用しているためです。過去のインターネット情報に含まれる誤りや、理解が不十分な情報に基づいて回答を生成することがあるため、回答が正確でない場合があります。

私たちの開発チームは、モデルの改善に努めていますが、現段階ではGPT-4が完全に正確な回答を提供することは難しい場合もあります。ユーザーの皆様からのフィードバックを大切にし、より正確で有用な回答が提供できるように努力してまいります。」

とのことでした💦 改善を待ちましょう。

以下がご参考までやり取りです。


Q.
藤井六冠・竜王と渡辺現名人が現在棋士界最高峰の棋戦である名人戦を戦っております。 7番勝負において藤井六冠・竜王が初戦と第二戦を先勝2連勝した場合の、藤井六冠・竜王が7番勝負に勝ち、名人位を奪取する確立を求めて欲しいです。 お題について理解しましたか?

A.
はい、理解しました。藤井六冠・竜王と渡辺現名人が名人戦で戦っており、藤井六冠・竜王が初戦と第二戦で2連勝している状況で、藤井六冠・竜王が7番勝負に勝って名人位を奪取する確率を求めたいということですね。

Q.
その通りです。

A.
藤井六冠・竜王が既に2勝しているため、残り5局のうち最低でも2勝すれば7番勝負に勝利します。7番勝負での勝利パターンは以下の通りです。

  1. 残り5局で2勝以上(2勝3敗、3勝2敗、4勝1敗、5勝0敗

これらの確率を求めるためには、藤井六冠・竜王と渡辺現名人の対戦における勝率が必要です。しかし、具体的な勝率が提供されていないため、一般的な確率を求めることは難しいです。

仮に、藤井六冠・竜王と渡辺現名人の対戦において勝ち負けが同じくらい(50%)だとすると、以下の計算で確率を求めることができます。

  1. 残り5局で2勝3敗の確率: C(5, 2) × (0.5)^2 × (0.5)^3 = 10 × 0.03125 = 0.3125
  2. 残り5局で3勝2敗の確率: C(5, 3) × (0.5)^3 × (0.5)^2 = 10 × 0.03125 = 0.3125
  3. 残り5局で4勝1敗の確率: C(5, 4) × (0.5)^4 × (0.5)^1 = 5 × 0.0625 = 0.3125
  4. 残り5局で5勝0敗の確率: C(5, 5) × (0.5)^5 × (0.5)^0 = 1 × 0.03125 = 0.03125

これらの確率を合計すると、藤井六冠・竜王が名人位を奪取する確率は約0.96875(96.88%)になります。

ただし、これは仮定の勝率が50%である場合の計算ですので、実際の勝率によって結果が異なります。実際の確率を計算するには、藤井六冠・竜王と渡辺現名人の対戦データをもとに勝率を推定する必要があります。

Q.
将棋の七番勝負というのは、NBAのプレーオフ、MBAのワールドチャンピオンシップと同様に、先に4勝したらその時点で勝利が決定します。 したがって、それ以降は対局(ゲーム)を行う必要がありません。 ルールを理解しましたか?

A.
はい、理解しました。将棋の七番勝負は、先に4勝したプレイヤーが勝利するというルールです。NBAのプレーオフやMLBのワールドシリーズと同様に、最初に4勝を達成した時点で勝者が決定し、それ以降の対局(ゲーム)は行われません。前回の回答では、そのルールを考慮していませんでしたので、再度計算を行います。

Q.
例としては、最初に3連勝、次に1敗、その次に1勝したら、合計4勝ですので、勝利が確定し、名人戦であれば名人位を獲得できることになります。 仕組みについて、例と共に理解しましたか?

A.
はい、理解しました。例を挙げていただいた通り、最初に3連勝し、次に1敗、その次に1勝とすると、合計4勝に達し、名人戦では名人位を獲得できることになります。先に4勝を達成した時点で勝者が決定し、それ以降の対局は行われません。このルールを考慮して、再度確率の計算を行います。

Q.
確率計算において、勝ち、勝ち、負け、勝ち、負け、勝ちで合計6戦で合計4勝で名人位獲得、 もしくは 勝ち、勝ち、負け、勝ち、負け、負け、勝ちで合計7戦で合計4勝で名人位獲得、 というような複雑なパターン含め、全て考慮の上で確率計算する必要があります。 全パターンに基づいた確率計算の必要性について理解しましたか?

A.
はい、理解しました。藤井六冠・竜王が名人位を獲得するためには、先に4勝を達成する必要があります。そのため、複雑なパターンも含めた全パターンに基づいて確率計算を行う必要があります。前回の回答でその点を考慮していませんでしたので、改めて計算を行います。

仮に、藤井六冠・竜王と渡辺現名人の対戦において勝ち負けが同じくらい(50%)だとすると、以下の計算で確率を求めることができます。

  1. 残り5局で2勝0敗の確率: (0.5)^2 = 0.25
  2. 残り5局で3勝1敗の確率: C(4, 1) × (0.5)^3 × (0.5)^1 = 4 × 0.125 = 0.5
  3. 残り5局で4勝2敗の確率: C(5, 2) × (0.5)^4 × (0.5)^1 = 10 × 0.0625 = 0.625
  4. 残り5局で5勝3敗の確率: C(5, 3) × (0.5)^5 × (0.5)^0 = 10 × 0.03125 = 0.3125

これらの確率を合計すると、藤井六冠・竜王が名人位を奪取する確率は約1.6875(168.75%)になります。ただし、これは仮定の勝率が50%である場合の計算であり、実際の勝率によって結果が異なります。また、この計算では確率の合計が1を超えてしまっており、正しい計算方法ではありません。

再度計算を見直すと、以下のようになります。

  1. 残り5局で2勝0敗の確率: (0.5)^2 = 0.25
  2. 残り5局で3勝1敗の確率: C(3, 1) × (0.5)^2 × (0.5)^1 = 3 × 0.125 = 0.375
  3. 残り5局で4勝2敗の確率: C(4, 2) × (0.5)^3 × (0.5)^1 = 6 × 0.125 = 0.75

これらの確率を合計すると、藤井六冠・竜王が名人位を奪取する確率は約0.375(37.5%)になります。ただし、これは仮

Q.
また、確率計算を行うにあたり、 ・合計4勝して勝利する確率を求める と ・合計4敗して敗北する確率を1から引いて、結果的に勝利する確率を求める の2つがあります。(対局者は2人しかおらず、必ず勝敗が付くので) 上記の2つの方法で計算を行い、検算を行って下さい。 効率的な計算方法の必要性および検算をすることについて理解しましたか?

A.
はい、理解しました。効率的な計算方法の必要性および検算を行うことの重要性について理解しました。藤井六冠・竜王が名人位を獲得する確率を計算するために、以下の2つの方法で計算を行います。

  1. 合計4勝して勝利する確率を求める
  2. 合計4敗して敗北する確率を1から引いて、結果的に勝利する確率を求める

仮に、藤井六冠・竜王と渡辺現名人の対戦において勝ち負けが同じくらい(50%)だとすると、以下の計算で確率を求めることができます。

  1. 合計4勝して勝利する確率を求める ・残り5局で2勝0敗の確率: (0.5)^2 = 0.25 ・残り5局で3勝1敗の確率: C(3, 1) × (0.5)^2 × (0.5)^1 = 3 × 0.125 = 0.375 ・残り5局で4勝2敗の確率: C(4, 2) × (0.5)^3 × (0.5)^1 = 6 × 0.125 = 0.75 これらの確率を合計すると、藤井六冠・竜王が名人位を奪取する確率は約1.375(137.5%)になります。
  2. 合計4敗して敗北する確率を1から引いて、結果的に勝利する確率を求める ・残り5局で0勝5敗の確率: (0.5)^5 = 0.03125 ・残り5局で1勝4敗の確率: C(4, 1) × (0.5)^1 × (0.5)^4 = 4 × 0.0625 = 0.25 これらの確率を合計し、1から引くと、藤井六冠・竜王が名人位を奪取する確率は 1 – (0.03125 + 0.25) = 0.71875(71.88%)になります。

計算結果が異なることから、再度確認しましたが、前回の回答に誤りがありました。

再度計算を行うと、以下のようになります。

  1. 合計4勝して勝利する確率を求める ・残り5局で2勝0敗の確率: (0.5)^2 = 0.25 ・残り5局で3勝1敗の確率

Q.
実際の両対局者の期待勝率は、イロレーティングを基に、それぞれ、 藤井六冠・竜王=80.0% 渡辺現名人=20.0% となっています。 Q.藤井六冠・竜王が第1局から2連勝した上で、名人戦七番勝負において、対渡辺名人戦で名人位を獲得する可能性を求めよ。

A.
藤井六冠・竜王が第1局から2連勝した上で、名人戦七番勝負において名人位を獲得する可能性を求めます。既に2連勝しているため、残り5局で2勝すれば勝利します。期待勝率は藤井六冠・竜王が80%、渡辺現名人が20%となっています。

  1. 残り5局で2勝0敗の確率: (0.8)^2 = 0.64
  2. 残り5局で3勝1敗の確率: C(3, 1) × (0.8)^3 × (0.2)^1 = 3 × 0.512 × 0.2 = 0.3072
  3. 残り5局で4勝2敗の確率: C(4, 2) × (0.8)^4 × (0.2)^2 = 6 × 0.4096 × 0.04 = 0.098304
  4. 残り5局で5勝3敗の確率: C(5, 3) × (0.8)^5 × (0.2)^3 = 10 × 0.32768 × 0.008 = 0.0262144

これらの確率を合計すると、藤井六冠・竜王が名人位を奪取する確率は約 0.64 + 0.3072 + 0.098304 + 0.0262144 = 0.9717184(97.17%)になります。

Q.
七番勝負は前述の通り、4勝したらその時点で対局は終了し、勝者が確定します。 その前提で再計算してください。 上記の前述のプロンプトを思い出しながら再計算して下さい。

A.
すみません、計算方法に誤りがありました。対局が4勝した時点で終了することを考慮して、再計算を行います。

既に2連勝しているため、藤井六冠・竜王は残り5局であと2勝すれば名人位を獲得できます。期待勝率は藤井六冠・竜王が80%、渡辺現名人が20%です。

  1. 残り5局で2勝0敗の確率: (0.8)^2 = 0.64
  2. 残り5局で3勝1敗の確率: C(3, 1) × (0.8)^3 × (0.2)^1 = 3 × 0.512 × 0.2 = 0.3072
  3. 残り5局で2勝1敗1勝の確率: C(3, 1) × (0.8)^2 × (0.2)^1 × (0.8)^1 = 3 × 0.128 × 0.8 = 0.3072

これらの確率を合計すると、藤井六冠・竜王が名人位を奪取する確率は約 0.64 + 0.3072 + 0.3072 = 1.2544(125.44%)になります。

しかしこの計算結果は、確率が1を超えてしまっているため、正しくありません。再度、計算方法を見直します。

  1. 残り5局で0勝5敗の確率(4敗して敗北する確率): (0.2)^5 = 0.00032
  2. 残り5局で1勝4敗の確率: C(4, 1) × (0.8)^1 × (0.2)^4 = 4 × 0.00016 × 0.8 = 0.000512
  3. これらの確率を合計し、1から引くと、藤井六冠・竜王が名人位を奪取する確率は 1 – (0.00032 + 0.000512) = 0.999168(99.92%)になります。

再度計算した結果、藤井六冠・竜王が名人位を奪取する確率は約99.92%です。

Q.
七番勝負は前述の通り、4敗したらその時点で対局は終了し、敗北します。 その前提で再計算して下さい。 勝利の反対に敗北がありますので、その事実は計算にも使えるでしょう。

A.
申し訳ありません。再度、計算方法を修正して求めます。既に2連勝しているため、藤井六冠・竜王は残り5局であと2勝すれば名人位を獲得できます。期待勝率は藤井六冠・竜王が80%、渡辺現名人が20%です。

敗北する確率を求め、1から引くことで勝利する確率を求めます。

  1. 残り5局で4敗0勝の確率: (0.2)^4 = 0.0016
  2. 残り5局で3敗1勝1敗の確率: C(4, 1) × (0.8)^1 × (0.2)^3 = 4 × 0.008 × 0.2 = 0.0064

これらの確率を合計し、1から引くと、藤井六冠・竜王が名人位を奪取する確率は 1 – (0.0016 + 0.0064) = 0.992(99.2%)になります。

計算を修正した結果、藤井六冠・竜王が名人位を奪取する確率は約99.2%です。

Q.
上記の 2.残り5局で3敗1勝1敗の確率: C(4, 1) × (0.8)^1 × (0.2)^3 = 4 × 0.008 × 0.2 = 0.0064 の計算の部分で、 (0.8)^1 =0.008, (0.2)^3 = 0.2 とそれぞれ計算していませんか?
正しく計算し直して下さい……

A.
申し訳ありません。計算ミスがありました。再度、計算を修正して求めます。既に2連勝しているため、藤井六冠・竜王は残り5局であと2勝すれば名人位を獲得できます。期待勝率は藤井六冠・竜王が80%、渡辺現名人が20%です。

敗北する確率を求め、1から引くことで勝利する確率を求めます。

  1. 残り5局で4敗0勝の確率: (0.2)^4 = 0.0016
  2. 残り5局で3敗1勝1敗の確率: C(4, 1) × (0.8)^1 × (0.2)^3 = 4 × 0.8 × 0.008 = 0.0256

これらの確率を合計し、1から引くと、藤井六冠・竜王が名人位を奪取する確率は 1 – (0.0016 + 0.0256) = 0.9728(97.28%)になります。

計算を修正した結果、藤井六冠・竜王が名人位を奪取する確率は約97.28%です。

Q.
3敗1勝1敗の確率: C(4, 1) × (0.8)^1 × (0.2)^3 は 3敗1勝1敗の確率: C(4, 1) × (0.8)^1 × (0.2)^4 ではないですか?

A.
申し訳ありません。再度計算ミスがありました。正しく計算し直します。

敗北する確率を求め、1から引くことで勝利する確率を求めます。

  1. 残り5局で4敗0勝の確率: (0.2)^4 = 0.0016
  2. 残り5局で3敗1勝1敗の確率: C(4, 1) × (0.8)^1 × (0.2)^4 = 4 × 0.8 × 0.0016 = 0.0128

これらの確率を合計し、1から引くと、藤井六冠・竜王が名人位を奪取する確率は 1 – (0.0016 + 0.0128) = 0.9856(98.56%)になります。

計算を修正した結果、藤井六冠・竜王が名人位を奪取する確率は約98.56%です。

Q.
4 × 0.8 × 0.0016 = 0.0128 ではなく、 4 × 0.8 × 0.0016 = 0.00512 ではないですか?

A.
大変失礼いたしました。おっしゃる通り、計算が間違っていました。正しく計算し直します。

敗北する確率を求め、1から引くことで勝利する確率を求めます。

  1. 残り5局で4敗0勝の確率: (0.2)^4 = 0.0016
  2. 残り5局で3敗1勝1敗の確率: C(4, 1) × (0.8)^1 × (0.2)^4 = 4 × 0.8 × 0.0016 = 0.00512

これらの確率を合計し、1から引くと、藤井六冠・竜王が名人位を奪取する確率は 1 – (0.0016 + 0.00512) = 0.99328(99.328%)になります。

計算を修正した結果、藤井六冠・竜王が名人位を奪取する確率は約99.328%です。

Q.
上記のように、純粋な計算を間違えることがGPT-4にも多々ありますが、原因は何ですか? 演算処理能力をLLMに持ち合わせておらず、過去のインターネットの情報から作成したLLMをつかって索引しようとするからですか??

A.
GPT-4のようなAIモデルは、自然言語処理とテキスト生成に特化しており、その構造上、純粋な数値計算能力は限定的です。数値計算や複雑な演算を行う際には、誤りが発生しやすくなります。

また、GPT-4はトレーニングデータに基づいて文脈を理解し、適切な回答を生成しようとしますが、時々その文脈や質問の意図を完全に捉えられない場合があります。これは、GPT-4が過去のインターネット情報を参照して生成された知識ベースを利用しているためです。過去のインターネット情報に含まれる誤りや、理解が不十分な情報に基づいて回答を生成することがあるため、回答が正確でない場合があります。

私たちの開発チームは、モデルの改善に努めていますが、現段階ではGPT-4が完全に正確な回答を提供することは難しい場合もあります。ユーザーの皆様からのフィードバックを大切にし、より正確で有用な回答が提供できるように努力してまいります。

Bitnami