0000287930 00000 n 3600ぐらいあるように見えます。 0000007208 00000 n 0000358698 00000 n で紹介した方法以外として、eloレーティングに代わるものとしてグリコレーティング(Glicko rating)というのがあるらしいです。, 以前駒得やねうら王と探索制限技巧で戦わせたことがあったので実感があります。昔のやねうら王nanoとかは探索制限無しで絶妙な棋力を出してくれるのでそういう点では低R帯での強さを測るのに適していたのかもしれないですね。, >そもそもeloレーティングの計算式は将棋のゲーム性に合致しているのでしょうか? 0000271059 00000 n 0000020891 00000 n 驚きの強さ わずかスプーン一杯分!, 振り飛車ソフトに序盤で200,250点くらいプラスの評価してるのに、対局増やすと点数ほど勝てないのも、戦型の偏りによるものなんですかね?, 本当に対局増やすと点数ほど勝てないのでしょうか…。 0000210085 00000 n 0000004384 00000 n !#(B, 2016-01-04 10$B;~:"$h$j(BShogi-server$B$,ITD4$G$7$?$,!"(B20:30$B:"I|5l$7$^$7$? ��k@6�^�?E�Vvd�]��uS��B����~���iJ�� ?�Tr�& 0000358340 00000 n 0000228110 00000 n 0000211264 00000 n 0000268237 00000 n 0000209657 00000 n 一応、短い時間(depth 16程度)ではその勝率ではあるはずなのですけど。, 逆に、通常の対局(depth 30程度)で点数ほどの勝率がないのだとしたら、振り飛車はdepthによって勝率が変わるという話になるのかなと。, 次回のコメントで使用するためブラウザーに自分の名前、メールアドレス、サイトを保存する。, やねうら王公式サイト --- 知の最先端 0000003396 00000 n 0000276469 00000 n ディープもでてくるとなると、測る方法無くなってくるような気がします, 中終盤の棋力を判定するには戦型をばらけさせた互角局面から開始させるのがよろしいかと存じます(`・ω・´)b, まあ、それはそれとして、AlphaZeroのような汎化能力の高い評価関数ですと初期局面からの勝ち方も相当学習するので定跡なし時の序盤が非常にうまいですね…。, 将棋ソフト「mEssiah」公式 0000230836 00000 n 0000006510 00000 n 0000271683 00000 n 「観る将棋ファン」のための将棋観戦記ブログ。将棋が指せなくてもプロ棋士の将棋観戦は楽しめます。「スポーツを楽しむように将棋観戦を楽しむ」をモットーに毎日朝7時頃に更新しています。朝刊がわりに将棋観戦記をどうぞ!! 0000267339 00000 n 0000267798 00000 n illqha4_dolphin1_vs_Kristallweizen_dolphin1の結果を追記し #RRate を更新しました SOTA(最強ソフト)がKristallweizenに入れ替わりました! "(Bgamename$B0lHL$K;XDj2DG=$G$9(B, $BDL?.%W%m%H%3%k>e$NJQ99(B: $BBP6I3+;O;~$NDLCN%a%C%;! コンピュータ将棋は毎年レーティングで100ずつぐらい 強くなっている.これが今後も続くとすると,2年半後, つまり2007~2008年にプロとコンピュータ将棋が同じ 強さになるということになる4). 勝又五段は,今回,このような短時間勝負の場合は, <<将棋における「高速道路理論」と「無双・図巧は棋力向上に役立つのか?」問題  | ホーム | 棋風と戦法 第四回大和証券杯最強戦 佐藤康光vs木村一基>>, Author:将棋観戦「将棋観戦記」というブログで、プロ棋士の将棋を観戦して思ったことを記しています。棋力はありませんが、将棋観戦の楽しさを一人でも多くの人に知ってもらい、「観る将棋ファン」を増やすために貢献できればと思います。主に順位戦速報・タイトル戦等、ネット中継されている将棋を中心に将棋観戦記を書いています。棋譜・符号はなるべく用いずに、将棋のルールが分からない人でも、将棋の勝負の面白みが伝わるように努力します。基本的にはリアルタイムでの将棋観戦中に思ったことを書き溜めつつ、対局終了後の感想を付け加えて、将棋対局のあった翌日の朝7時頃にアップされるように将棋観戦記を予約投稿しています。「一日一観戦記」をモットーにしているので、同日にネット中継が重なった場合は、対局の重要度を個人的に評価して観戦記の投稿日を調整しています。将棋観戦中に書き始め、対局が終了すると思われるところから観戦記を完成させていることが多いです。文章内の形勢判断は個人的主観によるもので、観戦中の控え室のプロの意見を取り入れず、将棋ソフトの解析を行なっていないため、形勢判断が正しくない可能性があります。また、あまり推敲することなく投稿しているので、観戦記内に誤字脱字、情報の誤りがある場合があります。お気づきの場合はコメント欄にてご指摘いただけると助かります。早急に訂正させていただきます。, Copyright © 将棋観戦記 All Rights Reserved. AlphaZeroの論文は世界に衝撃をもたらしました。曰く、ディープラーニングと強化学習で作られた評価関数は激烈に強く、囲碁だけでなく、チェス・将棋でも人間を超え最強のソフトを超えたと。 人間 vs コンピュータに終止符を打ち最後まで絶対的強さを魅せつけたPonanza、そ … (B, floodgate-600-10$B$rGQ;_$7! 0000209414 00000 n 0000268461 00000 n 0000270946 00000 n 2014-11-30 レーティングにおけるベンチマークプレーヤーの変更: 算出されたレートの表記にあたり、長らくgps_normalのレートを2150に固定していましたが、今後は、gpsfish_normal_1cのレートを2800として表示します。 結論から書けば、(コンピュータ将棋のトップということで言えば)yesということになりそうだ。 ただし3000点以上だとして、どこまで上なのかが分からない。 ここ最近、コンピュータ将棋の棋譜を真面目に見ることが多くなり、その正確な実力、レーティング点について気になり始めた。 293 0 obj <>stream 3--10 (2010). !#(B, 2020-03-22 10$B;~:"!"%^%7%s$N;~9o$r=$@5$7!"(B2$B;~4V$[$ILa$7$^$7$? 0000337636 00000 n <<9E17B8555E1FB640B3B76E9CCB8D5907>]>> 0000002571 00000 n 0000358663 00000 n どのように扱うのが筋がいいのかは自分もそんなに統計に詳しくないのでよくわかりません。, 自己対戦を含む、序中盤の実力がある程度(かなり?)近いソフトの間でしか意味をなさないです。, elmoとalphazeroは、角換わり、相掛り半分ずつと戦法偏ってましたよねー 183 0 obj <> endobj 時間制限に対応させる。現在の設定は、フィッシャークロックルールを用い、当初の持ち時間が10分、自分の手番が回ってくるごとに10秒加算 0000209213 00000 n !#(B, 2018-12-05 $BDdEE$N$?$a!"(B12$B7n(B7$BF|Lk!A(B10$BF|$K$+$1$F! 0000358880 00000 n 0000271706 00000 n 0000267648 00000 n (B, 2017-12-06 $BDdEE$N$?$a!"(B12$B7n(B9$BF|!A(B11$BF|Lk$K$+$1$F! startxref 0000005708 00000 n 0000005291 00000 n レーティング差の足し算をするときは、この上限値同士、下限値同士を足していくと良いでしょう。 駄目4. 0000293078 00000 n 0000268208 00000 n 0000321375 00000 n 0000293489 00000 n �I�/�2��"&��Zt%��ԟO��g(ɻio����y�K�� %m�&w�6�"�b&����?�`�� ��"��T�!���x���3c/�\ǝGs.6��Zύ��ɿR��3��r�s���:v��!�-�������*^-���/��^|E�D'���cÄ*�x܀:x�P�s�-��X�5̲��u9%���̭0��.,�"�!�����r�'��IC�eg&�tz��>������w�y�C�a��bLj.>�4��p|��7��5�1ӭˎ 0000208555 00000 n (B, 2017-09-03 $B%7%9%F%`>c32$K$h$j!"(B7$B7n(B3$BF|$+$i%5! 0000052675 00000 n 0000293283 00000 n 0000005028 00000 n Powered by FC2 Blog |. "Dd;_M=Dj$G$9!#(B, 2016-04-05 Shogi-server/Floodgate$B$N%U%#%C%7%c! 0000209814 00000 n trailer 0000005735 00000 n 0000268312 00000 n AlphaZeroの論文は世界に衝撃をもたらしました。曰く、ディープラーニングと強化学習で作られた評価関数は激烈に強く、囲碁だけでなく、チェス・将棋でも人間を超え最強のソフトを超えたと。, 人間 vs コンピュータに終止符を打ち最後まで絶対的強さを魅せつけたPonanza、そのPonanzaをWCSC27で破ったelmo、そのelmoを90-2-8で破ったAlphaZero。elmoとのレート差は約400。コンピュータ将棋も終わった。, しかし、AlphaZeroの論文(2017年12月発表)から1年も経たないうちその神話は終焉を迎えました。, レーティングサイト(新/旧)のレーティング表からもお察しの通り、今の将棋ソフトのレーティングはelmo+400ぐらいの値が出ています。, orqha0926はorqhaの最新バージョン(公開版orqhaに対してR+50くらい)です。測定者はロタさん、棋譜はこちらからダウンロードできます。勝率88%。素のレートでいえばAlphaZeroより40程度低い値です。しかし、原著論文は, ・AlphaZero(TPU)とelmo(CPU)の計算資源は費用比較だとAlphaZeroがかなり有利, ・AlphaZeroの試合回数が100しかない(orqha vs elmoだって途中経過では156-1-14(91%)ぐらいの勝率は出てた), と言った問題点を抱えています(その代わりにorqhaの棋譜は持ち時間が大分短いわけですが)。, 勝率差がここまで詰まっているのを鑑みれば、ハードの違いを加味すれば今の最強のソフトはまず間違いなくAlphaZeroより強いでしょう。, DeepMind恐れるに足らず。TPUにいくら使ったか知りませんが、その覇権とやらを打ち崩すのに6コア12スレのPCがあれば十分です。, ブレイクスルーだ、技術的失業、シンギュラリティだと宣いますが、巨人の肩を甘く見るからこういう目にあうのです(まあ、orqha自身がやねうら王、NNUE、illqhaの肩に乗ってるのは公知の事実ですしの)。, AlphaZeroを恐らく超えているだろうNNUE関数のorqha。その開発者によるコンピュータ将棋の教科書が技術書典で頒布されます。, https://techbookfest.org/event/tbf05https://techbookfest.org/event/tbf05/circle/53170003, Ryoto Sawada ブログを報告する, 90-2-8で破ったAlphaZero。elmoとのレート差は約400。コンピュータ将棋も終わった。, https://techbookfest.org/event/tbf05/circle/53170003, 【人間の棋譜からの転移学習】最強クラスの振り飛車評価関数 shinderella を公開します, レート4390ぐらい(今のSOTA+20-30)の評価関数orqha1018を公開します. %%EOF endstream endobj 184 0 obj <. M7G��:i����j^�3��7��H�=��O@�&�/��`��Zb$ QGl�� uuunuuunさんやQhapaqさんが行っているレギュのレーティングは上位陣に対する勝率で最高Rを更新していてイベントごとに最高Rが上昇していきますけど、そうして算出されたレートが差のついた相手に対して期待通り勝率を出せるかは個人的には疑問に思っています。(T.N.K-wcsc28と水匠2-wcsoc2020のR差400らしいですけど同型NNUEで91%も出せるのかという), (おまけ、駒得やねうら王と技巧2_D7の棋譜です position startpos moves 1g1f 3c3d 1f1e 5c5d 6i7h 8b5b 2h1h 5d5e 5i4h 5a6b 7g7f 6b7b 7h6h 3a4b 5g5f 4b5c 5f5e 5c6d 8i7g 2b3c 5e5d 5b5d 1h1f 2c2d 6h5g 2d2e 5g4f 3c2d 2g2f 2d4f 4g4f G*8i 4i5h 8i8h 7i8h B*2g 1f1g 2e2f P*2h 5d5h+ 4h5h P*5g 5h4h G*5h 4h4g 2g4i+ R*2b 7a6b 2b2a+ 4a5a G*3h 5h6h 3g3f 5g5h+ 2a1a 6h6g B*3c 6g7h L*5f P*5e 5f5e P*5c P*5d 6d5e 3c5e+ 5c5d 5e5d L*5b N*6d 7b8b 6d5b+ 6a5b S*6a N*2e 1g1f 5a6a 1f2f P*5a 2f2e 7h8h N*7e 6b5c 5d6e S*7d L*8f S*7b 6e6f 7d7e 7f7e 4i5i 7g6e 5c5d P*6b 5b6b S*5f 8h8g P*5e P*2d 2e2d P*2c 2d2c+ 5d6e 8f8c+ 7b8c 6f6e L*6d 6e8g 9c9d P*6e N*4d 6e6d 6c6d 5f4e N*6e S*6f P*8f 8g9f 6a7b 1a5a 9d9e 9f8e 5h5g 6f5g 6e5g+ 4g5g 8f8g+ P*8d 8c8d 8e8d P*8c N*9d 9a9d S*9c resign), まあ、件のレーティングサイトは計測誤差を考慮してないので、上ブレした時の数値で次の計算をしてしまいますとレーティングはインフレしていきますね..(´ω`) 例えば、下ブレしたソフトは成績の悪いソフトとしてR計測のトーナメントから除外していくなどで。, 将棋の強さ関係は半順序であり、全順序じゃないですからね。無理やり全順序で表そうとするレーティングでその関係を評価するには注意深く使う必要がありますね。, これ関連で特定の戦型に偏らないように思考時間をぶれさせるみたいなことも前に言ってましたね, 思考時間に揺らぎをもたせても戦型は偏りますね。同一の棋譜になるのは避けられますけども。, あれ? 0000271772 00000 n 0000042429 00000 n 0000210980 00000 n 0000230768 00000 n コンピュータ将棋Qhapaqの開発者。主な実績は第五回電王トーナメント5位入賞、第28回世界コンピュータ将棋選手権7位入賞, このブログについて 0000004644 00000 n 0000024473 00000 n (B, 2017-10-20 15$B;~$4$m6[5^%a%s%F%J%s%9$N$?$a%5!(B23$B;~H>:"I|5l$7$^$7$? >そこから外挿するとR1500かR2000ぐらいまでは(ry これより強いぷよぷよAIって作れますか? 『eloレーティング→glicoレーティングに変更することにより解決できました。』, それは(それだけで)解決してるとは到底思えないんですけどね。(この記事で書いたような、計測手法自体に様々な問題を抱えているので), 最強ぷよぷよAI ぷよふら レート3419 (B, $B3+:E4|4V(B: 12$B7n(B23$BF|(B($B2P(B)$B!A(B1$B7n(B3$BF|(B($BF|(B)$B$^$G$N(B12$BF|4V(B. 0000227908 00000 n 0000005596 00000 n 人間で最強はマッキーっていう大阪の大学生でレート レーティングの算出には、ソフトの解析結果から「−3184☓平均悪手+4620」という式を使った。ネット対局サイト将棋倶楽部24のレーティングは、1000でアマ6級、2000でアマ三段、3000でアマ八段が目安とされる。 現在最強の棋士は史上最強なのか やねうらさんなら、なにもない所から1週間ぐらいで 結論から書けば、(コンピュータ将棋のトップということで言えば)YESということになりそうだ。 ただし3000点以上だとして、どこまで上なのかが分からない。ここ最近、コンピュータ将棋の棋譜を真面目に見ることが多くなり、その正確な実力、レーティング点について気になり始めた。 0000209485 00000 n 0000007349 00000 n コンピュータ将棋(将棋ソフト)の情報を纏めたwikiページです。大会出場ソフトの特徴や用語解説などを行っています。 サイトをリニューアルしました(181110) 中身はそんなに変わってないのですが、内部システムは大幅に変わりました。 2020年1月現在、もっとも強い将棋ソフトはどれなのか? どのソフトを選べばよいのか?自分の観測範囲内のまとめを紹介したい。各ソフトを精査したわけではないので、異論、反論はあるかもしれない。追記2020年5月に世界コンピュータ将棋オンライン 0000005762 00000 n "(B10$BIC2C;;(B, Floodgate$BBP6I$@$1$G$J$/!"(Bdefault-100-10F$B$J$I! (B, $BNc(B: floodgate-600-10F$B!#Ev=i$N;}$A;~4V$,(B10$BJ,! 0000227656 00000 n 0000287727 00000 n 0000028231 00000 n 0000032675 00000 n (B, 2016-12-09 $BDdEE$N$?$a!"(B12$B7n(B10$BF|!A(B12$BF|Lk$K$+$1$F! ロタ氏 の計測によれば、第29回世界コンピュータ将棋選手権(WCSC29)で準優勝した白ビールこと「Kristallweizen」がレートを更新したとのこと。. 0000004243 00000 n �~$����H�bv/��]��p�Y�02.�{��Q��� 0000227588 00000 n 0000004767 00000 n 0000288275 00000 n 0000268387 00000 n 0000052814 00000 n ロタ氏の計測によれば、第29回世界コンピュータ将棋選手権(WCSC29)で準優勝した白ビールこと「Kristallweizen」がレートを更新したとのこと。, illqha4_dolphin1_vs_Kristallweizen_dolphin1の結果を追記し #RRate を更新しましたSOTA(最強ソフト)がKristallweizenに入れ替わりました!Rを30以上伸ばしてR4436!, 改めて。第29回世界コンピュータ将棋選手権準優勝のKristallweizenの評価関数を公開しました。https://t.co/waUgqtzYg6, — たま@Kristallweizen(24参戦中) (@mm_Tamachan_mm) 2019年5月9日, 2エンジン対局用のスクリプトのテストのために即席で作った評価関数ですが、水匠改2とほぼ同等の 結果が出たみたいなので、参考までにこっそり公開しておきます。 作成方法については来年の選手権のこともありますし、現在は非公開でw, はじめに、探索部をインストールしておこう。KristallweizenのGitHubのページを開き、「Kristallweizen-200214-avx2.exe」をクリックする。, ↓ 「Download」をクリックすれば、「Kristallweizen-200214-avx2.exe」がダウンロードされる。, 任意のフォルダを作成し、「Kristallweizen-200214-avx2.exe」をコピーしておく。ここでは、Cドライブの下に「engine」フォルダを作成し、さらにその中に「Kristallweizen」フォルダを作り、その中に、「Kristallweizen-200214-avx2.exe」を保存している。, KristallweizenのGitHubのページを開き、「Kristallweizen_kaiV0.4.zip」をクリック。, 右下の方にある「Download」をクリックすれば「Kristallweizen_kaiV0.4.zip」がダウンロードされる。, → 「Kristallweizen_kaiV0.4.zip」を解凍しよう。WinRARのほか、Lhaplus、Windows標準機能でも解凍できる。「eval」フォルダが作成され、中には「nn.bin」が入っている。, 先ほどのフォルダに「eval」フォルダをコピーする。「eval」と「Kristallweizen-200214-avx2.exe」が同じフォルダ内にあればOKだ。, ↓ 「eval」フォルダを開くと、「nn.bin」というファイルがあるので「beer.bin」というファイル名に変更する。, ShogiGUIを起動し、メニューから「ツール」→「エンジン設定」を選択する。 ※ShogiGUIをインストールしていない場合は、以下のエントリを参考にしてほしい。, ファイル「Kristallweizen-200214-avx2.exe」選択し、「開く」をクリックする。, 「エンジン名」はわかりやすいものに変更してもよいが、このままでもよい。「OK」をクリックする。, エンジン設定で「Kristallweizen TOURNAMENT」を選択し、思考時間等を設定して「検討開始」を選ぶ。, 検討がはじまる。対局や棋譜解析でもエンジンを「Kristallweizen TOURNAMENT」にすればOKだ。, 上の画面写真のような「初期化エラー」が出る場合、まずはフォルダ名・ファイル名を確認したい。ファイル名が1文字でも間違っていると動作しない可能性がある。, ファイル名が正しい場合は、探索部を「Kristallweizen-200214-avx2.exe」ではなく、「Kristallweizen-200214-sse42.exe」にしてみてほしい。, 右玉NOWのYouTubeチャンネルもよろしくお願いします! 右玉党に役立つ動画をアップしています。, 右玉党。ソフトを参考にして右玉の各局面を検討します。棋力はアマ三段。図面の表示はJavascriptが有効になっている必要があります。 お問い合わせはこちらのフォームからどうぞ。ほしいものリスト, CPUがAVX2に対応していない場合は「Kristallweizen-200214-sse42.exe」をダウロードしよう。よくわからない場合は、「Kristallweizen-200214-avx2.exe」を試してみてエラーが出るなら「Kristallweizen-200214-sse42.exe」にすればよい。, 「Kristallweizen-200214-avx2.exe」と同じフォルダ内に「eval」フォルダがあるか。名前は正しいか。, エンジンの設定は「Kristallweizen TOURNAMENT」になっているかどうか。. 挑発みたいになってますが本当に作れそう。, AlphaZero式に作るのであれば、計算資源の勝負ですかね。何を特徴量にするかという点で工夫はあるでしょうけども。あとは終盤は、詰将棋のようになるならmate solverみたいなのが欲しいかもですね。, コンピューターは3手読みらしいです。 0000005318 00000 n 0000271422 00000 n 0000028476 00000 n 0000230402 00000 n 0000004890 00000 n 0000005482 00000 n "Dd;_M=Dj$G$9(B, 2017-10-27 25$BF|$N(B23$B;~$4$m%7%9%F%`>c32$,$"$j!"(B27$BF|(B22$B;~:"I|5l$7$^$7$? 0000309414 00000 n 0000004522 00000 n つくれたりしますか?なんたって天才だから %PDF-1.4 %���� 0000300232 00000 n 0000337561 00000 n 0000227380 00000 n 0000007235 00000 n URLの動画の14分21秒ぐらいの所 0000006865 00000 n (B, 2017-10-08 6$BF|(B20$B;~$4$m$h$jITD4$G$7$?$,!"(B12:30$B:"I|5l$7$^$7$? 20, pp. 0000005789 00000 n 0000037885 00000 n 0000293516 00000 n 新しく強いソフトが出てくれば、数年前のあるソフトの特定バージョンに付いているレーティングというのは、今計測し直したときには下がるというものですよね?, 本来eloは初期rating例えば1500で参入し試合を繰り返してratingを更新し収束させるから、新規の強いソフトに吸い取られる事はありうるが、ここの話はちょっと違うと, 初期レート1500でゼロサムのレート奪い合いをさせてるのはオンラインゲームに限った話でそんなことは勿論コム将棋ではやってない。eloのウィキにも「疑似」レーティングとして紹介されてる。, 駄目3についてですが十分な対局数でレート差を出している場合、正規分布に近似できる誤差でしょうから誤差の2乗の平均の平方根を合計の誤差とするのは駄目なのでかね?, 冷静に考えると正規分布に従うと近似できるのはR差ではなくシグモイド関数を通す前の勝率ですね。R差の誤差の合計は手計算だとシグモイド関数の傾きの変化が無視できる範囲という仮定を置かないとちょっと無理ですね。目の前の計算機にでも頑張ってもらいますか。, そこ、私は山岡さんの記事(本文中のソースコードの少し上にあるURL)の式を深く考えずに解析的に解いて使ってたのですが、言われてみれば…という感じです。これ、ポワソン分布とみなして、どやこやするのは筋が悪いのでしょうか?, 確かに極端な勝率の場合は正規分布と近似するのは危険ですね。 0000267222 00000 n (B, 2017-09-18 0$B;~$4$m$h$jITD4$G$7$?$,!"(B11:40$B:"I|5l$7$^$7$? 0000003091 00000 n 0 0000287998 00000 n 0000358764 00000 n (B, $B=>Mh$NICFI$_;~4V;XDjItJ,$NKvHx$K(B'F'$B$r2C$($k$3$H$G!"%U%#%C%7%c! 0000267723 00000 n 183 111 動画の対戦相手のかたは将棋でいうとA級棋士ぐらいみたいで 現段階で最強同士を比べると人間のほうが強いようにみえます。 Proudly powered by, https://github.com/yaneurao/Ayane/blob/5d6cdf51773eb3996bf030ace099d60c5242ee75/source/shogi/Ayane.py#L1349, https://www.youtube.com/watch?v=-YFTQJY1oAc, 3 technologies in shogi AI that could be used for chess AI. "(Bfloodgate-600-10F$B$r;OF0$7$^$9(B, 2016-02-17 22-23$B;~:"!"6[5^%a%s%F%J%s%9$N$?$a:F5/F0$7$^$7$? 0000006838 00000 n WCSC29後の最強将棋フリーソフトの探索,将棋の棋力向上を目指すブログ。コンピュータ将棋、実戦詰将棋、棋書の紹介について。2017年12月より最先端のコンピュータ将棋AIのレート測定に携わっています。 終盤を強化している 例えば、駒得だけしか考慮しない評価関数の将棋ソフトでは定跡を活用してもR2300あたりが限界です。(2倍の探索量 https://www.youtube.com/watch?v=-YFTQJY1oAc 0000042633 00000 n (B, 2016-12-11 30$BJ,0JFb$G=*$o$kBP6I$rA}$d$9$?$a!"(Bfloodgate-600-10F$B$rGQ;_$7!"(Bfloodgate-300-10F$B$H$J$j$^$7$? 0000337532 00000 n 0000288248 00000 n コンピュータ将棋協会誌 Vol. #csalive ターミネーター製造工場の視察 ?第20回世界コンピュータ将棋選手権を3日間眺めての感想. 0000013489 00000 n A1vsA2のレート差をΔa1、A2vsA3のレート差をΔa2としたとき、A1vsA2 A2vsA3 A3vsA4 … An-1 vs Anとして計測し、累積したΣΔaと、A1vsAnのレート差Δ(1 vs n)ではΣΔaのほうでレートインフレが起こり、どうやらΣΔa >> Δ(1 vs n)となるらしいことがわかりました。, そこで数学有識者のみなさんのお知恵をお貸しいただきたいのですが、ΣΔa ≒ Δ(1 vs n)となるようにΣΔaのインフレを補正できる方法が何かないでしょうか?, 要するに、将棋ソフトAとBでは、BのほうがR50強かった。BとCではCのほうがR30強かった。AとCとではR50+R30=R80の差があるはずなのにそうならない。なんで?ということですね。, 基準となる異種の複数のソフトと対局させて計測しましょう。自己対局ですと同じような読み筋なのでわずかに読みが上回ったほうが勝ちやすく、適切な計測にならないことが多いです。(本来のレート差より拡大されて見えやすいです), また特定のソフト(1つ)に対してチューニングし続けるのも、そのソフトとの相性を上げるだけのチューニングになってしまうので、よろしくないです。自分のソフトの改良のときには、異種の複数のソフトと対戦させるのが基本です。, 平手の初期局面から対局を同一のソフトで開始させる場合、特定の戦型ばかりになりやすく、その戦型の勝ち方を知っているほうの勝率が高くなりすぎるということがあります。また、例えばAとBでは必ずAは横歩を取られる変化になるので負けやすいがAとCではその変化にはならないので勝率はそこまでではない、ということもありえます。, 平手の初期局面からの序盤のうまさも棋力には違いないでしょうけども、相性が出やすいのでそうやって計測したレーティングではR50+R30=R80みたいな計算式は成り立たないことは容易に想像がつきますね。, ソフトAとBの真の勝率がxとして(確率xで表がでるコインのコイントスを想像して)、このN回の試行を観測すると勝率rであったとき、真の勝率xの存在する区間は解析的に求まります。(意味がわからなければ以下にPythonのコードを貼り付けておくのでそのまま使ってくだされ), Ayaneのレーティング計測のコードhttps://github.com/yaneurao/Ayane/blob/5d6cdf51773eb3996bf030ace099d60c5242ee75/source/shogi/Ayane.py#L1349, これにより、計測された勝率rとNから、(有意水準の範囲内である)レーティング差の上限値、下限値が求まります。レーティング差の足し算をするときは、この上限値同士、下限値同士を足していくと良いでしょう。, 例えば、駒得だけしか考慮しない評価関数の将棋ソフトでは定跡を活用してもR2300あたりが限界です。(2倍の探索量になっても本当にわずかしかレーティングが伸びないです), これは、序盤で作戦負けになるのが大きく、いくら探索量を増やして終盤を強化したところで上位のソフトには全く歯が立たないからです。しかし、自己対局ですと片側だけ探索量を2倍にするとそこそこ勝率に差が生じます。, これは将棋ソフトの開発初心者がよく陥る罠で、終盤を強化すると自己対局などで勝率は上がるのでそれを信用して終盤力強化のチューニングをひたすらやるのですが、結局、強いソフトとやらせると序盤で差がつくので、全く歯が立ちません。終盤力の強化は主に同系統のソフトの間でしか意味をなさないです。, 将棋は終盤の悪手一発で逆転するゲームなので、人間でも弱い者同士の対局ですと、「最後に悪手を出したほうが負け(になるゲームである)」と言われることがあります。なので、弱いソフトが弱いソフト同士でレーティングを計測したところで、最後に間違えないほうが圧倒的に勝ちやすく、すなわち詰み周りの探索を頑張っているほうが勝率は高いです。, しかしそのようなチューニングをしても強いソフトに対しては何の意味もないので、結局のところR1500や2000ぐらいのソフトが特定の弱いソフトに対して勝率が上がるようなチューニングをしてもあまり意味がありません。, もう少し具体的に言いますと、適度に弱いソフトがないので、やねうら王の探索深さを下げて、depth 5とかで対局させてそれを目安にチューニングする開発者の方が時々いらっしゃいますが、depth 5みたいな低depthだと終盤で頓死しまくるので、終盤をきちんと読んでいるほうが勝つとしか言えないです。そういう状況で計測されたレーティング差にはあまり意味がないです。これは、計測の手法がおかしいと言わざるを得ないです。, もし自分のソフトが弱くて基準ソフトがないというのであれば、やねうら王のほうは1秒か2秒に固定して、自分のソフトのほうを思考時間だけを32倍するなどして、自分のソフトを長時間で戦わせてチューニングすべきです。そうしないと終盤力だけを強化する間違ったチューニングをしてしまいます。, 以上の5点に気をつけていれば、経験的には、レーティング差の足し算自体はわりと成り立つように思っていますが、それでもいくつもレート差を足し合わせると多少のズレは生じるかもしれませんね。, つまり、Aに対して勝率76%(R200差)のBに、勝率76%のCがいたとしてCはAに91%(R400差)勝てるのでしょうか?そして、これは将棋の棋力R500からR4500のどの区間においても成り立つのでしょうか?, 例えば、将棋においてR1000以下のプレイヤーは初心者で、しょっちゅう1手詰めを見落としたり、王手飛車取りに遭ったりするので、R1000以下の区間では、R400の差があっても上位のプレイヤーが91%も勝たないことは容易に想像がつきます。(見落として負けるので..), そこから外挿するとR1500かR2000ぐらいまでは、それと同様の理屈で、R400差があっても上位のプレイヤーの勝率は91%ほどには高くないことが予想されます。, そんなわけでして、弱い棋力のプレイヤーに対してeloレーティングの式は、補正が必要だという話になるのですが、まあ、それを言い出すとこの記事が終われなくなるので、このへんで筆を置きたいと思います。, 駄目3. 速読コンピュータ将棋用語【記事募集中】 - qhapaq’s diary ↑こちらがカパックさんの記事です。 コンピュータ将棋 レーティング ↑uuunuuunさんの記事 私なら違う表現をするという場合の記述ですので、基本的には補足みたいなもんだと思ってください。 0000028354 00000 n 0000017083 00000 n 0000293351 00000 n 2020-10-09 $B:rF|H/@8$7$?%5!c32$+$iI|5l$7$^$7$? 0000006892 00000 n 0000052400 00000 n "Dd;_M=Dj$G$9(B, 2018-04-07 14-15$B;~H>:"!"%a%s%F%J%s%9$N$?$a%5! 0000267118 00000 n | 0000052606 00000 n コンピュータ将棋Qhapaqの公式サイトです。評価関数のアップロードの他、機械学習に関する技術を紹介します。, 本ブログは、Amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、Amazonアソシエイト・プログラムの参加者です。, qhapaqさんは、はてなブログを使っています。あなたもはてなブログをはじめてみませんか?, Powered by Hatena Blog 0000270484 00000 n 0000271888 00000 n 0000267147 00000 n 0000006199 00000 n 0000003228 00000 n 0000032825 00000 n 0000006537 00000 n (B), 2018-08-22 $B%a%s%F%J%s%9$N$?$a!"(B8$B7n(B24$BF|!A(B26$BF|$K$+$1$F! 0000295641 00000 n 0000304823 00000 n 0000032702 00000 n 0000000016 00000 n "Dd;_M=Dj$G$9(B ($BF|IUD{@5$7$^$7$? 0000005166 00000 n xref 0000227838 00000 n 0000209884 00000 n wcsc29後の最強将棋フリーソフトの探索,将棋の棋力向上を目指すブログ。コンピュータ将棋、実戦詰将棋、棋書の紹介について。2017年12月より最先端のコンピュータ将棋aiのレート測定に携わっています。 0000358995 00000 n

カムパネルラ ジョバンニ, 天体観測 双眼鏡, 山口県高校総体 サッカー, 未満警察 視聴率, 内田篤人 引退会見 配信, 藤井聡太 豊島, Nhk 契約内容 確認できない, 2017 ロッテ 打率, ガーナ カカオ, 茨城 サッカー 高校, 明日の約束 配信, 原爆正当化 海外の反応, 内田篤人 A Studio 動画, レーヴディソール 産駒, ロッテ 監督 2019, ガーナ カカオ, アメリカ 下院 権限, ヤクルト チケット セブンイレブン, 重光初子 日本人, ドラマ視聴率 再放送, ロッテ 選手, 下田 翔大 ゲーム, トゥザヴィクトリー エリザベス女王杯, 詳細に 使い方, 長谷部誠 リーダーシップ, 天皇賞春 2013, 新しい靴を買わなくちゃ 感想, 逆光の頃 動画,