08g2n.htm

<HTML>
<HEAD>
<TITLE>ブロックスデュオ プログラム対戦 参考文献</TITLE>
</HEAD>

<BODY>

<H1>ブロックスデュオ プログラム対戦 参考文献</H1>

2007年と2008年の大会に参加された方へのアンケートで、参考になった文献やWebページとして回答いただいたものをまとめました。

<H3>一般的なもの</H2>

<UL>
<LI>松原 仁・竹内郁雄編, ゲームプログラミング, 共立出版, 1998. (<A HREF="http://www.kyoritsu-pub.co.jp/bookhtml/0306/000413.html">出版社のページ</A>)
<LI><A HREF="http://www.fierz.ch/strategy.htm">Strategy Game Programming</A>
<LI>池 泰弘, コンピュータ将棋のアルゴリズム, 工学社, 2005. (<A HREF="http://www.kohgakusha.co.jp/books/detail/4-7775-1110-3">出版社のページ</A>)
<LI>小谷義行, コンピュータ将棋の頭脳, サイエンス社, 2007. (<A HREF="http://www.saiensu.co.jp/?page=book_details&ISBN=ISBN4910054701173&YEAR=2007">出版社のページ</A>)
</UL>

<H3>特定のアルゴリズム</H2>

<UL>
<LI>M. Buro, ProbCut: An Effective Selective Extension of the Alpha-Beta Algorithm, ICCA Journal 18(2) 1995, 71-76 (<A HREF="http://www.cs.ualberta.ca/~mburo/ps/probcut.pdf">PDF</A>)
<LI>P. Auer, N. Cesa-Bianchi, and P. Fischer, Finite-time Analysis of the Multiarmed Bandit Problem, Machine Learning, 47(2/3):235-256, 2002. (<A HREF="http://homes.dsi.unimi.it/~cesabian/Pubblicazioni/ml-02.pdf">PDF</A>)
<LI>大崎泰寛, 柴原一友, 但馬康宏, 小谷善行, モンテカルロシュミレーションを用いた強化学習法の提案, 情報処理学会ゲーム情報学研究会報告, Vol.2008, No.28, 2008-GI-19.<!-- 研究会報告はこの表題だが、発表プログラムは「モンテカルロシミュレーションを用いたTD法による強化学習」 -->
<LI>但馬康宏, 小谷善行, モンテカルロ法における勝率近似関数の組み込み方法, 情報処理学会第13回ゲームプログラミングワークショップ, 2008.
<LI>但馬康宏, 小谷善行, UCTアルゴリズムにおける確率的な試行回数削減方法, 情報処理学会ゲーム情報学研究会報告，Vol.2008, No.59, 2008-GI-20.
</UL>

<H3>評価関数</H2>

<UL>
<LI>irori の日記の<A HREF="http://d.hatena.ne.jp/Irori/20071104/1194151812">ブロックスデュオ プログラム対戦 結果</A>
</UL>

<H3>Windows</H2>

<UL>
<LI>赤坂 玲音, Windowsゲームプログラミング, ソフトバンクパブリッシング, 2004(第1版) 2008(第2版) (<A HREF="http://wisdom.sakura.ne.jp/products/books/wingame.html">WisdomSoftのページ</A>)
</UL>

</BODY>
</HTML>