サイトメニューここからこのページの先頭です

ショートカットキーの説明を開始します。画面遷移や機能実行は、説明にあるショートカットキーを同時に押した後、Enterキーを押してください。ショートカットキーの説明を聞くには、Alt+0。トップ画面の表示には、Alt+1。ログインを行うには、Alt+2。簡易検索画面の表示には、Alt+3。詳細検索画面の表示には、Alt+4。障害者向け資料検索画面の表示には、Alt+5。検索結果の並び替えを行うには、Alt+6。国立国会図書館ホームページの表示には、Alt+7。検索結果の絞り込みを行うには、Alt+8。以上でショートカットキーの説明を終わります。

ナビゲーションここから

ナビゲーションここまで

本文ここから

資料種別 記事・論文

状態非依存の方策を用いた新しい強化学習手法の提案

中野 太智,前田 新一,石井 信

詳細情報

タイトル 状態非依存の方策を用いた新しい強化学習手法の提案
著者 中野 太智
著者 前田 新一
著者 石井 信
出版地(国名コード) JP
別タイトル Proposal of New Reinforcement Learning with a State-independent Policy
出版年(W3CDTF) 2014-08
件名(キーワード) reinforcement learning
件名(キーワード) path integral
件名(キーワード) state-independent and time-dependent
NDLC ZM11
対象利用者 一般
資料の種別 記事・論文
掲載誌情報(URI形式) http://iss.ndl.go.jp/books/R100000002-I000000062883-00
掲載誌情報(ISSN形式) 13425668
掲載誌情報(ISSN-L形式) 13425668
掲載誌名 システム制御情報学会論文誌 = Transactions of the Institute of Systems, Control and Information Engineers
掲載巻 27
掲載号 8
掲載ページ 327-332
言語(ISO639-2形式) jpn : 日本語

本文ここまで

Copyright © 2012 National Diet Library. All Rights Reserved.

フッター ここまで