サイトメニューここからこのページの先頭です

ショートカットキーの説明を開始します。画面遷移や機能実行は、説明にあるショートカットキーを同時に押した後、Enterキーを押してください。ショートカットキーの説明を聞くには、Alt+0。トップ画面の表示には、Alt+1。ログインを行うには、Alt+2。簡易検索画面の表示には、Alt+3。詳細検索画面の表示には、Alt+4。障害者向け資料検索画面の表示には、Alt+5。検索結果の並び替えを行うには、Alt+6。国立国会図書館ホームページの表示には、Alt+7。検索結果の絞り込みを行うには、Alt+8。以上でショートカットキーの説明を終わります。

ナビゲーションここから

ナビゲーションここまで

本文ここから

資料種別 記事・論文

報酬の分散を推定するTDアルゴリズムとMean-Variance強化学習法の提案

佐藤 誠,木村 元,小林 重信

詳細情報

タイトル 報酬の分散を推定するTDアルゴリズムとMean-Variance強化学習法の提案
著者 佐藤 誠
著者 木村 元
著者 小林 重信
出版地(国名コード) JP
出版年(W3CDTF) 2001
件名(キーワード) reinforcement learning
件名(キーワード) Markov decision processes
件名(キーワード) variance penalized criteria
件名(キーワード) gradient-based learning
件名(キーワード) machine mainenance problem
件名(キーワード) TD-method
NDLC ZM13
対象利用者 一般
資料の種別 記事・論文
掲載誌情報(URI形式) http://iss.ndl.go.jp/books/R100000002-I000000400907-00
掲載誌情報(ISSN形式) 13460714
掲載誌情報(ISSN-L形式) 13460714
掲載誌名 人工知能学会論文誌
掲載巻 16
掲載ページ 353~362
言語(ISO639-2形式) jpn : 日本語

本文ここまで

Copyright © 2012 National Diet Library. All Rights Reserved.

フッター ここまで