風車の看板。「蒼蕪(そうぶ)」の雑記。乱文駄文が溢れかえる。
by kajawecel
S M T W T F S
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
検索
以前の記事
2017年 05月
2017年 04月
2017年 02月
2017年 01月
2016年 12月
2016年 10月
2016年 09月
2016年 05月
2016年 04月
2016年 01月
2015年 12月
2015年 11月
2015年 10月
2015年 09月
2015年 08月
2015年 03月
2014年 05月
最新の記事
寝過ごし
at 2017-05-20 00:51
道案内。
at 2017-04-06 23:59
人工知能。
at 2017-02-27 21:32
新年あけまして。
at 2017-01-01 00:00
一息。
at 2016-12-27 00:26
雑記帳
□この雑記張はいつの間にか言葉が追加されたり言い回しが変わってたりします。管理人の気まぐれです。

□面白い記事など書くつもりは毛頭ありません。書きたいことを書く。

□暗い記事でも明るい記事でも容赦なく書きます。そういうのが嫌いな方は回れ右をすることをお勧めします。

□記事に対する追記と訂正は何も言わずに行われる事があります。何か言って行われる事もあります。その時の状況と気分です。

□コメントはご自由に。そしてお気軽に。とは言えこの場にそぐわないと判断した物は、管理人の独断と偏見によって削除させていただくことがあります。

□以下リンク集
~外部リンク~
キュートなほうが好きかもしれない
恒久の流れへ,,,
ごろごろサイクル
桜色衛星
人生日々晴々
寂寞たる日々。
綴られし妄言
昴式ファクトリー
ヒカリの道標
Honey on Clock☆
SCHOOL DAYS
私事(わたしこと)


人は変わることが出来る。そう信じた人が成長する。
何故なら、成長とは過去の自分から変わることなのだから。


人工知能。
最近の興味。





最近は人工知能について……というか、その中の一部の実装モデルについて調べています。

ニューラルネットワーク、それを多層にしたディープラーニング。
その中?でもディープQネットワークを実装したくて色々調べています。

Qラーニングという学習アルゴリズムがあって、最近自分でプログラム組んで色々やっていたのですが、
収束すれば正確な答えを出す代わりに、遅い上にメモリを馬鹿食いするのです。
しかもちょっと大きな系を計算すると、学習結果の保存も馬鹿みたいに容量が必要になります。
実装は比較的楽なのですけどね……。

ディープQネットワークというのは、Qラーニングの学習アルゴリズムに、ディープラーニングによる関数近似を取り入れたものです。
Qラーニングが離散的に、全ての環境変数と、その環境における全ての行動に関して、学習値を蓄積していくというものなのに対し、
ディープQネットワークは全ての環境変数とその環境における全ての行動を入力として、学習値を出力する関数を求めるものになります。

関数の形状さえ覚えさせれば、環境変数とかは使い終わったら捨てて良いというのが利点の一つ。
もう一つはちゃんと調べていないので推測になりますが、
Qラーニングでは似てても少しでも環境が違ければ学習値が0からの積み上げになるのに対し、
ディープQネットワークは環境が似ていれば似た学習値が出るはずなので、メモリの使用量が減るのは勿論、学習スピードも速い、はず?

ただ、その具体的な実装方法が中々理解できなくて困っていたのです。
今日ようやく道筋が立ちました。
ただ、仕事でプログラムしてきて今プログラムする気になれないので、また後日遊ぶとします。

……何でこれ記事に起こしたんだろう?
ではでは。

[PR]
by kajawecel | 2017-02-27 21:32 | Comments(0)
<< 道案内。 新年あけまして。 >>