0%

大家好,这次要跟大家分享一个很炫酷的东西。我们要实现一个机器学习算法,这个算法可以通过观察屏幕,产生一系列操作,进而控制游戏,取得高分。

我们的目标

Atari是1972年成立的一家美国公司,主要做的是街机、家用电脑、家用游戏机。很多早期的经典游戏都是出自Atari,比如什么乒乓球、网球、各种弹珠游戏等等。我们今天要让机器来玩的游戏就是出自atari的游戏,名为breakout。这个游戏是基于乒乓球的玩法的一个游戏,与乒乓球不同的是,这个游戏可以由单人控制。相信只要是80后,肯定都玩过这个游戏。

Break out game

阅读全文 »

本文是上一篇文章『RNN和LSTM从理论到实践一:词向量』的续文。

上一章中,我们了解了词向量怎样训练,并跟随udacity上面的例子及问题动手实践了Skip Gram和CBOW模型训练算法。我们也顺带看了一下什么是语言模型,以及基础的n-gram模型是怎么样的。这次我们将要在前面的基础上,看看RNN和LSTM模型是什么样的,并将和大家一起动手去实现一个LSTM模型用于生成一个句子。

我们的问题

先来看我们的问题,然后让我们带着问题,来学习RNN和LSTM。这次我们要解决的问题是:如何生成一个看起来还不错的句子。

我们之前介绍过n-gram,那么我们能不能使用n-gram去预测单词,进而生成一个句子呢?我们可以使用频率统计来计算n-gram的语言模型:

阅读全文 »

做一个小demo来演示强化学习的入门问题–MDP问题的解决。