Bright LGM's Blog

深度学习模型重现 -- 前奏

发表于 2019-07-08 更新于 2023-06-16 分类于 machine-learning 阅读次数：
本文字数： 461 阅读时长 ≈ 1 分钟

作为每天和AI模型打交道的开发者，深度学习模型在不同的框架之间转换一直是一个老生常谈的问题。为了让这个问题变得容易，大家做了很多这样的工作，像是微软推出的MMdnn工具，号称可以将模型在几乎所有的流行AI框架中转换，又比如Facebook和微软一起推出的ONNX不依赖具体框架的中间格式等。

阅读全文 »

深度学习模型重现 -- DORN

发表于 2019-07-08 更新于 2023-06-16 分类于 machine-learning 阅读次数：
本文字数： 4.7k 阅读时长 ≈ 8 分钟

DORN模型的重现

DORN模型是在单图像深度估计问题上效果非常好的模型，18年刚发布的时候，就同时在KITTI数据集和ScanNet数据集上面取得了Robust Vision挑战的第一名。

阅读全文 »

强化学习 - MDP

发表于 2018-05-06 更新于 2023-06-16 分类于 machine-learning 阅读次数：
本文字数： 30 阅读时长 ≈ 1 分钟

做一个小demo来演示强化学习的入门问题–MDP问题的解决。

深入探索生成对抗网络（一）

发表于 2017-06-21 更新于 2023-06-16 分类于 machine-learning 阅读次数：
本文字数： 15k 阅读时长 ≈ 24 分钟

最近在研究生成对抗网络，也对内对外做过一些分享。这里把分享过的内容整理一下，如有不对的地方，欢迎留言指出。也欢迎大家留言交流。这里是关于生成对抗网络的第一部分。

生成对抗网络介绍

什么是生成对抗网络？

从这个名称来看，我们可以了解到，这个网络是用一种对抗方法去生成数据的。和其他的机器学习模型相比，生成对抗网络里面最炫酷的理念莫过于给机器学习引入了对抗。纵观地球上的生物们的成长和发展路线就会发现，物竞天择，适者生存，万物都是在不停的和其他事物对抗中成长和发展的。生成对抗网络就像我们玩下面的格斗游戏一样，我们的学习过程就是，不断找其他对手对抗，在对抗中积累经验，提升自己的技能。

阅读全文 »

理解Conv2d及其梯度的计算过程

发表于 2017-04-15 更新于 2023-06-16 分类于 machine-learning 阅读次数：
本文字数： 4.4k 阅读时长 ≈ 7 分钟

在当前深度学习领域中，卷积神经网络在图像处理、语音处理等方面都表现出了优异的性能，得到了广泛的认可。作为深度神经网络中的一个基础算法，有很多资料介绍了卷积实现原理，但是不少人在学习之后，还是对其及其梯度的计算过程细节不够清楚。在这里，我想分享几个自己做过的小试验来加深大家对卷积及其梯度计算过程的理解。

卷积计算过程

在卷积神经网络中，卷积计算过程可以通过下面的动图（来自此处）来理解：

阅读全文 »

识别门牌号的移动应用

发表于 2017-03-01 更新于 2023-06-16 分类于 machine-learning 阅读次数：
本文字数： 3.9k 阅读时长 ≈ 7 分钟

今天给大家分享一个tensorflow的机器学习应用实例。我们将能看到如何针对特定的问题设计网络结构、设计损失函数，应用一些技巧来简化和拆分问题。还将演示如何将模型导出并部署到Android上，可以让我们感受到tensorflow强大的跨平台特性。

问题导入

提取门牌号进行地图标注

先让我们来看看我们要解决的问题。这个问题的应用场景来源于地图应用，如果能在地图上标注门牌号信息，这样就可以通过文本搜索找到地图中对应的位置了，事实上google地图就是通过训练这样的机器学习模型来进行地图信息标注的。要解决这个问题，可以读取google街景中的照片数据，然后训练一个机器学习模型来提取门牌号信息。如下图所示，当我们可以识别图片中的门牌号"42"了，我们就可以在地图上面进行标注了。

阅读全文 »

大规模Tensorflow网络的一些技巧

发表于 2017-01-16 更新于 2023-06-16 分类于 machine-learning 阅读次数：
本文字数： 7.9k 阅读时长 ≈ 13 分钟

今天给大家分享一下，在网络规模越来越大时，我们会遇到什么问题，以及如何使用tensorflow来应对。下面将会给大家分享一些有用的tips。

大规模网络的特征

首先我们来看一下用什么来衡量网络规模。

下图是alexnet的网络结构图，在2012年的imagenet图像分类挑战中，alexnet取得了80.2%的top-5正确率。

阅读全文 »

RNN和LSTM从理论到实践二：RNN和LSTM模型

发表于 2016-12-11 更新于 2023-06-16 分类于 machine-learning 阅读次数：
本文字数： 15k 阅读时长 ≈ 25 分钟

本文是上一篇文章『RNN和LSTM从理论到实践一：词向量』的续文。

上一章中，我们了解了词向量怎样训练，并跟随udacity上面的例子及问题动手实践了Skip Gram和CBOW模型训练算法。我们也顺带看了一下什么是语言模型，以及基础的n-gram模型是怎么样的。这次我们将要在前面的基础上，看看RNN和LSTM模型是什么样的，并将和大家一起动手去实现一个LSTM模型用于生成一个句子。

我们的问题

先来看我们的问题，然后让我们带着问题，来学习RNN和LSTM。这次我们要解决的问题是：如何生成一个看起来还不错的句子。

我们之前介绍过n-gram，那么我们能不能使用n-gram去预测单词，进而生成一个句子呢？我们可以使用频率统计来计算n-gram的语言模型：

阅读全文 »

让机器自己玩游戏

发表于 2016-12-05 更新于 2023-06-16 分类于 machine-learning 阅读次数：
本文字数： 7.5k 阅读时长 ≈ 13 分钟

大家好，这次要跟大家分享一个很炫酷的东西。我们要实现一个机器学习算法，这个算法可以通过观察屏幕，产生一系列操作，进而控制游戏，取得高分。

我们的目标

Atari是1972年成立的一家美国公司，主要做的是街机、家用电脑、家用游戏机。很多早期的经典游戏都是出自Atari，比如什么乒乓球、网球、各种弹珠游戏等等。我们今天要让机器来玩的游戏就是出自atari的游戏，名为breakout。这个游戏是基于乒乓球的玩法的一个游戏，与乒乓球不同的是，这个游戏可以由单人控制。相信只要是80后，肯定都玩过这个游戏。

阅读全文 »

RNN和LSTM从理论到实践一：词向量

发表于 2016-12-02 更新于 2023-06-16 分类于 machine-learning 阅读次数：
本文字数： 17k 阅读时长 ≈ 29 分钟

本文试图帮大家理解深度学习中的两大重要而基础的模型RNN和LSTM，并结合google在udacity上面关于深度学习的课程习题进行实践。

近两年深度学习在自然语言处理领域取得了非常好的效果。深度学习模型可以直接进行端到端的训练，而无须进行传统的特征工程过程。在自然语言处理方面，主要的深度学习模型是RNN，以及在RNN之上扩展出来的LSTM。RNN和LSTM也可以广泛用于其他序列处理和预测的机器学习任务。

RNN，全称为Recurrent Neural Network，常译为循环神经网络，也可译为时序递归神经网络，很多人直接简称为递归神经网络。另一个模型Recursive Neural Network，缩写也同样是RNN，译为递归神经网络。递归神经网络是时序递归神经网络的超集，它还可以包括在结构上有递归的神经网络，但是结构递归神经网络使用远没有时序递归神经网络使用得广泛。

本文包括四个部分：

NLP
单词的向量表示
RNN和LSTM理论介绍
训练一个LSTM模型

阅读全文 »