0%

以下是一组某电商应用消费数据,你能从中看出什么?

日期 2019/06/01 2019/06/02 2019/06/03 2019/06/04 2019/06/05 2019/06/06 2019/06/07
金额(万) 213 181 163 147 152 155 171

我们应该能很容易的注意到:

阅读全文 »

如果我们想知道一所办公楼的所有人员的平均身高,该怎么做?大家应该都能想到,我们可以通过统计抽样的办法,随机去调查一些人的身高,然后通过这些人的平均身高去估计所有人员的平均身高。但这里还有一个问题,这里抽样得到的平均身高准吗?有多准呢?

要回答这里的问题,我们需要有一些基本的统计学知识。

阅读全文 »

你的收入和支出相关吗?这是一个很难回答的问题,表面上看好像是相关的,因为随着收入的增长,有了更多的钱,当然可以有更多的支出。但是,很多公司一年才涨一次工资,在这一年内,物价却可能在不停上涨,是不是收入没涨而每个月的支出都在涨呢?

如何来回答是否相关的问题呢?用统计学的方法,我们可以把收入和支出当做两个变量来对待,然后用数学的方法衡量其相关性。

阅读全文 »

数据工作中有一类非常重要的角色,那就是数据分析师。为什么这个角色这么重要呢?因为要是没有这个角色,不管一个企业中的数据管理做得有多么好都没用,无法带来实际的价值。这些数据就像是藏在海底的石油,而数据分析师就是开采海底石油的油井设备。要想让石油用于汽车轮船,需要通过这些设备先将海底的石油抽取出来,经过加工处理,提纯。

阅读全文 »

DORN模型的重现

DORN模型是在单图像深度估计问题上效果非常好的模型,18年刚发布的时候,就同时在KITTI数据集和ScanNet数据集上面取得了Robust Vision挑战的第一名。

阅读全文 »

作为每天和AI模型打交道的开发者,深度学习模型在不同的框架之间转换一直是一个老生常谈的问题。为了让这个问题变得容易,大家做了很多这样的工作,像是微软推出的MMdnn工具,号称可以将模型在几乎所有的流行AI框架中转换,又比如Facebook和微软一起推出的ONNX不依赖具体框架的中间格式等。

阅读全文 »

EfficientNet是谷歌AI科学家们在论文《EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks》中提出的模型。这篇文章不仅提出了这个模型,还系统地研究了模型扩展的问题,大家感兴趣的,可用阅读一下论文原文。EfficientNet的亮眼之处在于,其在保持领先的性能的同时,将模型的参数数量和预测速度都提升了一个数量级。请看下图的性能对比:

阅读全文 »

python json serializable

在Python的世界里,将一个对象以json格式进行序列化或反序列化一直是一个问题。Python标准库里面提供了json序列化的工具,我们可以简单的用json.dumps来将一个对象序列化。但是这种序列化仅支持python内置的基本类型,对于自定义的类,我们将得到Object of type A is not JSON serializable的错误。

阅读全文 »

TDD有很多好处,但是广大程序员却总是难以接受。即便在我们ThoughtWorks,有着非常浓厚的TDD氛围的公司里,接受起来也依然不是一件简单的事情。我曾经见过一些在我们公司工作过一年甚至两年的同事,对TDD的理解都还停留在比较粗浅的认识上,平时的实践也难以跟上。

阅读全文 »

我们每天都在用某种编程语言写代码,但是我们真的了解它们是如何工作的吗?代码是如何转换为计算机可以识别的机器码的呢?

了解编程语言的工作原理,不仅可以让我们深入理解某一种编程语言,某些时候还可以帮助以一种更优雅的方式实现想要的功能。比如我们平时谈论很多的DSL(Domain Specific Language),在定义了DSL之后,我们如何做更进一步的支持呢?事实上我们还可以实现DSL的自动错误检查,还可以将其转化为某种可以执行的程序等等。还比如我们经常遇到的模式识别问题,状态机相关问题等等。对于这些问题,编程语言的实现原理可以给我们很多启示。

阅读全文 »