以下是一组某电商应用消费数据,你能从中看出什么?
日期 | 2019/06/01 | 2019/06/02 | 2019/06/03 | 2019/06/04 | 2019/06/05 | 2019/06/06 | 2019/06/07 |
---|---|---|---|---|---|---|---|
金额(万) | 213 | 181 | 163 | 147 | 152 | 155 | 171 |
我们应该能很容易的注意到:
以下是一组某电商应用消费数据,你能从中看出什么?
日期 | 2019/06/01 | 2019/06/02 | 2019/06/03 | 2019/06/04 | 2019/06/05 | 2019/06/06 | 2019/06/07 |
---|---|---|---|---|---|---|---|
金额(万) | 213 | 181 | 163 | 147 | 152 | 155 | 171 |
我们应该能很容易的注意到:
如果我们想知道一所办公楼的所有人员的平均身高,该怎么做?大家应该都能想到,我们可以通过统计抽样的办法,随机去调查一些人的身高,然后通过这些人的平均身高去估计所有人员的平均身高。但这里还有一个问题,这里抽样得到的平均身高准吗?有多准呢?
要回答这里的问题,我们需要有一些基本的统计学知识。
你的收入和支出相关吗?这是一个很难回答的问题,表面上看好像是相关的,因为随着收入的增长,有了更多的钱,当然可以有更多的支出。但是,很多公司一年才涨一次工资,在这一年内,物价却可能在不停上涨,是不是收入没涨而每个月的支出都在涨呢?
如何来回答是否相关的问题呢?用统计学的方法,我们可以把收入和支出当做两个变量来对待,然后用数学的方法衡量其相关性。
数据工作中有一类非常重要的角色,那就是数据分析师。为什么这个角色这么重要呢?因为要是没有这个角色,不管一个企业中的数据管理做得有多么好都没用,无法带来实际的价值。这些数据就像是藏在海底的石油,而数据分析师就是开采海底石油的油井设备。要想让石油用于汽车轮船,需要通过这些设备先将海底的石油抽取出来,经过加工处理,提纯。
DORN模型是在单图像深度估计问题上效果非常好的模型,18年刚发布的时候,就同时在KITTI数据集和ScanNet数据集上面取得了Robust Vision挑战的第一名。
在Python的世界里,将一个对象以json格式进行序列化或反序列化一直是一个问题。Python标准库里面提供了json序列化的工具,我们可以简单的用json.dumps
来将一个对象序列化。但是这种序列化仅支持python内置的基本类型,对于自定义的类,我们将得到Object of type A is not JSON serializable
的错误。
TDD有很多好处,但是广大程序员却总是难以接受。即便在我们ThoughtWorks,有着非常浓厚的TDD氛围的公司里,接受起来也依然不是一件简单的事情。我曾经见过一些在我们公司工作过一年甚至两年的同事,对TDD的理解都还停留在比较粗浅的认识上,平时的实践也难以跟上。
我们每天都在用某种编程语言写代码,但是我们真的了解它们是如何工作的吗?代码是如何转换为计算机可以识别的机器码的呢?
了解编程语言的工作原理,不仅可以让我们深入理解某一种编程语言,某些时候还可以帮助以一种更优雅的方式实现想要的功能。比如我们平时谈论很多的DSL(Domain Specific Language),在定义了DSL之后,我们如何做更进一步的支持呢?事实上我们还可以实现DSL的自动错误检查,还可以将其转化为某种可以执行的程序等等。还比如我们经常遇到的模式识别问题,状态机相关问题等等。对于这些问题,编程语言的实现原理可以给我们很多启示。