机器学习平台架构实践--面向对象设计

发表于 2020-05-24 更新于 2020-09-06 分类于机器学习，架构阅读次数：
本文字数： 5.9k 阅读时长 ≈ 10 分钟

面向对象的程序设计思想多年来一直是我们进行软件设计的有效的指导思想。由于我们天生理解大自然的机制就是面向对象的（比如我们到了某一个商店，我们会看到门店、售货员、货架、货架上的货物等等，这些都是一个一个的对象，我们认识整个商店也就是去认识商店中的每个对象。），而面向对象程序设计思想恰好与这一机制相一致，所以一个面向对象设计做得好的系统就很容易为我们所理解。

对于一个机器学习平台，应该如何实践面向对象程序设计思想呢？

面向对象的抽象

回顾前面两篇文章的内容，机器学习平台具备这样的架构：

阅读全文 »

机器学习平台架构实践--配置管理

发表于 2020-05-23 更新于 2020-08-25 分类于机器学习，架构阅读次数：
本文字数： 3.1k 阅读时长 ≈ 5 分钟

随着系统功能越来越多，系统的配置也越来越多，配置管理成为了一个重要的问题。做过线上运维的同学们一定对配置的复杂性有深刻体会，多少次加班都是因为一个配置不对而导致系统无法正常工作！配置问题由于难以建立有效的自动化测试而难以检测，常常使得我们不得不花费数小时甚至数天来调试才能找到配置上的问题。

对于分布式计算，这个问题变得更加突出了，熟悉分布式大数据处理的同学们对于分布式任务的复杂配置一定深有感触。分布式系统本身的复杂性常常使得单个组件的配置就有上百个。而在微服务架构流行的当下，我们的系统越来越多以分布式的形式出现，系统的配置管理问题也越来越突出。

本文尝试分享一下我们在构建机器学习平台时对于配置管理方面的设计实践。

阅读全文 »

银行贷款业务是怎么一回事？

发表于 2020-07-07 更新于 2020-07-08 分类于业务阅读次数：
本文字数： 4.3k 阅读时长 ≈ 7 分钟

说起银行贷款，我们绝大多数人应该都用过这个业务。比如，我们上大学，不少人办理过国家助学贷款。看这个贷款名字，好像跟银行没什么关系。但其实办理过这个贷款的同学都知道，这个贷款是我们跟银行产生的一个借贷关系。我们需要跟银行签订贷款合同，毕业后还款也是向银行还款。只不过因为是助学性质，国家会有一定的优惠贴息。再比如，我们买房，现在房价很高，对于一个主要靠自己的收入作为买房资金来源的同学，不贷款几乎不可能。不管是商业贷款还是公积金贷款，这里面都是银行在提供贷款业务。对于个人经营需要，企业发展需要，银行贷款就更是少不了了。

阅读全文 »

极速软件发布的实现

发表于 2020-06-01 更新于 2020-06-02 分类于工作流，敏捷，架构阅读次数：
本文字数： 2.9k 阅读时长 ≈ 5 分钟

在当下很多的应用场景中，我们常常会想要应用具有一定的灵活性，以便我们可以在线调整计算逻辑，而不需要重新发布应用。这可能也可以称为以极限的速度发布软件的方式。

AB测试可以说解决了一部分这样的需求，使得我们可以在线的针对部分用户改变应用的行为。但AB测试需要我们预先定义并实现两套逻辑，然后通过线上配置来应用不同的逻辑。显然，在可自定义的程度上，AB测试是非常弱的。如果我们想要更大规模的调整应用的逻辑，AB测试就不够了。

阅读全文 »

机器学习平台架构实践--微服务

发表于 2020-05-22 更新于 2020-05-23 分类于机器学习，架构阅读次数：
本文字数： 5.1k 阅读时长 ≈ 9 分钟

一个项目越复杂，架构的作用就越显得重要。这就跟收拾家里面的东西一样，如果我们只有为数不多的几件物品，即便我们随意摆放，也不会妨碍我们找到想要的东西。但是随着购置的物品越来越多，如果不设置一套摆放规则，那么想找到东西就可能会花费大量的时间，效率低下。在我看来，架构就像这样一套摆放东西的规则。规则设置得好，屋子里面的东西将摆放得井井有条，我们的生活不仅将更高效也将更舒适顺心。

在最近的一个项目上，我们和客户一起建设了一个机器学习平台。对于某一个机器学习项目，最重要的四个部分是特征处理，模型探索，模型训练与模型推理。构建一个平台的目的是将这四个部分中通用的能力沉淀下来。一个成功的平台可以为新的机器学习项目提供基础设施，让项目快速起步，还可以使得项目组更专注在模型优化上而提升模型迭代效率。

阅读全文 »

仪式感与专业服务

发表于 2019-12-02 分类于敏捷阅读次数：
本文字数： 2.2k 阅读时长 ≈ 4 分钟

进门，双手帮你脱下外套，挂起。洗发师双手提起一件深色防水的丝质套衫，你伸手，换上。拿起腰带，穿过你的腰，两圈，拉扯一次，拉扯两次，系紧。抹平套衫肩部，拉住袖口，拉扯一次，拉扯两次，展平。拉住套衫底部，拉扯一次，拉扯两次，拉齐。

将你带到洗头处，你看到一个用于平躺的台面，台面上深色皮质的垫子分为两部分，前面部分可拆卸，上放一块叠起来的深蓝色毛巾，毛巾上面是一朵颜色鲜艳的大荷花。在台面前部放有一个与垫子同样深色皮质的单人凳。

洗发师伸开右手，将你迎向凳子坐下。介绍洗头服务：我是37号洗发师为您服务，本次洗发50分钟，请您稍坐，我去准备毛巾和其他用品。

阅读全文 »

从改善设计的角度理解TDD

发表于 2019-07-20 更新于 2019-08-25 分类于 tdd ，敏捷阅读次数：
本文字数： 6k 阅读时长 ≈ 10 分钟

TDD有很多好处，但是广大程序员却总是难以接受。即便在我们ThoughtWorks，有着非常浓厚的TDD氛围的公司里，接受起来也依然不是一件简单的事情。我曾经见过一些在我们公司工作过一年甚至两年的同事，对TDD的理解都还停留在比较粗浅的认识上，平时的实践也难以跟上。

阅读全文 »

5行代码的自动评论机器人

发表于 2017-12-07 分类于小技巧阅读次数：
本文字数： 755 阅读时长 ≈ 1 分钟

又到小米发布会了，这次发布会将从发布评论的人里面选人，每分钟送一台小米手机。
于是写了几行代码自动发评论，省去了手工的麻烦。娱乐一下，碰个运气。

直播地址：https://hd.mi.com/x/12041b/index.html?client_id=180100041086&masid=17409.0195

代码如下：

// 随机选择一个当前评论列表里面的评论
var r = () => Math.floor((Math.random() * $('.livechat-list-wrapper .list li').length))
// 提取选中的评论的内容
var text = () => $($('.livechat-list-wrapper .list li')[r()]).find('.content').text()
// 使用选中的内容自动发评论
var c = () => {$('#J_chatContent').val(text());$('#J_sendChatBtn').attr('class', 'btn active');$('#J_sendChatBtn').click();}
// 生成随机的间隔时间
var rtime = () => Math.floor(Math.random() * 15000 + 5000)
// 设置一个计时器定时发评论
var st = () => stt = setTimeout(() => {c(); st()}, rtime())
st();

以上代码粘贴到控制台执行就可以了。

本地搭建OpenShift集群指南

发表于 2017-10-24 更新于 2017-11-16 分类于 DevOps 阅读次数：
本文字数： 7.9k 阅读时长 ≈ 13 分钟

Local Openshift Cluster Installation Guide

Preparation

Hosts

1 control host, 1 master and 3 nodes
centos 7

Install packages on control host

Run yum install -y python2-passlib httpd-tools

阅读全文 »

OpenShift工作坊

发表于 2017-10-28 分类于 DevOps 阅读次数：
本文字数： 10k 阅读时长 ≈ 17 分钟

Target

A simple nodejs application
Add mongodb to the application
CI/CD for the application
Logging, Monitoring, Debugging

A simple nodejs application

Introduction

In this section, We are going to create a nodejs project with mongodb in OpenShift. We assume that you have done all the preparation work listed in the invitation email of this workshop. And there’re some additional steps to get yourself ready.

阅读全文 »