0%

意图识别是构建可靠人机交互系统的核心技术,其意义在于通过精准判断用户需求,为后续处理提供确定性基础。

尽管大型语言模型(LLM)具备强大的生成能力,但其输出可能生成错误、矛盾甚至违规信息。在金融、医疗、法律等监管严格领域,直接使用 LLM 结果可能引发合规风险,甚至导致重大经济损失或法律纠纷。

因此,多数严谨系统仍采用传统分层架构:首先通过意图识别技术解析用户输入的核心诉求(例如判断用户是查询账户余额、还是咨询理财问题);随后根据预设规则执行对应业务流程,调用专门的数据接口或知识库进行响应。

这种架构的优势在于:意图识别环节可过滤无效请求并拦截高风险输入,处理环节则通过结构化流程确保合规性与结果可靠性,既发挥人工智能的辅助作用,又通过分层设计规避技术不确定性带来的潜在危害。

因此,意图识别仍然是构建智能系统非常重要的一环。

阅读全文 »

经济学里面有一个名为“外部性“的概念。外部性是指一个人或企业的行为对其他人或企业产生的影响。

外部性可以是正的,也可以是负的。比如,一个企业的生产活动可能会产生污染,这就是一种负的外部性,对周围的环境和居民造成了伤害。相反,一个企业的生产活动也可能带来正面的外部性,比如提高周围地区的就业机会或改善周围地区的基础设施。

外部性对于组织职责划分的启示

阅读全文 »

概述

From Martin Fowler microservices:

微服务架构即是采用一组小服务来构建应用的方法。
每个服务运行在独立的进程中,不同服务通过一些轻量级交互机制来通信, 例如 RPC、HTTP 等。
服务围绕业务能力来构建,并依赖自动部署机制来独立部署。

From Sam Newman [Building Microservices]:

You should instead think of Microservices as a specific approach for SOA in the same way that XP or Scrum are specific approaches for Agile software development.

微服务即SOA的一种实现方式。企业服务总线(ESB)设计的失败给SOA带上了负面的标签。

阅读全文 »

最近在一个网站上,看到了很炫的网页特效:视频背景透明。该网址是:http://videostir.com/。他们还为用户提供了制作透明视频的服务。用户只需要上传他们要求的格式的视频,就可以生成一个透明的视频。

正如该网站所演示的,这种视频作为网站的引导,效果非常赞,互动的感觉非常强烈。

阅读全文 »

前面的文章《我理解的Smart Domain与DDD》中,我们分析了 Smart Domain 的设计,尝试回答了为什么 Smart Domain 可以用于实现 DDD,并对Smart Domain和DDD进行了一些扩展性的讨论。

虽然 Smart Domain 作为一种设计范式,可以辅助我们实现 DDD。但是具体到真实项目中,建模这个过程还得结合实际的领域问题,深入思考,大量尝试,大声建模,才能得到好的模型。有哪些值得参考的案例呢?下面分享几个个人在项目中觉得还不错的建模实践。

阅读全文 »

前段时间,咱们CTO八叉在极客时间做了一次关于用Smart Domain实现DDD的分享(点击这里回看)。一个新词Smart Domain进入大家的视野。

Smart Domain解析

Smart Domain是啥?为什么可以用Smart Domain实现DDD?本文尝试结合以往对DDD的学习和实践的经验,跟大家分享一下个人的理解。

八叉在分享中提到Smart Domain这个名字来源于Smart UI。我们都知道Smart UI是DDD中提到的一种反模式,只能用于解决简单问题。这里的命名略带反讽戏谑的意味。

阅读全文 »

新的一期技术雷达如期发布,仔细阅读了这一期的所有条目,CUPID这一条尤其让我产生共鸣。

CUPID出自Daniel的一篇名为《CUPID—for joyful coding》的博文,即《CUPID-为了快乐编程》。CUPID是Composable/Unix philosophy/Predictable/Idiomatic/Domain based几个单词的缩写,有经验的同学一看就知道这是好代码的一些属性。知道Cupid这个单词的同学还能感受到这一组属性所蕴含的对于软件工程的热情。Cupid的中文是丘比特,是指古罗马的爱神,其意象是一个长有翅膀的小孩,拿着弓箭射向人们,以便人们可以相互爱上对方。

CUPID for joyful coding

阅读全文 »

作为一个非专业c/c++开发人员,相信很多人跟我一样,常常会在跟c/c++打交道时碰到困难。然而,我们所使用的很多底层的库或软件,却有大量是用c/c++编写而成。所以,了解一些基本的c/c++知识对于非专业c/c++开发人员将非常有帮助。

在下面这些典型的场景中,我们可能会需要用到这些知识:

  • 当由于平台需要,我们需要自己编译某些c/c++项目
  • 当需要在非c/c++程序里面进行少量的c/c++开发,并与c/c++代码交互
  • 遇到一些常见的库找不到、版本不兼容等问题

本文尝试总结一下基本的c/c++知识,包括常见的平台、静态库/动态库的原理、基础编译指令等。并将结合一些实例来加深理解。

阅读全文 »

在前面的文章中提到我们在一个高性能场景中尝试了rust,那么它的效果如何呢?

在这次rust的尝试中,我们实现了一个通用的特征数据处理框架,并实现了几个常用的算子。这个数据处理框架目标是实现 Spark ML pipeline 的在线计算,为机器学习模型的在线推理场景提供特征处理。

我们选用了两个rustgrpc框架对外提供服务。它们分别是grpctonic,前者是基于线程池的实现,后者是基于rust异步模式async/await的实现。实验过程发现两者性能相差不大,tonic稍好,快2ms左右(不到5%),这可能是由于其数据结构设计更为精简带来的。

为了更有参考性,我们直接进行端到端的测试(用grpc客户端发起请求,在客户端采集数据),并与scala版本的实现进行性能对比。下面的结果中,服务端应用均部署在同一台64核心+32GB内存的服务器上,客户端也在此服务器上发起请求。由于数据处理的逻辑一致,客户端使用同一个java版本的实现。

阅读全文 »

在最近的一个客户项目上,为了做性能优化,我们花了大量的时间,然而最终结果还是不够理想。我们的场景是实现特征处理过程和机器学习模型线上推理服务。由于用户量巨大,我们需要做到2万的TPS,每个请求需要在30ms内返回,且每个请求中包括对1000个项目的处理过程。

我们所使用的技术栈是springgrpc。在经过极致的代码优化及内存调优之后,运行在一台32GB内存64核CPU的服务器上,我们发现90%的请求可以在25ms完成。但是如果观察99%的分位线时,响应时间就下降到了70ms,有时候还可能超过100ms

为什么会出现上面这么明显的波动呢?问题出在javagc上。其实对于gc,我们已经非常仔细的做过调优了,整个过程没有full gc的发生。然而,在持续的压力测试下,javayoung gc却在频繁的工作。由于处理的数据量过大,新生代的gc几乎每秒都会触发一次,每次释放5GB内存,耗时30ms左后。

阅读全文 »