可观测性平台在伴鱼的实践

王超发表于 2023-06-25 更新于 2023-06-26 分类于系统设计阅读次数：

背景

伴鱼后端服务采用微服务架构部署，目前在服的服务有 800+。在 2019 年，公司就引入 Jaeger，
搭建自己的调用链追踪系统，目前每天写入的数据接近 100 GB / 天。但系统在实际生产使用中，依然不甚满意，主要症结在于：

系统采用头部连贯采样（head-based coherent sampling）的 Rate Limiting
限流采样策略，即在 trace 的第一个 span 产生时，就根据限流策略：每个进程每秒最多采 1 条 trace，来决定该 trace 是否会被采集。
这就会导致小流量接口的调用数据被采集到的概率较低，叠加服务出错本身就是小概率事件，因此错误调用的 trace 数据被采集到的概率就更低。
即使错误调用 trace 数据有幸被系统捕捉到，但 trace 上只能看到本次请求的整体调用链关系和时延分布，除非本次错误是由某个服务接口超时导致的，
否则仅凭 trace 数据，很难定位到本次问题的 root cause。
就算 trace 数据中能明显看到某个服务接口超时，但引发超时的并不一定是该接口本身，可能是该服务(或数据库、缓存等三方资源)被其他异常请求耗尽
资源，而导致本次请求超时。

本文将从「数据基础建设」、「深入挖掘分析」和「效果展示」三个方面，来介绍伴鱼是如何解决以上难题，并沉淀和固化自己的最佳实践。

...

阅读全文 »

伴鱼智能陪练在语音识别及对话测评技术的演进

王乐发表于 2021-12-07 更新于 2023-06-26 分类于系统设计阅读次数：

背景

伴鱼智能陪练系统是伴鱼推出的基于 AI 技术的大规模销售人员培训工具，通过配置常见工作场景的工作流，让销售人员与虚拟机器人对话，对话完毕后测评对话的准确性，达到销售新人快速上手的效果，目前通过 SaaS 形式对外提供服务，详情可点击这里。

伴鱼智能陪练系统在使用过程中最大的痛点是语音识别及对话测评过程过慢，导致每次流程流转过程中用户需要等待较长时间，非常影响用户体验。下面主要介绍在语音识别及对话测评方面的技术演进。

...

阅读全文 »

伴鱼大数据权限系统的设计与实现

李辉发表于 2021-10-08 更新于 2023-06-26 分类于系统设计阅读次数：

伴鱼早期，整个大数据仓库下的数据基本处于裸奔状态，没有做任何的权限校验与审计，用户可以对数据为所欲为，这个阶段主要考虑效率优先。随着业务的发展，数据安全的重要性愈发突显，大数据权限系统因运而生，本文将向大家介绍伴鱼大数据权限系统的设计与实现。

...

阅读全文 »

动态性能分级策略在客户端上的实践

赵杰、岑志军、吕洪阳发表于 2021-08-31 更新于 2023-06-26 分类于客户端开发阅读次数：

背景

伴鱼绘本发布至今已有 5 年，作为一款主要面向儿童的 App，其包含大量游戏化场景和多媒体资源来保证内容的趣味性、丰富性。我们的产品面向海内外用户，统计发现 iOS 设备中约 3 成是已发布 5 年以上的旧设备。旧的设备意味着 CPU 运算能力差、内存小，同时国外网络环境相较于国内要差。所以在保证产品趣味性和丰富性的同时，我们要让程序维持优秀的用户体验，在各种不同性能的设备上流畅运行。

...

阅读全文 »

iOS文本的多语言适配和实践

吕洪阳、赵杰发表于 2021-08-30 更新于 2023-06-26 分类于 iOS开发阅读次数：

背景

产品被多个国家使用，产品方希望产品拥有更好的多语言使用体验，所以设计师提供多种字体来适配指定的语言。基于以上背景，客户端需要快速给出解决方案并且上线。

字体包的多语言适配和实践

需求分析

首先，在了解产品需求和设计方案之后，结合业务研发人员的痛点，整理出以下需求。

...

阅读全文 »

伴鱼机器学习预测服务：设计篇

陈易生发表于 2021-08-25 更新于 2023-06-26 分类于 AI平台阅读次数：

前言

在伴鱼，我们在多个在线场景使用机器学习提升用户的使用体验。例如，在伴鱼绘本中，我们根据用户的帖子浏览记录，为用户推荐他们感兴趣的帖子。

在线预测是机器学习模型发挥作用的临门一脚，重要性不言而喻。在伴鱼，我们搭建了机器学习预测服务（以下简称预测服务），统一地处理所有的预测请求。本文主要介绍预测服务的演进过程。

...

阅读全文 »

伴鱼数据集成平台的设计与实现

李辉发表于 2021-08-23 更新于 2023-06-26 分类于系统设计阅读次数：

数据仓库有四个基本的特征：面向主题的、集成的、相对稳定的、反映历史变化的。其中数据集成是数据仓库构建的首要前提，指将多个分散的、异构的数据源整合在一起以便于后续的数据分析。将数据集成过程平台化，将极大提升数据开发人员的效率，本文将向大家介绍伴鱼基于 Flink 构建的「数据集成平台」的设计与实现。

A data warehouse is a subject-oriented, integrated, nonvolatile, and time-variant collection of data in support of management’s decisions.—— Bill Inmon

...
阅读全文 »