Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 104|回复: 1

每次都检查您的乘车

[复制链接]

1

主题

1

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2023-2-11 13:25:19 | 显示全部楼层 |阅读模式
本帖最后由 阿米娜818 于 2023-2-11 13:29 编辑

我们与 工程团队中的合作伙伴密切合作,设计和开发了满足 性能要求的服务器。新一代服务器与我们构建的新区域中的 兼容。因此,采用这些新服务器也意味着对容器进行标准化以与 兼容。 挑战 在我们进行 容器化和硬件升级工作的初始阶段时,我们预见到以下三个核心技术挑战: 服务发现: 是 整个批处理分析堆栈的存储层。大多数客户端使用一对硬编码的 主机名(在 中)访问 。超过 万个日常分析工作 查询和数千个服务使用的 中此类客户端(语言、版本、自定义客户端)的变化使得以可靠的方式执行需要主机名和 或 地址更改的任何迁移变得很麻烦。由于意外行为,任何主机名 更改都会带来破坏特定客户端集的风险。 集群中的不同组件之间存在一个较小版本的服务发现问题。


我们必须设计一种方法来标准化客户端对 及其组件的访问,并使它们能够适应组件的主机 更改。 解决性能问题: 每个集群有 亿多个块,我们的 配置了超过 的 堆大小。 中的 因内存管理方面的差异而臭名昭著。因此, 的容器 赌博电子邮件列表 化带来了额外的风险,可能会降低集群性能及其服务流量的能力。在迁移过程中,我们不得不小心翼翼地监控堆使用情况和其他重要指标。这导致我们运行多次负载测试迭代并调整多项设置以遵守我们的 保证。 零停机迁移:在优步,我们对迁移期间服务的可用性保持高标准。使用 将低延迟摄取(某些数据集在 小时内)到数据湖中,我们无法承受生产 集群的长时间停机。在过去的 年里,我们在 上执行的任何迁移或升级都没有停机。



为确保我们不会因为这项工作而出现任何停机时间,我们必须设计一种迁移策略来避免停机时间并定义回滚标准以实现快速缓解。我们将在本博文的后半部分介绍我们是如何构思迁移策略的。 建筑学 旧设置涉及 控制平面组件 等)的裸机部署。部署过程允许以各种形式在主机上进行更改,包括主机配置、二进制文件、集群配置和自动化脚本。部署的可变性经常导致节点 集群之间的分歧和手动错误。额外的操作开销、随叫随到的问题和跟踪更改一直阻碍着我们对 控制平面和 客户端进行更改的速度。这种情况还导致其他需要主机级升级的工作(例如操作系统和内核升级)出现延误。这种经验对我们的 控制平面新架构和迁移策略产生了重大影响。 很明显,从长远来看,以前运行 的模式不会很好。


回复

使用道具 举报

0

主题

734

帖子

1474

积分

金牌会员

Rank: 6Rank: 6

积分
1474
发表于 2023-3-28 03:46:28 | 显示全部楼层
好好好好好好好好好好好好好好好好好顶
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|DiscuzX

GMT+8, 2025-6-23 22:11 , Processed in 0.044906 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表