查看原文
其他

i 智慧 | 为云而生、多快好省,这就是星星海的style!

晶少 CSDN云计算 2019-11-27
戳蓝字“CSDN云计算”关注我们哦!
作者 | 晶少
责编 | 阿秃
出品 | CSDN云计算(ID:CSDNcloud)

不久之前,腾讯云刚刚对外上新了一款服务器,号称深度自研且独一无二,其名字也十二分的卡哇伊,叫做“星星海”。晶少虽然还没来得及探寻其名的出处,不过在与腾讯服务器供应链总经理刘裕勋的谈聊中已基本了解到星星海的重要style之一,为云而生。



星星海,腾讯首款为云而生的服务器,不是简单挂个响亮的标签而已。深入剖析 “为云而生”的理念,我们恐怕还要追溯到通常情况下的服务器研发过程。我们发现,一般情况下的服务器研发很难规避“堆砌”的窘境,所谓A用户需要A类特性,B用户又要求B种风格,一来二去整个架构变得异常复杂,企业级服务器更是如此,因为需要满足更多企业以及用户的需求;而相比之下此处的“为云而生”,很重要的一点就是要依照云的属性进行设计甚至优化。所以在设计部署过程中,星星海果断结合了数据中心实际部署环境要求,针对云端的计算、存储、网络等场景做了重点优化,据了解能够有效满足腾讯云98%应用场景需求。


“其实每个软件产品对相应硬件的配置要求均有不同,但如果可以使用同一套服务器架构,无论是CPU内存还是基础存储,都可以满足软件层面产品的需求,自研技术上达到了承上启下,也被称为软硬协同。”刘裕勋表示。在这样的想法驱使下,星星海通过精细的硬件设计大幅度降低了硬件成本和运营成本,同时有效匹配腾讯服务器供应链整体升级,更好整合了硬件产业链能力。



除了从云出发,高效利用硬件资源之外,星星海很重要的一点还表现在精简,有数据显示相比传统服务器,星星海在整个用料剪裁方面超过了20%,这种“好与省”尤其在能耗上体现突出。例如10万台星星海服务器组成集群,相比传统服务器实际上每年都会节省超过5亿度的用电量,毕竟电量消耗的百分之五十均来自服务器的能耗,当然这种精简精神是对标传统而言。


在星星海对外官宣的介绍中,我们发现,其与传统服务器相比很重要的一点就是整机方案可以支持不同的CPU主机类型,兼容架构具有较高的前瞻性,硬件基础被统一规划且放言可支持未来3-5年的服务器产品演进。有资料显示,其联合AMD在最新ROME平台下深度定制CPU,实现了行业最优单核性能和最优单核TCO。根据晶少了解,星星海可以实现云服务实例综合性能提升35%以上,其中视频处理速度提升40%,图形转码得分提升35%,Web服务页面QPS提升高达152%。


谈及深度定制AMD的CPU,刘裕勋提出,腾讯作为AMD七大CSP之一,在测试过程中发现的相关问题一经反馈就会得到AMD方面的高度重视,并用于AMD产品技术升级的重要参考之一。以本次星星海服务器深度定制CPU为例,先前AMD对外发布的CPU只有两种类型,分别为32核与64核,而星星海在最新的rome平台下定制的单颗CPU为48核,此区别主要源于腾讯云方面针对内存开销和整个服务器性能开销的综合评定与兼顾。相比通常售卖的两套CPU搭载一个8G内存的传统形式,具体来说基于腾讯云海量数据的运营,48核的CPU无论是主频还是性能上都达到了最佳的适配效果。通俗来说,如果替换成一个更高阶的CPU,其能耗就会大大增加,说到这里,刘裕勋还特地列举了十分幽默诙谐的例子让大家能够更加形象生动的了解:一张餐桌本可以容纳十人就餐,如果每个就餐的人都是体重超过200斤的肥胖者,想必这样的就餐环境就会显得拥挤很多,而每一个身材肥胖的就餐者就像一枚高能耗的CPU,在实际使用过程中肯定会出现诸多问题。除了深度定制的CPU助力,在配套日虹散热技术的加持使用下,星星海实现了最大负载能效对比业界可提高50%,尽管该技术不算是业界散热的新理论,但实际落地,星星海算是杰出代表之一。


“确实,星星海对于我们来说算是first one,但绝不是only one,我们已经把未来3-5年对云计算硬件服务器领域的发展趋势做了充分的认证,使服务器整套方案能够满足未来3-5年的产品演进。可以简单理解为,就是这样一套服务器方案,当面对新的技术应用层出不穷之时,只需要作出细微调整而不改变大的架构方向,就可完成技术适配与升级。”晶少得知,在星星海设计到量产不到一年时间这样的速率下(一般传统的服务器厂商,从 概念设计到可能的量产部署,一般周期在一年半到两年),未来到年底将会部署至少超过五千台的规模在腾讯云现有的业务领域中,可谓“又多又快”的节奏。


正常预测的话,在今年春节的QQ抢红包环节或者微信业务都能够直接运行在星星海上。通过快速部署在腾讯的公有云产品上,而且用自研QQ和微信,如此庞大体量的业务去做拉测来打磨整个硬件和软件产品,相信通过这种方式“锻炼”出来的腾讯云星星海能够更加高效为用户提供性价比优势的计算产品,赢在场景的丰富性。


谈及星星海的未来,刘裕勋提出了适配不同CPU架构的方向,其中包括英特尔、国产化架构抑或是自研芯片等,毕竟对于云服务商来说,降本增效历来都是永恒的主题。“如果没有办法每年都提供优质、高性价比的产品给用户,一定程度上相当于整个腾讯云的竞争优势会受到影响。我们更愿意通过产业互联网的思维,基于多年在用户体验方面的打磨,实现针对性能和成本的极致追求;通过经营化和演进能力,提供高性价比产品来降低企业或者客户上云的成本或者用云的开销,进而促进整个产业互联网的蓬勃发展。”

背景资料


就在腾讯Techo开发者大会上,腾讯云副总裁、云架构平台部总经理谢明首次对外披露了腾讯基础设施演进与创新历程。 他介绍在微信、QQ等国民级业务不断发展的背后,包括服务器、网络、IDC、计算、存储、数据库等在内的基础设施和技术架构一直在不断进化,目前已经进入“生而为云”的新阶段。


腾讯今年在基础设施建设方面迎来了重要里程碑。其中腾讯全网服务器总量超过100万台,网络带宽峰值也突破100T,谢明表示在云时代,腾讯基础架构还将继续通过自研、定制化等手段,向极致弹性和智能化的方向进化。
 
此外腾讯也在网络层面不断精进,目前已经与全球超过800家运营商建立了网络互连,同时还基于SDN和NFV自研分布式路由器集群替换传统商业大型路由器,实现全网所有的软件路由器的集中管控,做到根据目的IP做单个用户的流量调度;通过构建开放光网络,基于SONiC自研交换机等,将网络设备TCO下降20%+。 


在存储方面,腾讯早在2006年便针对Q-zone相册业务场景自研了分布式存储TFS,支持了Qzone相册每天亿级别的图片上传。目前腾讯云对象存储COS实现了集群全体节点参与系统吞吐,磁盘利用率达到90%以上,同时系统的完全自治也大幅降低了运维的人工投入。
 
数据库的演进也与腾讯业务发展节奏一脉相承。从最早的MySQL开始,经历QQ、Q-zone等业务爆发增长,逐渐选择了数据库自研路线。目前腾讯云也通过开源托管、商业合作、自主研发三管齐下,提供了接近20种数据库产品。




福利
扫描添加小编微信,备注“姓名+公司职位”,入驻【CSDN博客】,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!



推荐阅读:
真香,朕在看了!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存