新闻资讯
高压直流和UPS的恩怨史,谁将会笑到最后?
高压直流和UPS在IDC行业已经争论了很些年。每个阵营都有不少支持者和反对者。笔者最近去上海参加了Huawei Connect,和业界同行做了一些交流,决定写一篇文章谈一下这个问题。这篇文章不是为了酸某一方,或吹捧,更多阐述一下思考的技术和商业角度,行业产生不同观点看法很正常,交给时间印证。
之前朋友说我写的一些文章有时候观点不够鲜明,关于高压直流和UPS一方。笔者年初一篇文章也提及过,只是没有展开阐述具体论点,可以看看下面链接笔者之前发过的文章。
IDC技术发展预测——2019~2022年
笔者再补充一个观点,高压直流会成为 UPS体系一个分支作为补充,市场依然有,但壮大可能性小,市场机会在于存量博弈和目标客户的自然增量,发展速度会慢于交流UPS, 最终走向边缘化三大主要因素:
交流UPS不断技术以及成本变革超越高压直流,演变结果——大容量模块化UPS
IT技术发展配套电源形态变化,演变结果——服务器强耦合12V/48V电源架构
业务发展要求使用交流UPS
现在高压直流的采购主要靠BAT三大互联网用户背后做推手,硬靠几大用户的规模撑起一片天。高压直流经过这么些年发展,可惜并没形成行业用户的主流技术形态。高压直流也因此贴上 BAT数据中心的技术标签,这其实对产业链发展并不好,变成利基市场 。一旦这几大用户出现技术路线变更,这个利基市场就变得危险。笔者看到的情况是,本来想进入高压直流市场的厂商,选择退出,理由很简单,客户就这么几个,作为新玩家多半靠价格,没其他供应链拉通和成本分摊,游戏无法持续。现有玩家,价格战也应付得疲于奔命,利润不多影响长久的研发投入。互联网公司的大型项目,基本都是今天的最低价就是明天的入围价。行业除了几个用户使用,没其他客户产生足够利润,难以维持。所以这些年看到好几个高压直流厂商都停止研发新产品技术,这也给了UPS厂商迎头赶上的机会。
笔者会从下面几个角度对展开阐述
1. 技术逻辑和优劣比较
2. 优劣背后的条件和原因
3. 现有产业链生态的影响
废话不多说,直接上干货。
(一)技术逻辑和优劣
高压直流产生大致源于2011年,下面链接就是IDC圈2011年底的一篇文章介绍高压直流,印象中当时是电信IDC的技术率先试用和主导,之后被引入到BAT等互联网公司进行试点再到规模使用。
当时年代的技术背景,UPS市场还是工频机和高频机打得大热,互联网公司才开始在数据中心市场崭露头角。笔者还记得10年前,大家讨论两大UPS话题,工频机的话,5/7次LC滤波器+6脉冲 PK 11次LC滤波器+12脉冲。大容量单机高频机才发布不久,价格不能杀太狠把自家工频机市场逼绝路,同时高频机和工频机的对决,也催生了各种白皮书和技术文章,最经典莫过于说工频机隔离变压器是否有隔离作用,是否更安全。还有当年IBM机器引发所谓零地电压1V的问题,总之高频机和工频机争吵不可开交,为了能够满足企业招标流程,很多时候客户只能拉齐到工频机。而典型工频机的效率就是93%满载,而低负载率时候,效率非常难看,放在现阶段对比新型模块化UPS,这些老古董就像拿着手提收音机和iPod的差别。当时模块化UPS,就是一个异类产品,容量做不大,有大容量产品的厂商定价也很高。那些带电热插拔功率模块,USB固件升级,效率96%,输出功率因数1.0,摆在当时来说都是超前的设计。这些差异化让招投标上面非常有利spec in,但另外一方面,手握工频UPS和高频UPS,模块化UPS多张牌的厂商,也不愿意在技术和市场策略上All in某种技术。
这就是当时技术和市场发展的背景。理解了这个背景,就容易明白当年高压直流产生的比较对象和条件。高压直流具体技术笔者不会介绍,网上很多文章介绍。当时高压直流横空出世,主打几个优势
1. 输入功率因数高,输入谐波低,方案成本比UPS低,特别当时工频UPS+无源滤波器,最好配有源滤波器;
2. 模块化设计,内置冗余,模块可以热插拔维护,不像工频机和高频机的塔机,故障需要打电话找厂商售后服务,修复时间长。高频UPS单机并非模块化设计,而模块化UPS的价格较高。
3. 直流电源系统参考48V通信电源设计,更加简单可靠
4. 效率95%左右,继承通信电源很多技术体系,包括模块休眠技术;效率曲线在不同负载率下比工频UPS有绝对优势,比高频UPS也有1~1.5%效率领先;如果配合一路市电和一路高压直流设计,系统效率固然更高。
简而言之,技术性能比当期先进的模块化UPS略低,做一路市电一路高压直流一马平川,价格感人。
其他说到的优势,例如电池直挂母线更加可靠。当时主要论点是,电源故障下,电池直挂负载放电,更高可靠。笔者对此持有不同意见。
1. 如果真是发生直流电源整体不可用,电池放电也就是15-30分钟满载容量,然后电池放电完毕,该掉电仍然躲不开。对比UPS和高压直流都同时发生系统故障需要整体更换,由于UPS存在静态旁路和外置旁路,输入和输出都是交流,可以切换到外置旁路,可以结合市电或发电机继续向负载供电。相反高压直流由于输入交流输出直流原因,无法通过旁路做故障隔离。
2. 高压直流的电池直挂输出母线,对比UPS的电池需要经过双向DC/DC变流器+逆变器,电路拓扑上当然高压直流简单,但是否更可靠则很难说清楚。逆变器和充放电器故障概率有多高导致不能放电,缺乏厂家数据支撑,但市面上出现UPS故障不能放电的案例据了解概率很低。即使高压直流,笔者也碰到过华南一个IDC无法放电的情况,当然这是个例,主要是电池问题,但这也反映了一个现象,UPS有能力通过充放电器DC/DC做到更好电池管理避免这种情况,而高压直流目前设计并不能很好支持。
(二)优劣背后的条件和原因
这个章节对上面章节进行一对一分拆和思考。
1. 论点一——输入入功率因数高,输入谐波低,方案成本比UPS低,特别当时工频UPS+无源滤波器,最好配有源滤波器。
对比的条件是当年工频机架构有优势,而高频机输入特性和高压直流类似,因为都有PFC电路。而成本方面,现在高频UPS价格和高压直流差不多,规模采购时候价格还可以更优。如果采用大型模块化UPS设计,结合更简洁供配电架构设计,可以比高压直流系统成本更低 。高压直流成本劣势在于单机容量受制于240V母线电流容量做不大,目前主流用800A~1200A,1600A的高压直流普及率仍然低。即使1600A,对应也就是400~500kVA的UPS。如果高压直流配输入ATS,价格也更高。
2. 论点二——模块化设计,内置冗余,模块可以热插拔维护,不像工频机和高频机的塔机,故障需要打电话找厂商售后服务,修复时间长。
现在模块化UPS同样可以实现这些功能。 有些厂商的模块化方式略有不同,虽然不能做到热插拔,但模块故障不影响整机运行是没问题的。模块出了问题,内部也有负荷开关或fuse进行隔离维护。
3. 论点三——直流电源系统参考48V通信电源设计,更加简单可靠。
简单即可靠,这个论据本身就不是非黑即白,双方都可以举出很多例子证明各自立场观点,高压直流基本结构是PFC升压后,再DC/DC到240~270V。UPS是PFC后到逆变器,这部分和高压直流类似。不同点在电池通过DC/DC双向变流器挂在直流母线上, UPS结构上还有静态旁路和手动旁路,可以在线切换和隔离,电池放电结束如果旁路有电,也可以切换到静态旁路,而高压直流并不具备这个功能。
再举例子,电池直挂输出母线,比电池带充放电DC/DC再到母线,还有电池内部含BMS电池管理,高压直流电池肯定更简单,但是否更可靠?后者多了管理的设计,某种层面只会做更加可靠,否则花这个钱就没价值了。华为今年发布了SmartLi的锂电池方案,笔者在上海华为Connect现场看到也做了一些交流,大致上从传统锂电池管理升级成3层电池管理架构。即电池包内部BMS,然后每组电池有独立的DC/DC充电模块集成在电池柜内,形成第二层BMS管理,也实现每组独立充放电策略,包括新旧电池混用,最后还有UPS内部的DC/DC充电器,这三层互相通信,利用之前测试大数据固化成的策略做控制管理,控制环流。从这个案例看,做了智能管理的锂电池肯定更加复杂,但这个设计出发点其实是让电池系统寿命和可靠性更高,所以并非一定简单即可靠。
生活上也有很多例子,10年前功能手机比现在智能手机简单得多,是否更可靠?或者间谍角度傻瓜机可靠,这种被动式可靠和智能手机更加高级的安全设定主动防御对比,谁更可靠?看看市场普及智能手机的结果,现实角度,说那么多理论对比也没啥卵用,用户用脚投票,就是在应用层面,哪个厂商产品简单好用,少出事就可以了,出了事厂家也有足够人力和资源及时解决。 又不是技术极客和研发,哪来功夫研究设备内部复杂度做硬核对比,即使对比了,又能如何 ?
要玩硬核,也可以有,不喜欢理论的可以跳过这部分。理论计算用业界公认的可用性模型MTTR和MTBF去建模,但都是制造商数据,难免不够中立。撇开计算过程,同样N+X配置的高压直流 PK 模块化UPS。运行模式对比如下
运行模式高压直流UPS
N+X模块正常可用性为A1可用性为A2
N模块正常,1~X模块故障可用性为B1可用性为B2
输入故障,电池放电电池可用性为C1电池可用性C1*UPS逆变和充放电部分可用性C2
自动/手动切换旁路无可用性为D2,需要切换到静态旁路或手动旁路,例如固件升级或整机故障
MTBF硬核PK的结果,就是个各种运行模式的可靠性相加之和做对比。假设高压直流和UPS模块可靠性一样,即A1=A2,B1=B2,那么差异存在于电池放电和切换旁路模式对比。数据理论计算难以形成感性认识,从运营角度,UPS可以在线隔离,离线电池测试也容易实现,反观高压直流电池测试一般靠调低输出电压让电池带真实负载放电,要么每组电池单独隔离做离线测试,相比之下显得繁琐。
总而言之,简单即可靠,这句话更多是市场营销心理套路,也就是人们既喜欢简单的事物,也喜欢可靠的事物,但简单不一定推导出可靠 ,反之亦然。
4. 论点四——效率95%左右,继承通信电源很多技术体系,包括模块休眠技术;效率曲线在不同负载率下比UPS有优势;如果配合一路市电和一路高压直流设计,系统效率会更高。
放在当年老迈的工频机技术,还有当年第一代大容量高频单机UPS,这个并没有问题。现在看来,新型UPS都能实现这些,主流厂商的UPS都可达96%效率以上,笔者看过TUV,UL以及泰尔认证报告,效率值都比主流高压直流厂商产品略高。而一路市电一路高压直流设计,论可用性,未必有N+1的UPS做分布式冗余高,或者没有BR/Catcher设计高,特别在运营上。美国很早就大规模设计N+1的UPS架构,整体成本得到很大优化。反观高压直流,如果做N+1设计,因为直流输出,直流母线侧难以实现BR/Catcher架构,而分布式冗余,由于高压直流容量受限,做起来比大容量UPS麻烦得多,特别是高密度机架 。
另外,针对系统效率,UPS还有ECO模式,改进型的ECO还带有有源滤波功能,例如施耐德的E变换。如果合理开发使用ECO模式,系统效率只会比一路市电一路高压直流高。除了改进型ECO,还有使用UPS作为储能的套路,虽然这个还处于应用的探索期,但UPS似乎想改变行业定位,不甘于只做IDC市场,要进入储能市场。
当年一些高压直流的优势,近几年已经被UPS的发展技术追上。所以我们不妨思考一个问题,如果模块化UPS的成本,效率,可靠性持续得到优化并被市场认可,高压直流的市场又剩下多少?
说一些高压直流的劣势
以铅酸电池设计为主,直流母线低压较低,较难匹配主流锂电池电压,锂电池很可能需要定制。
占地容量较大,高压直流的微模块,1个输入配电柜+1个整流柜+2个铅酸电池柜,即使配电柜侧放也要2.1m,如果改横放,要2.4m,提供容量一般不超过150kW。支撑1200kW就需要8套,也就是8*2.1~2.4m。对比1200kW的模块化UPS+锂电池方案,例如笔者在华为Connect看到的Fusion Power 1200 配套SmartLi锂电池,横向占地大概7-8m,占地减半。
(三)现有产业链生态的影响
对生态链,电源的定位就是给ICT产品做配套 。在此,笔者要强调一个原则,不要因为解决局部问题而对全局产生重大影响 。高压直流是需要ICT设备的电源模块PSU去适配的,在全局里面看就是一个局部问题。技术的标准影响了庞大的产业链,想象一下,如果服务器不兼容高压直流,使用了高压直流的数据中心用户,总不能和IT部门说,你们必须买支持高压直流的设备,否则我们不上电,不能用?!这种话在业务部门面前基本要被拉去咔嚓……当年BAT为了推广高压直流,利用自己服务器强大的采购规模,硬生生要求服务器厂家的电源必须适配高压直流。万幸的是,服务器电源厂家也不是五花八门,经过不断配合,BAT最起码做到自家服务器层面的电源支持高压直流 ,但并非市场所有都支持,特别外资服务器公司还有网络设备公司。服务器和网络设备厂商,心态很简单,用户买我设备,量足够大,更改成本和收益还是能够算回来,就愿意改,收益不大而且投入成本高,就宁可放弃。所以对于普通用户以及风险敏感型金融用户,笔者一直建议就是从众心理,到时候市场主流是什么,顺势而为,供应链成熟,成本透明,再买就是了。让这种局部问题影响全局的早期游戏交给大用户就行,做个吃瓜群众不也挺好?大用户作为大树撑起狂风暴雨,下面小草雨露均沾,多么和谐社会。
笔者在国外也经历了一些类似案例。某厂家推荐所谓CPS架构,实际就是去掉低压ATS,改成直流电源+UPS混合架构。字面理解这个有点难,大家可以上网搜索CPS数据中心系统做了解。当时厂商和老外顾问认为ATS不可靠,非要用这种另类的架构。这典型就是为了解决局部问题而对全局产生重大影响。顾问和厂商宣称这个架构的论据就是ATS不可靠,要用电源架构组合来解决。是不是要来一个黑人的问号脸?Are you serious?
那是不是大量海内外现存的数据中心ATS都被技术鄙视?!这技术逻辑也是神了。碰上笔者这种耿直Boy也算厂商销售和无赖顾问的运气。那时笔者找了ATS的可用性数据和直流电源比较,前者可用性数据更好,老外瞬间被吊打……即使ATS真有问题,需要动用ATS的概率有多少,一个ATS故障也不会影响整个系统。为了去掉ATS把系统改得非常奇怪,发电机模式下效率还更低,收益和投入值得?面对这类技术问题,空谈误国,还是实干兴邦更合适。后来笔者找来几个厂商用ATS的架构投标来PK所谓CPS架构,结果下来CPS架构厂家惨败。到下一次项目的时候,CPS厂商销售突然画风变了,说其实我们架构也可以改ATS架构……这些厂商嘴脸也变化得够快,秀肌肉不成还不是最后被市场教做人,忽悠小白可以风光一时。这类技术架构问题,除非有极大创新和利益空间推动产业链进步,大家愿意陪着玩,背后就是利益足够大撬动产业链整体发展,这样才能教育市场谁才是牛X,否则要么耍流氓骗小白,最终逃不过被市场教育。
当年高压直流主流厂家,幸亏台达还有早年雅达(艾默生)也是服务器PSU主要供应商,不然这个供应链匹配进程会艰辛更多。即使BAT,面对不能兼容高压直流的设备,也要进行设计的异构,也就是配置交流UPS。除了国内BAT,国外Facebook,谷歌的Spec里面,也规定网络设备是UPS,通常还是2N配置。
讲到这,回过头看,花了这几年功夫去影响产业链,高压直流对比模块化UPS在成本和技术上一旦不占优了,那当年折腾的价值在哪,搞其他事会不会收益更高呢?即使高压直流目前仍然有优势,这个收益有多大,和投入的资源相比是否值得?换个说法,如果当年真的是那么有技术和成本优势,按道理应该成为一个普遍市场趋势,受到市场用户广泛认可,但为何目前仍然靠BAT在支撑,其他互联网公司为什么不考虑呢?如果高压直流众望所归,应该不少厂家涌进来,每年来总有新品发布了。产业链上下技术方案选择都是利益驱动,有技术的理想主义很好,在技术路线上要多考虑商业化和生态链问题。笔者提到变革驱动因素最后一点,就是业务的需求。BAT用户都有在云计算上发力,而国内私有云的发展和市场机会很大。私有云或者混合云的客户,多数不接受高压直流设计,特别一路市电一路高压直流。 如果BAT大举进入私有云市场,现有高压直流技术架构面临业务部门挑战。现阶段看,高压直流要成为国内普遍技术架构的时间窗越来越小,机会也越小。
说回另外一个问题,笔者看到数据中心对计算资源的服务要求更高,让数据产生更多价值是所有公司追逐的方向。这次在上海看到华为Connect发布的Atlas AI平台,单机架功率高达50kW,使用全液冷方案。后续高密机架可能做成分布式12V/48V电源并且带BBU,类似OCP和天蝎架构,重构服务器的电源和制冷方式,谷歌的AI服务器就是类似设计。AI服务看样子会在后面几年大展拳脚,看看英伟达的GPU业绩,各大公司在AI上面追逐的情况,笔者闻到变革的气息。相信高密度会成为一个态势,高压直流容量受限面对高密度机架会受挑战。与此同时,液冷对传统制冷系统也形成挑战,现在大红大紫宣传的间接蒸发,也许没几年就明日黄花。
有变化,就有机会,小日子还能折腾下几年,Game On!Are you ready?
原创: 莱奥Leo 大话IDC