03 王者归来
时间:2022-04-19 14:42:01 | 来源:行业动态
时间:2022-04-19 14:42:01 来源:行业动态
CDP,全称Cloudera Data Platform,是Cloudera和Hortonworks合并后的统一产品线,做了诸多技术升级,更重要的是其部署形态发生了根本性改变CDP是基于云的,而且是混合云。
有人戏称,Cloudera终于迎来了Cloud Era。
并且,Cloudera还宣布2022年后停止对原来两条老产品线的支持,全统一到CDP上。很显然,这种大刀阔斧的革新,表明Cloudera孤注一掷想借CDP王者归来。它说CDP是一种新的数据方法,是世界上第一个企业数据云产品,对应的市场规模高达260亿美金,并将在三年后翻倍。
能行吗?
我们一层一层来看。
技术上,首先被大家诟病已久的Mapreduce在Cloudera的产品里早有了很多替代品,比如Spark和Flink;其次,CDP整合了云存储,这意味着HDFS的争议也能得到解决;最后,CDP在调度上对接了K8S,先不说可能性很小,哪怕最后K8S完全替换了YARN,CDP也能做到几乎不受影响。
所以技术层面,按照Cloudera CPO的说法,这叫Hadoop已死,Hadoop万岁。Hadoop里几十个项目,是一个生态,甚至一种哲学,早就超越了十几年前Mapreduce的范畴,正波浪式的向前蓬勃发展。
商业上,Cloudera一方面在2019年7月宣布所有代码全部开源,向红帽的商业模式靠拢。另一方面又在部署形态上做了大幅调整,改成了混合云。
这又可以分两层来说。
先说第一层,为什么要学习红帽。
实际上业界一直有一种说法,那就是开源软件的商业公司里,真正称得上成功的只有一家,那就是红帽。红帽自Linux起家,营收一度高达30多亿美金,而且长期盈利,直到2019年以340亿美金的天价卖给了IBM。
所以Cloudera学习红帽的商业模式很容易理解,而且红帽商业模式里的三个要点,Cloudera也基本都能满足。
- 深度参与开源社区Cloudera有一百多位Apache committer,在大数据方面的技术实力无可争议。
- 代码全部开源,社区版激进,企业版稳定全部开源是Cloudera发表的《我们对开源的承诺》一文的主要内容。
- 靠企业版订阅产生营收,并提供咨询、支持等服务CDP,也包括CDH和HDP。
红帽基于Linux,Linux和Hadoop都是基础软件。虽然层次不同,但按照红帽CEO的说法,他们的商业模式比较适合于复杂、流行、社区驱动的基础软件上。而大家对Hadoop最大的指责就是太复杂,所以,没准这种复杂性恰好有其商业价值,毕竟太简单的也没必要找个商业公司来兜底。
然而,学习红帽是否就够了呢?
红帽成立于1993年,那会可没有云计算的威胁。
这就说到了商业上的第二层,也就是CDP所指的混合云。
云在吞噬一切,只不过这种吞噬是从互联网创业的增量市场开始的,但随着网络应用的逐渐饱和,这部分市场越来越小,于是云巨头不得不把眼光放到传统IT的存量市场中去。但这些企业跟要么增长要么死亡的互联网创业公司不同,他们更关心稳定性、更关心数据安全,他们有自己的机房,拒绝被云厂商锁定。
于是混合云应运而生。
所谓混合云,就是搭建在自建机房和不同云厂商资源之上的云平台,这种情况下,不管是自建机房还是云厂商,提供的仅仅是底层计算资源,可以根据使用者的意愿随便切换,就像水和电一样,即插即用。
嗯,至少理论上是这样。
但实际上混合云市场还处在混战之中,参战者至少有三类:一类是公共云厂商,如AWS的Outposts、Azure的Azure Stack和谷歌的Anthos等,他们的混合云往往为了线下资源,终点在云,不在混合;另一类是独立混合云供应商,如红帽的Openshift,他们试图在各大公共云厂商基础上搭建一个通用混合云平台,终点在混合,不在云;还有一类,就是各开源应用厂商自己搭建的混合云,如Confluent的Confluent Cloud、Cloudera的CDP、Elastic的Elasticsearch Service等,他们的目标也是混合,但更纯粹,就是要反过来屏蔽云厂商提供的特定开源托管产品。
现在讨论混合云的最终格局显得有点太不自量力,我们不妨把问题稍微缩小一点,那就是在这种混合云的状态下,Cloudera的混合企业数据云,是否能做成?
先说市场,关于市场分析师有诸多测算,少的也有几百亿,但我们不妨说的简单点只要大家还要做大数据,Hadoop就一直有市场。实际上我至今都没发现有谁在做大数据而不用Hadoop的。说Hadoop有问题,大家都承认,但说他要完,这可有点早。可见范围之内,它还看不到有威胁的整体竞争对手。
既然市场成立,那就看Cloudera的竞争对手情况了。
在MapR被收购并且Cloudera合并了Hortonworks之后,应该没必要再讨论独立供应商里谁最强的问题了,因为答案是显然的。
至于像Openshift这样的独立混合云,很像云计算版的聚合平台,可能长期存在,但我不认为能做大,主要原因还是他们无法通过网络效应增强自己的竞争力,因为可选的供应商太少。而且,他们瞄准的是PaaS这层,即通过K8S屏蔽IaaS,所谋甚大,志不在Hadoop。
所以Cloudera的竞争对手只有公共云厂商。
不过这并不好对比,从技术先进性上来说,Cloudera显然有优势,如果客户对产品有更高要求,那选CDP的可能性要大一些,但从产品模式和市场策略来说,云厂商以IaaS高频打低频,在搞定了客户的基础资源之后,再给客户推一个大数据平台,也算顺理成章。
于是似乎只能草草得出一个要看情况的结论。
但我们不妨跳出来再看一下。
毛爷爷曾写过一篇文章《中国的红色政权为什么能够存在?》,里边这样说道:我们只须知道中国白色政权的分裂和战争是继续不断的,则红色政权的发生、存在并且日益发展,便是无疑的了。 那时中国处于国民党的统治之下,并且共产党刚刚遭受了重大打击,很多人开始产生悲观情绪。但毛爷爷指出,国民党的统治貌合神离,蒋桂冯阎四大军阀的背后是不同的帝国主义诉求,他们之间的斗争是不可调和的。所以在他们的斗争之间,红色政权便能产生和发展。
我发现这段精彩论述,完全可以套用在CDP要做的混合云身上。
- 公共云厂商之间互相斗争,只要世界上不止有一个云厂商,那被锁定的担忧就一直存在,混合云的需求也就一直存在。又因为这种担忧是针对云厂商的,所以云厂商提供的混合云天生说服力不足。
- CDP的数据混合云是一种地方经济,可以脱离统一的大资本主义经济而独立存在。即限定到大数据领域,客户可以只用CDP而不必依赖特定云厂商的某些特定功能。
- CDP的混合云将会先诞生于经过民主革命训练的地方。也就是说,那些曾经习惯使用Cloudera产品的用户,将会率先迁移到CDP的混合云上来,而Cloudera长期以来的客户都集中在财富2000里,大多是传统客户,正是云计算10%渗透率以外的地方。是的,云计算高歌猛进了这么多年,渗透率依然只有10%。
- CDP这种混合云的诞生和长期发展,需要一支相当力量的正式武装。在开源混合云的场景下,这支正式武装可以理解为商业公司,言下之意是纯社区建立的混合云无法长期存在。所幸,目前开源应用混合云都是由商业公司建立的,不管是Confluent、Elastic,还是Cloudera,均不例外。而且,Cloudera这支武装相当有力量,100多名Apache Committer,3000多名员工,看似和云巨头动辄几万人的规模差距很大,但限定到大数据领域,恐怕很少有公司能达到这个规模和质量。
所以,CDP这种企业数据混合云的长期存在和发展,便是无疑的了。
但要问在这种情况下Cloudera是否真的能王者归来,我无法下断言。
至于原因,不妨引用一下着名史学家史华兹的观点:否认客观环境先验的重要性是绝对愚蠢的行为,但我的确反对那种主张形势自动引起结果的万物有灵论,任务完成与否,不仅取决于所用的方法和客观环境,也取决于承担任务的那些人的思想、意图和抱负。
所以我能做的,只有拭目以待。