进口缺芯少魂?阿里云用10年时光成功自己作主研

第二、收购万网,获得数十万中小企业用户

第一个要求容易办到,但对第二条,胡晓明有点担心。

第一名值不值得称赞?那要看第一是怎么得来的,以及,对整个行业的影响。

林晨曦走到淘宝网技术团队面前,搬个板凳兀自坐下:“你们淘宝的大数据系统用我们的阿里云架构吧。”

一位早年曾在阿里云就职的人告诉亿欧,当时阿里云把万网上的用户都转到了阿里云上,直接拿下20万左右的企业用户。阿里云也支撑住了这些客户的运行,然后逐渐从互联网客户拓展到更多的传统企业中去。而如果当年阿里云一家家得拓展用户,其艰难可想而知,可能阿里云的发展就不是今天的局面。

胡晓明回忆道,“09年6月1日,马云找我谈,说你你必须创业。你一定要考虑,如何解决我当年在做阿里巴巴的时候借不到钱的时候痛苦,你必须去解决,所有中小企业的融资难的问题。”

1

名单里没有王坚。王坚知道,当有人能比他更好地带领阿里云前进的一刻,就是他放手的时候了。

如果说从2008年9月,阿里巴巴在国内最早确定“云计算”和“数据”战略,决定自主研发大规模分布式计算操作系统“飞天”——阿里云的核心操作系统算起,云计算在国内已经走过了10年的发展路程。

本文作者:阿里云头条

   

到第一名靠什么?

第一名通常要靠创新和效率。

比如IBM、Oracle、微软、谷歌、Facebook,他们或者曾经,或者现在,或者在某个领域,或者在数个领域,是第一。他们靠创新的商业模式、产品、技术,在某个领域成为老大,有的甚至是创造了一个此前不存在的领域。

 

比如丰田、宝钢、万科、格力,他们的创新并不是那么显著,或者说虽然也有不少创新但那不是他们成为第一名的重要因素,但管理和执行的效率很高。

 

       当然还有很多可以达到第一名的方法,比如抄袭、垄断、运气等等,都能让一个企业达到第一名的位置。

 

我认为,其中一种达到第一名的方法-用钱砸,是最没有技术含量的。

用钱砸,通常毫无创新和效率可言,而且,通常,伴随着抄袭、垄断,更而且,能否达到第一名与否,通常还是取决于运气,这种完全不可控的因素。

 

有人说,不管怎么来的,第一名就是胜利者、成功者,利用获得欢呼和赞美,享受肉多汁多的果实。

2

他们也许会在某个秋日回忆起和伙伴同行的日子,心怀感念;他们也许有了新的忙碌的生活,来不及回望;他们也许偶然翻到新闻,看到那年王坚的滚滚热泪;他们也许在饭桌上谈笑风生,聊到当时的兄弟,忽然抬眼望向远方,干掉一杯烈酒。

第一、研发自主的飞天系统

图片 1

 

“明明可以坐高铁,却偏偏要骑自行车去上海。”当时研发工程师王国涛的吐槽,代表了很多阿里金融同事们的心声。

阿里云能够成功,应该将主要原因归为以下几点:

图片 2

   

阿里云是不是第一名

       当然有厂商说,我是云存储市场第一名,我是游戏行业第一名,我是视频行业第一名。

      

可是我告诉你,这都没有鸟用。

      

       面向开发者和企业的云计算只有两个市场:云主机和IPaaS。云主机当然是一众小弟们玩的市场,只有云主机才能称为一个细分市场,其它只有IPaaS,综合性的云服务平台。

 

       再按产品细分?没有。再按行业细分?也没有。再按场景细分?也没有。纵使一时有,那也就是一时的,不能长久,很快会被IPaaS碾碎。纵使表面上看有,实际上也没有,行业和细分只是营销上的诡辩术。

      

       所以,在IPaaS上的细分,最多时暂时的、表面的。实际,大家都是干的一个事:IT基础设施。

 

       我说的每一句话都可能是错的。

 

       上面我是用结果来衡量过程。结果可能就两个市场,但过程,比如某些公司的起步,可能是各种细分开始的,功能细分也好,场景、行业、产品细分也好,都有可能。这就好比做生意的第一桶金,什么路子都有,但最终走向,就这两个细分市场。

 

       IDC2015年初的报告说,在2014年上半年,中国公有云服务市场整体规模达到3.27亿美元。其中,阿里云以22.8%的市场份额首次登顶IaaS服务市场。2014年阿里云在中国公有云市场份额排名第一,市场占有率达29.7%。

      

       可以说,阿里云绝对是第一。而且其市场份额很可能高于29.7%,甚至可能高于50%。我没有用户调查和市场调查数据,这只是在云计算之中,在云计算之外,各种信息汇聚之后,形成的直觉。直觉,比第六感第一个档次,但有可能比人工智能高一个档次。

 

3

这一刻,在场见证的人都明白:成了。

图片 3

本文为云栖社区原创内容,未经允许不得转载。

   

闲话

 

       如果以成败论英雄,阿里云现在算得上成功,毕竟行业营收第一。但我们很多人更相信的一句话是:不以成败轮英雄。

 

       阿里云自身的投入资金、人数、其他资源,可能比全中国所有公有云的投入都大。但它的资源利用效率和产出效率(见公众号其他分析文章),比国外和国内公司,包括一众创业公司,都要低。

 

阿里云在暴发户式的投入,和铺天盖地的营销下,对中国云计算市场的作用,总体为负。一众创业公司,大量宣传了云计算各个细分产品和技术,阿里云只是说大数据好请买我的云主机。而阿里云的产品不及投入换来的地位,让潜在客户不敢大步走进公有云。这大大缩小了中国的公有云该有的市场规模,根据该号其它文章分析,全球IaaS市场规模是全球IDC市场的47%,而中国IaaS是中国IDC市场的7.4%,7.4和47就是可比的差距,可以说,如果全球IaaS成熟度是47分,中国就是7.4分,我们需要增长7倍才能达到世界水平,也就是美国水平。

图片 4

 

       如果有任何公司具备阿里云的资源,结果一定比阿里云好,或者一定能打败阿里云。这一局,阿里云赢在了垄断。

       好比如来佛打得过孙悟空,黄飞鸿打得过渔夫,李逵打得过黄花闺女,那又如何?

 

       这就是垄断的坏处,劣币驱逐良币,以及一只老鼠坏一锅汤。要么老鼠自己变成小鸡和蘑菇,要么来只猫把老鼠请出去。这就是中国热门市场的悲哀:个体赢,行业输。

      

       阿里云离成功尚远,中国云计算市场离成功更远,已经在路上的行者且行且珍惜。

  我说的每一句话都可能是错的。

   

于是,“阿里云”这个词,第一次出现在公司高层的话语里。而王坚,加盟阿里巴巴之后的职务恰恰是“首席架构师”,他的使命就是从零开始建立这个云计算系统。

2013年是云计算的一个转折点,这一年可以说云计算热潮刚刚兴起。UCloud和七牛云等第三方云计算企业都是在这一年成立,腾讯开放平台也是这一年对生态企业开放,另一方面AWS高调入华掀起了云计算关注热潮。

摘要: 近日,阿里云创始人王坚在央视最新一期《朗读者》中诵读了乔恩·克拉考尔的《进入空气稀薄地带》。在节目中,他回忆说,“现在阿里云的成就是工程师拿命换来的,其实也是最早一批客户拿命在填,就像第一个用电的人一样”,从思想上的雏形到成熟,阿里云走过了5年多。

   

阿里云是矮子里的将军

 

       关注过拳击或者搏击的人都知道,那都是讲级别的。比如70公斤级,80公斤级,各有各的冠军和排名。70公斤的人去打80公斤级的比赛,那叫瞎闹,最多叫表演赛。因为10公斤的体重差距,对于胜负有很大的影响,70公斤级的冠军未必打得过80公斤级排名10名开外的选手。同样道理,80公斤级的选手跑到70公斤级的赛场上,赢了所有选手,也不能说明什么。

 

       当然,商场和搏击不一样。商场有法律法规,但并没有搏击这样严格的竞赛限制。商场更复杂,更多不确定性,所以对商业竞争并没有那么严格的限制性。

 

世界500强欺负一个乡镇企业?可以。世界500强可以做一个打火机,灭掉所有温州打火机企业。当然,方法也许只有一个:免费(先不说这么做的合法性问题)。但,纵使如此,500强还是500强,那是因为它的其它业务成为500强的。至于它做成了打火机第一,我不觉得有什么厉害的,我甚至认为它是不及格的:没有创新,没有效率,社会价值甚至为负。

 

阿里云的第一站,对垒的不是国内第一家云计算公司云快线,而是盛大云。因为云快线在阿里云上线一个月不到就解散了。

 

阿里云虽然2009年9月才成立,但自称2008年10月就开始研究飞天了。在2011年7月官网上线前的2011年年初,与万网合作云主机。应该说这时,阿里云初步具备产品形态。这中间的研发有两年多的时间,期间包括阿里人自己所说的推倒两次。

      

       盛大与阿里云是同一个月上线的,比阿里云稍晚几天。盛大云大概在2011年初才开始进行研发,在一年多的时间里,推出六七款产品,我认为是疯了。因为它的人并没有那么多,而基础设施服务,也不像普通的web服务,很多问题可以上线后再说。

       纯从研发上说,盛大云比阿里云的效率至少高一倍。人比阿里云少,盛大大概那时候只搞到300人,阿里云有1000人,盛大云研发时间也只有阿里云的一半。

      

当然,也有些创业公司比盛大云的效率还高。搞技术的都知道,人多并不意味着力量大,需要好的组织、沟通、架构、流程。但肯定的是,阿里云研发效率比盛大云和绝大部分公司低。

哦,对了,据说阿里有一个项目多个团队同时干的传统。谁干的好用谁的,那么最后可能就是三个人干了一个人的活。对于有钱的大公司,不能说这个错,为了增加百分之一的胜算,投入两倍的人力,那也可能是值得的。

      

你会说,那盛大云怎么还是败了呢?败是败了,但绝不是败在研发能力和研发效率上。

 

研发能力和效率不高,却能够有后来的发展,显示了阿里云的第一个运气之处:钱够多,愿意等够长的时间看到结果。这当然首先是因为背后是阿里巴巴财大气粗,其次马云和阿里对战略业务耐心还可以(但是,还不够,后面会说到),另外一个则是王坚博士有能力说服马云和阿里集团。

 

我不愿意说半头话,也不愿意至只批评不建议,也不愿意只说表面不说内涵。但我不是理论家、不是咨询师、不是亲历者,说与不说,说多少,说多深,说多明白,有时候也看心情。

阿里云和盛大云上线头半年,两者的客户数量至少持平,甚至盛大略多。

 

盛大云败在三个问题:不够理解产品、不够理解国情、不够坚持。情怀一点的另外两个问题是,没有情怀和理念,没有战略耐心。

 

说得实际一点,时间太短,只能在技术、功能、体验上照抄国外同行,没有理解、考虑或内用户的情况。这里我不说用户习惯,遵循和改变用户习惯,都是可以的,前提是你要知道用户的情况。那时的云计算用户,都很小,并不知道主机系统盘和数据盘的区别,特别是网络盘是分布式块设备的价值。也不理解盛大云的云主机,只用系统盘,跟自己在服务器上只用罗磁盘,没什么区别。然后,就有了磁盘事件(欲了解历史,参考中国IaaS产业年度点评2012,在公众号前面)。盛大云声誉遭遇突然危机。

 

这个时候,显示出了阿里云的第二个运气之处,阿里云的系统盘和数据盘都放在了分布式存储系统之上。别告诉我这是阿里云的英明神武,打死我也不信,后面还会说这个运气成分更大,而且很快显示出问题比好处更大。所以,尽管头两年,阿里云也有几次大规模的系统宕机,甚至机房停电,但客户的存储数据损失很小,几可忽略。阿里云,安然度过这几次当即危机,而盛大云则遭遇客户的强烈反应。

 

还有一个不是突然危机,确实持续的危机,那就是对IDC现状不了解。高层竟然不知道双线,不知道BGP,不知道备案。那还搞个毛云计算啊?在中国搞云计算,一大半是要搞定IDC的事。

 

不知道备案咱就原谅了吧,毕竟那时候还有阿里云这个难兄难弟,也不知道要备案。反正就是,刚上线的大约头半年,阿里云和盛大云都没有备案服务,这块大家半斤八两。

问题是,阿里云很快开始于万网合作,并由此意识到万网在带来那点客户之外的其他价值,直接打断万网了万网的分拆上市进程,由此开始了阿里云和万网的全面整合。

 

万网本就是IDC领域的老牌公司,备案相当熟练了。所以虽然盛大也在上线几个月意识到这个问题,并开始着手解决,却显然没有万网现成的体系来得快。

然后就是,万网的虚拟主机全面迁移到阿里云上,万网的域名、虚机客户挖掘了再挖掘,向阿里云上赶。加上阿里电商体系的商户和合作伙伴资源,翻个底儿朝天,向阿里云驱赶。虽然盛大云也捉摸了一些盛大游戏的用户和合作过半,显然规模和基础设施需求,无法与万网和阿里电商的客户多,虽然,这几波阿里也没有捞到太多客户,但至少比盛大多很多。

 

这里显示出阿里云的第三个运气之处:收购的万网。万网虽然在2009年被阿里收购时,是阿里系当时最大的投资。但往后走,这个收购就是个小虾米了,因为阿里后面的资本运作很多,有些也很大,而万网大概花了5.4亿人民币左右。

阿里收购万网的时候,阿里云还没有成立。而且收购的目的和云计算也没有一丁点的关系,收购的目的是让阿里巴巴在中小企业电子商务链条上延伸。

 

收购万网,基于马云最初的一个设想,即把阿里巴巴打造成一个为中小企业提供一条龙服务的平台,为中小企业(即小B)提供其所需要的各种服务。淘宝为阿里巴巴上的“B”提供消费者,万网、阿里软件等企业为阿里巴巴上的“B”提供软件工具与服务。比如投资shopex,做软件的,万网,卖域名和虚机的,两者结合,开启中小企业电子商务的新形式。

 

马云的设想是传统企业涉足电子商务,通过阿里巴巴能享受到一站式服务:万网提供域名并为其定制网站;阿里巴巴、淘宝网及淘宝商城为其对接用户;支付宝提供结算服务;一淘作为入口为其推荐并输送流量。

 

然而,万网有企业IT服务的雏形,这给后来的阿里云带来了企业IT的经验、客户流,而这一点,阿里当时完全是无意的。

 

带宽上,阿里云是BGP,盛大云是电信单线啊!这特么太要命了。单线意味着用户的服务在中国一半的地方要么无法访问,要么访问体验非常差。等盛大云意识到这个问题,着手解决,已经一年过去了。这一年,中途还有磁盘事件,口碑已坏,客户如同南飞的大雁,纷纷离去。

 

这显示出阿里云的第四个运气之处:阿里集团的基础设施已经经过其他业务千锤百炼。基础设施分硬件和软件。软件基础设施,可能BAT各有千秋。但硬件基础设施,阿里云在互联网公司里肯定数一数二。

 

 

说点情怀和理念吧,是很虚,很多时候这玩意很难用语言表达。只能举个简单的例子。那时候,阿里云继承了阿里电商的搞法,大搞活动、促销。然后盛大云的营销体系,就是这样干的:招阿里的营销,学阿里的活动和促销形式。对云计算、产品、营销,没有想法啊。我的说法就是,没有情怀和理念。

 

再说盛大云的战略耐心吧。大概是盛大云上线一年左右,CEO何刚就出走。给何刚的时间从搭台唱戏到下判断,不到三年时间。研发占去了一年半左右,我估计陈天桥给何刚的时间只有两年。两年对于互联网项目已经是很长了,而且与云计算,企业IT项目,变革企业IT的项目,只能算开个头。

 

因为太着急,所以一下子上很多产品,所以对产品和国情没有深入了解,所以头一年,打了几帐都输。开头输,问题多,并不是致命的,阿里云就是例子。问题是,陈天桥并不是深刻理解云计算的人物,那时还有支付等战略性业务,看起来更有前景。陈天桥成为富翁之后,再也没有年轻时把全部资源压在一个事情上的魄力了。因为拥有了很多,赌的筹码就大了,自然不敢下全注,再说还有其他看起来挺热门的趋势。

 

      

看两段原话,是王坚博士代表阿里云说的:

       “超越Hadoop”一节:阿里云战略上最与众不同之处,就是坚持追求拥有自己的具有竞争力的核心技术。而且,经过三年艰难地技术攻关,数次推倒重来,终于跨过了这个技术门槛,依靠自己的技术力量实现了飞天(Apsara)这个非常扎实的通用大规模分布式计算系统,它除了MapReduce之外,还支持最广泛的各种编程模型。而且,阿里云技术人员在这个统一平台上实现了电子邮件、搜索、地图、弹性计算、数据处理等众多功能,也就是说邮件和搜索底层是一样的,除他们外,在世界上只有 Google能够做到这一点。

       “超越Hadoop”提出问题:为什么不直接用Hadoop呢?王坚回答:“大家都会觉得,直接用Hadoop不是很好更快吗。Hadoop当然在离线大数据处理上很有价值,但它无法解决我们公司公共云计算服务的问题,因为我们已经上线的云服务,已远远超出Hadoop的能力,这和公司的定位是有关系的。今天飞天已很好地支持了阿里云的各类业务,其中也包括了大数据处理,从这个意义上讲,飞天实际上已经超越了Hadoop。”

处于核心的飞天系统竟然是Hadoop的升级版?这是要做大数据的节奏?做存储系统的节奏?都不是,是要做公有云平台啊。后面一系列的产品性能问题,都来源于此。

这种Hadoop升级版的分布式系统,在上线后,用户稍微多一些之后,磁盘IO成为一个巨大的瓶颈,10Mbps的读写速度也不能保证。盛大云情况略好,但IO略好,挡不住磁盘损坏啊:读写慢比数据没有了好。

 

但是,慢也是个很大的问题:放个没什么人访问的小网站没什么影响,放个有读写操作的网站,问题就来了,撑不住。大掌门和博客园事件,基本都来源于此。

研发压力很大,软件优化,比如三份写成功改为一份写成功即返回,硬件优化,比如上SSD磁盘,改进虽然很有限,多少还是有效果的。至于,某些真需要高IO的产品,比如关系数据库,大概只能抛弃飞天存储系统了。

这里显示出阿里云的第五个运气之处:同时代的盛大云问题大不坚决,小公司问题少但没阿里有钱有影响力,有钱有影响力的公司还在打瞌睡。阿里云有足够的时间、金钱、人力,来调整系统结构,优化软硬件。等过了两年,虽然不能说性能卓越,起码凑活能用的时候,腾讯百度还在睡眼惺忪。

 

盛大云自此已成历史。腾讯百度即将陆续登场。

 

回来说阿里云。

明白了吗?Hadoop或Hadoop的升级版,是阿里云的核心。考虑到这是王坚博士所说,王坚组建并执掌阿里云数年,可以说,阿里云在2010年3月之前,几乎都在潜心搞Hadoop的重写或升级版,分布式存储和计算平台,用现在时髦的话说,是大数据。

 

阿里云成立之时,2009年9月,前阿里巴巴集团资深副总裁、阿里软件总经理王涛曾表示,阿里云计算可以将阿里系各个平台上的商品信息、信誉体系、支付工具、IM用户资源挖掘提炼,有巨大的商业价值。

      

       所以,阿里云的成立初衷是整合内部的数据,并分析提炼。后来也提出了分享阿里系的数据说法。跟大数据的说法一样,这当然是正确的。信息是人和外界世界联系的纽带。在IT出现以后,很多信息表现为数据,数据当然很重要了。至于大数据,那只是IT发展到某个阶段,数据量多了,怎么存储怎么利用的问题。有什么值得大说特说的呢?

 

2010年初的时候,项目应该已经搞了一年多了。可是,就算搞出来,谁用呢?阿里体系?

 

       阿里体系当然不怎么用的,或者说也就是拿来做做实验而已。每个业务体系有自己的分布式系统,有自己的数据存储、分析系统。

 

既然叫阿里云,那就得向主流的云靠拢啊。不能说自己喜欢玩分布式存储和计算系统,就一直玩这个,还得市场化啊。一直埋头挖井,抬头一看,别人在种麦子啊。于是开搞云主机。

2010年3月前后开始吧。于是阿里云筹备了新的项目组,基于飞天系统,也就是这个hadoop升级版,开发云主机等产品。至于必须基于飞天,而且所有产品都要基于飞天,王坚博士有实际的压力,也有情怀的因素,你懂的。

 

分布式系统搞出来,是没人买的。云主机差不多半年搞出来,可能有人买,至少云快线再卖,阿里云的云主机谁卖呢?瞅了瞅,就万网吧。

      

2011年初,在万网上线了阿里云支持的云主机。可是万网是很实际的,也很保守了,云主机都要长得像VPS,至于云存储、NoSQL数据库,万网可是不带正眼看的。这可怎么整,别说大数据,云计算名号也不能保得住啊?外有亚马逊的云,内有即将上线的盛大云,上千号人的阿里云不能就支持万网做个VPS吧。

 

阿里必须开始自己的云计算平台。至于万网,你爱怎么玩怎么玩,爱上哪上市上哪上市吧。不过后来发现万网上市并不那么顺利,阿里云也多少需要一些万网的资源,那就把万网收了吧。

 

阿里云不仅仅是网站上线前,把分布式数据平台作为自己的核心。上线后,也没忘了数据,也许仅是为了阿里云成立和运转时对马云的一个承诺?我们要搞数据!

      

       尽管从阿里云网站上线之初,就没搞过什么数据的事,我指的是阿里的数据。

关于阿里云打造“数据分享第一平台”的定位,那简直就是胡扯。这里再引用王博士在2012年初的一段话:

       阿里云对自己使命的表述方式颇有点与众不同——打造以数据为中心的先进云计算服务平台。在对话中王坚不无自豪地表示,三年前公司成立的这个初衷,现在一个字都不用改。他们当初对云计算的理解和判断基本上仍然是成立的。为什么这么强调数据?王坚认为,数据将成为对国家和企业至关重要的战略性资源。而且,是近年来发生的一个革命性变化——数据都是在线搜集完成的,从不在 线到在线,使数据真正具有了战略价值。与他的说法可以相互印证的是,全球范围内Big Data也成为业界大热词,有国外观察者称数据将成为新时代的石油。

 

  很简单的问题:数据是什么数据?分享给谁?

 

       阿里云 “数据分享第一平台”的口号,直到2015年才改掉,改成如今的“全球领先的云计算服务平台”。

      

       阿里云如此热衷大数据和数据分享,一定是与马云分不开的。马云前几年动辄DT时代,我想既是王坚给马云吹风,也是马云和王坚互相找到了知己、互相打气。马老板开口闭口DT时代,王坚开口闭口分布式大数据,这马屁必须得拍响啊!

 

       不过,从亚马逊公布云计算营收以来,马云已经开始说大数据云计算、云计算大数据了,当然,DT还是要重新解释一下的。马云更相信DT时代的说法,更相信大数据,也许因为这个更好理解,也许因为王坚成立阿里云之初和马云达成一致的就是这个愿景。

      

       在我看来,上至马云,下至王坚和阿里云的初期核心员工,将DT和大数据作为阿里云的初期定位,但却起来个阿里云的名字而不是阿里数据的名字,很令人费解,难道只是因为那时候云听起来更时尚?

      

       大家来体会一下:

       2012年9月9日,在第九届网商大会上闭幕式上,阿里集团董事局主席马云再次站上了网商大会的舞台,发表主题演讲。马云表示,从明年1月1日开始,整个阿里集团将会转型,从自己直接面对消费者变成支持网商面对消费者。阿里集团的下一个十年,将开启“平台、金融、数据”三大战略。马云表示,“数据如果不是拿来分享,那他就只是一堆数字”,阿里集团未来将挖掘并分享海量数据,为更多企业创造价值与机会。他强调,在新时代,数据将会影响世界,“地震这样的自然灾害很难预测,但经济上的地震是可以被预测的。大量数据可以告诉我们,世界经济和中国经济在干什么,未来会怎么样。假如我们有了一个数据预报台,就像为企业装上了一个GPS和雷达,企业的出海将会更有把握。”-请注意,没有云计算的位置,数据分享,是阿里云的使命,马云这么想的,阿里云的网站上也是这么写的。

       2016年6月28日,在杭州举行的“互联网技术创新与浙江发展专题报告会”上,马云和阿里巴巴集团技术委员会主席王坚为浙江全省副厅以上领导干部讲了一堂生动的“大数据、云计算课”。马云说,今后一段时间,阿里将积极助力打造“数据强省”、“云上浙江”,利用大数据云计算技术助推浙江经济提升未来竞争能力。-请注意,大数据排在前面。

      

       如此等等,我就不列举了。大数据很好理解,大就是强,大就是牛叉,通俗易懂也高大上。我十分体谅阿里云的小伙伴们,必须在同一个分布式存储和计算系统上,架设各种云计算产品,必须在没有任何数据分享产品的情况下,将数据分享作为公司的第一口号。干着云计算的事,喊着数据分享的口号。

 

       即使亚马逊发布了云计算财务数据后,马云和王坚有所松口,但言云计算必提大数据,DT时代更是重新解释为大数据和云计算。我突然想,马云和王坚是不是认为,大数据是存储,云计算是计算呢?

 

       他们有情怀,我也有。大数据不过是云计算时代的一个场景而已。其它云计算公司,包括阿里云,现在也不是没有数据服务,不仅包括存储分析能力,也包括数据本身。而这都是后面的事情了,数据相关业务占云计算公司的收入也不大。也许将来会更大,但也只会是主要业务之一而已。

 

       同样在2012年,阿里云还很苦难的时候,公有云只是个可选项。王博士当时这样表述:

       阿里云的业务模式有两种,一种是数据中心和技术、运营都由阿里云负责,一种是数据中心和服务器是客户的,阿里云负责技术和运营,与客户分享收入。后一种模式已经有好几家公司在尝试,王坚预计后一种可能利润更高。

 

       2015年7月的云计算大会上,虽然不是阿里云的CEO,仍然作为阿里云代言人的王坚博士说:

       王坚强调,有别于此前提出的公有云和私有云概念,阿里云正在积极打造在基础设施和安全特性层面完全统一的公有云和专有云。“互联网的发展给云计算带来了一个巨大机会,国内很多有实力的大客户都愿意用公共服务、用专有云的方式来使用云计算”。

       2016年,阿里云在市场稿件里如此介绍:

阿里云专有云有五大技术特点,包括大规模充分验证的全产品堆栈,满足任意想象的应用架构组合;基于多租户模型的企业级云安全架构,全方位保障企业信息安全;基于全API开发的开放架构,一次开发,全局部署;基于自动化,数据化,智能化的统一运营运维;和公共云一样完整的产品线和服务能力。

 

       本以为阿里云是同类,公有云的旗手,自此只能无奈承认:商业面前,情怀就是那口丑气。相比公有云,当然私有云客户大,来钱快啊!

 

       阿里巴巴的其他业务窘迫到何种程度,要靠阿里云的营收和增速来提振股价吗?

       2016年5月,德银发布报告,说阿里云营收超谷歌云计算,进入全球前三。2016年6月,摩根士丹利发布报告,调高阿里股价预期,对阿里云估值达390亿美元,三年后阿里股价靠云计算。阿里云未来5年内营收将突破 185 亿美元,收入和盈利前景可观,由此将阿里巴巴目标股价由 119.3 美元上调至 130.6 美元。

       这些大机构报告发布以后,包括IDC圈、36氪、科技朱比莉等一众媒体开始给阿里云刷墙,论证阿里云为什么就是第三,为什么阿里云未来前景大好,为什么,没有别人的菜。

 

       好吧。是时候说点正事了。

       有人说,阿里云很努力,结果也证明阿里云是中国营收第一名。无论是过程还是结果,都无可挑剔。

       有人说,你一会说阿里云曾经有很多问题,一会说阿里云有很多的好运气,只要好运气盖过了问题,运气就是实力,运气就是必然。

       有人说,你看着阿里云发展很好,大家都说阿里云发展好,吃不到葡萄说葡萄酸,心理太阴暗了吧,度量太小了吧,鸡蛋里太挑石头了吧。

 

       不管你说什么,挡不住我批评阿里云不及格之处。

5

当时,淘宝网在计算力方面的主要需求就是“大规模数据计算”。所以,用飞天为淘宝造“大规模数据计算”制造整车的计划就被定名为“云梯计划”。

第三、去IOE战略,催热国产公有云服务

阅读原文

   

阿里云不及格在哪里

 

       阿里云的精神领袖严重拖后腿。他们搞错了情怀。把DT作为情怀,把大数据作为情怀,把hadoop升级版分布式系统作为产品技术架构的统一基础,这不利于阿里云的品牌塑造、产品品质。阿里云员工的心里矛盾倒在其次,阿里云产品的口碑在各种强力支持下却没有显出优势,甚至连续出现大的性能危机。

 

       阿里云含着金蛋却孵出银鸡。上面说了阿里云的五大运气,其实就是说阿里云拥有全中国其他所有公司都没有的先天条件。从资金、战略耐心、BGP带宽、人员数量质量,到备案服务能力、中小企业客户基础、传统基础设施服务协同,可以说天时地利人和,想得到的想不到的条件,它都一一具备了。只剩下人怎么干的问题。但是从阿里云上线之初,后面陆续出现的IO问题、客户激烈反应问题等看,口碑不佳。一个千人团队研发两年多,上线两年多,才成为一个小客户凑活能用的产品,简直是奇耻大辱。

       情怀和能力均三观不正。 DT和大数据情怀,让内外在品牌定位和理念上费解。大一统的基础架构平台,让架构者、开发者吃尽苦头,产品口碑和用户体验总是缺失一环。公有云到专有云,情怀已丢弃,营收第一。当然,相当数量的公司,包括创业公司,为了营收和融资,抱公有云和私有云两条腿。这既是情怀问题,也是战略问题。这既是情怀问题,也是能力问题。能力上,另一个让人笑柄的是,阿里云的云主机产品,长期以来用几根拉杆随意拉伸组合来确定主机的配置(最近做了更多限制,不让用户随便拉了),并视这种配置方式为云计算弹性能力的重要部分。云计算的弹性伸缩原本不是指这个,或者说主要是指横向伸缩,而不是纵向。阿里云的人以此为傲,并被国内各大云计算公司消防。东东施效颦与东施,东施是阿里云,东东施是国内其他云计算公司。我猜阿里云的产品设计团队,对于全球主要云计算的产品,停留在看产品名和描述的程度上。

 

       阿里云阻碍中国云计算市场的壮大。阿里云大概占国内市场份额半数以上,但依然是阻碍了国内云计算市场的壮大。原因无它,以阿里云自身和背后的各项实力,产品性能平平,口碑平平,服务不好视频、游戏、高性能需求的互联网客户,中型和大型的互联网客户、传统企业客户,哪里敢大步转向公有云呢?阿里云以公有云头牌出现,阿里集团为之背书,政府合作连连,广告打满所有可以打的地方。从资源利用效率上讲,可以说是劣币驱逐良币,其它云计算公司可能不是输在产品、口碑上,而是输在价格战、营销战的可投入资源上。响当当的市场第一名的实力如此,客户还敢想象第二第三名的产品能好到哪里去?用户会认为,公有云就是如此这般的能力,对上公有云毫无兴致。

 

       阿里云营收结构畸形却爱自嗨。看不惯这个形式。当然,为了种种原因,我是阿里云我可能也会这样,但我不是。阿里云公布了营收,并未公布营收结构。所谓全球第三的营收,首先专有云可能占了四分之一到三分之一,合并的万网的的传统IDC业务可能占了四分之一到三份之一,可比的公有云大概只占到一半,甚至不到。如果这样算,按科比业务计算,全球第几呢?微软和IBM还说自己云计算全球第一呢。 

6

小邪记得很清楚,他昨天刚听说隔壁阿里云准备搞云计算,今天就迎来了一个“特殊的客人”。

万网虽然在2009年被阿里5.4亿人民币收购时,是阿里系当时最大的投资。其实这笔投资是曾任阿里B2B CEO卫哲促成投资的,当时收购的目的是让阿里巴巴在中小企业电子商务链条上延伸。不过阴差阳错,万网在电商领域并没有怎么帮助阿里云,却为阿里云的冷启动立下汗马功劳。

2009年,正是阿里金融的创业初期,它的使命是用数据和计算解决所有的中小企业的融资难的问题。马云找到当时担任阿里金融总裁的胡晓明,提出了2个要求:1、只能做100万人民币以下的贷款生意。2、必须跟刚成立的阿里云在一起,也就是说系统架构必须基于阿里云搭建。

 图片 5

一个支付宝的同事给了我翻出了当年的数据:2008年,在阿里的IT架构中,淘宝和支付宝使用的绝大部分都是 IBM 小型机、Oracle 商业数据库以及 EMC 集中式存储。

Gartner:阿里云以3.7%的份额位列全球云计算市场第三名

期间,胡晓明也犹豫过,2010年初,他觉得自己快要被当时阿里云无休止的故障拖垮了。一个寒冷的冬日,他和马云在西湖边散步,“马总,能不能放我一马?”

   

阿里云的自嗨

       自从某个季度阿里云达到三位数的同比增长,就开始这样自嗨了:

       对比国际云计算巨头亚马逊最新一季财报,云计算服务AWS收入增长81%,低于阿里云106%的增长速度。这也让阿里云成为全球增速最快的云服务商。

阿里云收入增速也超过了中国公有云市场整体增速。2014年中国公有云市场规模增长61.9%,高于美国市场增速,但低于阿里云106%的增速。

      

       这个自嗨来自于“IT爆料汇”,只能说中国的自媒体也好,传统媒体也好,活得确实艰难。难以产生价值和收入,只能给厂商带点广告,配厂商自嗨的都算是有档次的了。

 

       毫无技术含量的自嗨。事实是这样的:

亚马逊AWS季度营收25亿美元,阿里云季度营收1.8亿美元,两者有十倍以上的差距。AWS增长10%,绝对增长量都比阿里云增长100%来得多。AWS一个季度的净利润是6亿美元,比阿里云季度营收多,比阿里云全年营收差不多。

2014年之际,除了创业公司和某些所谓的巨头敲敲打打,真正的巨头并未发力,比如百度和腾讯。

 

自嗨和陪嗨,都没有什么不对。没人能对阿里云说什么,不要说自媒体传统媒体,就是竞争对手,也不好说什么。人家就是没有争议的,第一名。

 

但是,我看,阿里云不及格。

 

       首先看看阿里云的领先或第一是怎么来的。

 

4

马云把他从微软亚洲研究院常务副院长的位置挖来,是因为阿里巴巴面临一个重大的危机——公司的“脑力”快不够用了。

不过如果选一个阿里云发展过程中会被IT历史记住的时刻,应该是2013年5月17日,阿里集团最后一台IBM小型机在支付宝下线。从2008年阿里提出去IOE口号后历史5年,阿里内部完全不再使用IBM的小型机、Oracle数据库、EMC存储设备。

当时阿里云刚刚起步,王坚想要集合阿里巴巴整个集团的技术力量做一套中国自主研发的云计算的大规模操作系统,也就是“飞天”,目标是将几千台乃至上万台普通PC服务器连接到一起,变成像是一台多功能的超级计算机,来实现超强计算性能。

版权声明:转载需全文转载并保留来源(微信公众号鸣北林techculture),并同时转载二维码,否则视作侵权。

尾声

步入发展快车道

有人说,阿里云是阿里巴巴中最具有理想主义的公司,王坚博士非常喜欢这个说法。接下来,阿里云要实现的下一个理想,就是为城市安装一个智能中枢—城市大脑,在王坚看来,城市的挑战是资源的挑战,城市大脑的意义是让生活的意义大于生存的意义。

阿里云,成为了中国第一家拥有完整云计算能力的企业。

2015年,12306部署在飞天上,春运高峰分流了75% 的流量。彼时阿里云已经建立起行业领先地位,ZStack创始人张鑫记得当时回国与阿里云的人交流,阿里云问的一个问题已经是规模化的问题:“如果物理机足够多,比如并发创建10万台虚拟机,IP算法如何不冲突?”张鑫介绍ZStack将IP分段,设置随机起跑点就可以极大减小相撞几率。

为什么一定要做云计算?当时的马云深刻意识到,没有自主的技术是会要你命的。即使内部对云计算争议很大,马云也非常坚定自己的目标:每年对云计算投入10个亿,连续投10年。

在一片质疑和争吵中,“最寒冷的冬天”就这样降临了。

在国内10年云计算的发展过程中,有盛大云、世纪互联等开拓“先烈”,也有IBM、Oracle在国内拓展折戟,当然也有AWS和微软Azure等艰难入华的云计算企业。这其中阿里云是个值得关注的特例,阿里云2018财年收入达到133.9亿元,从营收排名看达到全球IaaS服务提供商第三名。国内云计算跑出来的企业,为何不是IDC或者是IT企业,而是做电商的阿里巴巴?本文试着梳理阿里云的发展历史,作为云计算10周年的回顾和总结。

最终,在工程师们“拿命来填”的努力下,阿里云开始逐渐稳定下来,在一次较大的升级之后,稳定的系统表现甚至让工程师们变得不习惯了——忽然发现好像没事可干了。

这八十多个工程师里,包括后来的阿里技术保障部负责人振飞。振飞站出来说:“好,让我们学新技术可以,但是咱们拿事实说话。你后羿敢不敢跟我打个赌?以三年为限,用新技术的淘宝核心交易系统必须达到零故障!”

第一是实现全球化,今天的阿里云已经在世界范围内形成47个可用区,但是显然业务主要服务国内出海企业,谈不上类似AWS的国际布局。而阿里云的国际化步伐似乎也遇到了一些阻碍,2017年数据中心建设似有放缓,被腾讯云后来超越。成为3A并不稳固,未来Google或者IBM云都有借助全球业务后发超越的可能。

在最困难的阶段,80%的工程师离开了阿里云。王坚提到的这个“拿命在填”的客户,其中之一就是今天网商贷的前身——阿里金融。

分布式存储的系统,就像大地一样承载万物,那就叫“盘古”。

《超越Hadoop》一书中也提到:阿里云战略上最与众不同之处,就是坚持追求拥有自己的具有竞争力的核心技术。而且,经过三年艰难地技术攻关,数次推倒重来,终于跨过了这个技术门槛,依靠自己的技术力量实现了飞天(Apsara)这个非常扎实的通用大规模分布式计算系统,它除了MapReduce之外,还支持最广泛的各种编程模型。

“探险充满了神奇的吸引力,它所蕴涵的那种坚韧不拔和无拘无束的随性生活理念,是对我们文化中固有的追求舒适与安逸的生活态度的一种“解药”。它标志着一种年少轻狂式的拒绝”。

业务并不赚钱,09年只有一个季度勉强盈利。而赚来的这点钱,眼看都要填进去购买服务器和软件产品,入不敷出。

尽管阿里云早期的创业历程十分曲折,但是云盾(阿里云安全产品)居然是和飞天一同启动的项目。在2009年初聂万泉还在B2B负责中国站的安全,王坚博士深知安全对于云计算的重要性,把当时包括聂万泉等阿里集团最好的安全人员调入了研发院,这是非常高瞻远瞩的安排。

研发期间,开发工程师半夜起床处理线上故障,成了家常便饭。有的同学,把孩子的笑声录制成手机铃声,还有同事两百多天内起夜将近三百次。

不过,他们坚信自己在做的事情还是挺伟大的。“没准将来我们成功了,我们写的飞天第一行代码还能印在T恤上呢!”角落里有人瑟瑟发抖地说。

原标题:国产缺芯少魂?阿里云用10年时间成就自主研发的3A云丨云计算10周年

阿里云自主研发的“飞天”系统具备了更强的性能以及强大的计算能力,这为网商贷做到“秒级”放贷提供了技术基础。“飞天”开始通过公共云、专有云、混合云等形式对外提供大规模计算服务,网商银行也成为第一家跑在云上的银行。

时间马上又到了夏天。北京的夏天,你懂的。当时测试系统的服务器就架在办公室里,这就是个巨大的火炉。大厦的空调不行,还没到七月份,程序员就热得撑不住了。为了降温,每天上午他们都叫冰场送两大块冰来。

今天阿里ET和数加等产品还未完全发挥威力,但是将云计算和AI、大数据能力输出,无疑是阿里云平台很重要的举措。如今王坚博士主导的“智慧城市”概念正在杭州等城市落地,帮助国内城市或者类似吉隆坡等国外城市。打造类似全球三大智慧城市新加坡、伦敦和巴塞罗那的样板案例,是阿里云的下一阶段目标。

图片 6

眼看阿里云成立就要满五年了,集团里却风言风语地传着“阿里云要被撤掉”的消息。

飞天系统是阿里云核心的IaaS产品,是阿里云团队从零研发的自主国产云计算系统。阿里为什么要做云计算?在2012年深圳IT峰会上那场广为流传的辩论可以得到答案:当时李彦宏说云计算是新瓶装旧酒,没有新意;马化腾说云计算要在阿凡达时代才能实现,只有马云说阿里不做云计算可能会死。

近日,阿里云创始人王坚在央视最新一期《朗读者》中诵读了乔恩·克拉考尔的《进入空气稀薄地带》。在节目中,他回忆说,“现在阿里云的成就是工程师拿命换来的,其实也是最早一批客户拿命在填,就像第一个用电的人一样”,从思想上的雏形到成熟,阿里云走过了5年多。

金融不像别的业务,这可是一个数据都不能错,一个字节都不能丢。按照“行业祖训”,打死都得用 IOE 这些国外大厂的基础设施,现在可好,却非得用听上去就让人怀疑的“阿里云”。。。

参考资料:

图片 7

“谁也不知道王坚当时帮我们抗了多大的压力。。。”李超回忆起那段日子,只说了这么一句话。

2013年的棱镜门事件,对国家信息安全无疑敲响了警钟。马云此前提出了去IOE计划,无疑迎合了国家安全这一主题。有观点认为,当年阿里云能够分担12306春节业务,也是因为阿里云实现了纯国产自研,包括用PC Server、数据库PolarDB等产品代替开源产品。

历史总是惊人的巧合。胡晓明从阿里云的第一个客户变成了阿里云的现任总裁,带领阿里云成为与亚马逊AWS、微软Azure并列的3A。

从这一刻开始,马云就对阿里云寄予重望。只要有空,就到阿里云的团队里和林晨曦、满弓这些工程师们一起聊天讨论。

图片 8

马云的回复很简单:“不可以,云计算是未来。”

第一天做宣讲,然后马上笔试;第二天统一面试;第三天发 Offer。

那时阿里云能够提供稳定服务的证明,是12年的双11,阿里云跌跌撞撞地扛住了百万次的高并发;到13年双11,350亿的成交数字,80%的交易都是通过云端搭建的“聚石塔”完成。

梦想永在凌云意意气风发

今天我们会称赞马云决定做云计算的前瞻,然而逼迫阿里做云计算其实另有原因。由于阿里云和亚马逊同属电商企业,电商业务天然面临发展快,并发量大的业务数据处理难题。时任阿里首席架构师的王坚曾告诉马云“未来快速增长的业,会导致IT基础设施成本拖垮阿里”。这也是为何超级电商亚马逊、阿里巴巴、京东等企业都做云计算的根本原因。

但是在云计算这片土地上,从王坚带着一群理想主义者横空出世,到胡晓明把商业战场拉至和亚马逊的 AWS 同一级别。中国人用了十年时间造出的全球第三、亚洲第一的阿里云,不说和美国战为和棋,至少在世界的版图上夺下了堪称广袤的一片疆土。

第二是在大型企业等传统领域站稳脚跟。目前国内大型企业还是有数据上云的顾虑,自建私有云和混合云成为潮流,尽管阿里云也在发展专有云等产品形态,但AWS帮助大家都上公有云的模式无疑是未来主流模式。 另外未来智慧政务、智慧城市、工业互联网和车联网都是未来具有想象力的市场。在这个市场,阿里云近乎和腾讯云、百度云同步启动,未来行业的竞争会十分激烈。

李超是飞天伏羲调度系统的研发工程师。他用苦逼来形容自己的2010 到 2012。当时他带着同事们没日没夜地加班,收获的就是一个接一个的系统错误。

最早马云决定让阿里金融以捆绑创业的方式成为阿里云的第一个客户,帮助阿里云试错与成长。2010年4月阿里金融的“牧羊犬”产品在飞天系统上线,那时候阿里云经常出现不稳定以及数据出错等情况,十分影响阿里金融业务的开展。无法忍受的胡晓明,有一次在跟马云在西湖散步时直接说“马总,您能不能放我一马?”马云当时的回答很确切:“不可以,阿里云是未来。”

2015年,在计算界的奥运会 Sort Benchmark 中,阿里云计算100TB数据排序只用了不到7分钟,把ApacheSpark 之前创造的23分钟世界纪录一下子缩短了一多半。这说明,中国人研发的云计算系统不仅成功了,而且不比世界上任何现存的云计算系统差。

阿里有战略定位错误的时候,比如直到2016年还在提倡自己是数据分享第一平台,事实上云计算早期承担的职责无疑是服务器的虚拟化,大数据无疑是后来的作用。未来阿里云的挑战,可能是以下几点:

图片 9飞天的第一行代码

建立先发优势的阿里云,在2014年开始了第一次降价,云计算行业竞争开始激烈起来。直到今天阿里云仍旧维持定期降价风格,阿里云的先发优势与资源优势开始体现出来。位于北京的一家云计算企业回忆当年阿里云降价:“第一次降价是有些惊讶,但是一年降6次价就完全措手不及了。”

彼时的阿里巴巴已经很有名气了。很多错过招聘季的同学喜出望外,一时间各大学校风起云涌奔走相告齐来应聘,虽然从招聘者到应聘者,都没见过云计算长什么样子。

阿里云未来的机遇与挑战

满弓、李超他们开始收到团队同学的辞职书,林晨曦也收到了部下的转岗信。这些邮件,最终都一封不少地塞在王坚的邮箱里。

根据最新财报,2019财年第一季度财报来自云计算业务的营收为人民币46.98亿元(约合7.10亿美元),同比增长93%。虽然增速过跌破百位,但是阿里云依旧维持了高速增长。

图片 10

实时上在2010年OpenStack发布之前,也有Eucalyptus等开源云平台。但是阿里云决定从零开始搭建自主的飞天系统。这确保了云的整体架构是有机统一的,能够随时随地的无间断升级,并在全球范围内水平扩展。“如果不是自主研发,我们根本无法应对‘双11’ 32.5万笔/秒的交易创建峰值。”阿里云技术研发负责人蒋江伟这样说道。

2008年10月,这个想象中属于中国的云计算系统被团队定名为“飞天”,源自中国神话中的形象。

如今阿里云的“ET大脑”已经在多个行业落地。目前ET大脑包含ET环境大脑、ET农业大脑、ET工业大脑、ET城市大脑、ET医疗大脑。当下发展较顺利的是工业和城市大脑,更多产业落地还需时日。

就像王坚的一位老部下把辞职信交到他手里时,对他说的那样:做云计算的感觉就像集体合围抱一棵大树,谁都知道最终大家的手会连在一起,但谁也不知道那一刻会发生在什么时候。真的真的对不起,我撑不住了。。。

这一年阿里云在行业内首次发起了《数据保护倡议》,承诺不碰用户数据。接下来的2016年1月,阿里云发布一站式大数据平台“数加”,同时2016年8月阿里云更换了全新的LOGO,并发布人工智能ET,正式进军AI产业。

“牧羊犬”是阿里金融的第一个产品,简单来说就是给淘宝商家贷款的项目。吐槽王王国涛回忆:“当时阿里云一边搭建飞天平台,我们就一边在飞天上面开发牧羊犬应用。这就像是开发商一边在造房子,我们一边在室内装修铺地板。”

2009年春节后,一群年轻人在北京上地汇众大厦一间快要废弃的办公室里,写下了阿里云计算操作系统“飞天”的第一行代码。2018年7月阿里云CEO胡晓明(花名孙权)动情得回忆到那一刻说道:“2009年1月,马云与阿里云飞天研发团队合影,匆匆一过快10年。这是一群用技术改变世界的梦想家!”

如此尝试和未来对话的技术还有很多。

责任编辑:

再多情的看客,恐怕也难解其中滋味。

没有马云的强力支持,没有王坚团队的锲而不舍,也就不会有后来阿里云被称为3A的故事。在早期跌跌撞撞两年时间,阿里云初步完成了产品打造。据说这期间阿里云的产品曾经推倒两次。直到2011年阿里云推出了云服务器,TeamCloa和筑云成为第一批上云的企业,“试飞员”是阿里内部对这批用户的称谓。

在最初面试时,有一个大牛程序员和满弓聊过之后,本想再考虑考虑是否入职。但是出门时,他看到了阿里云办公室上的一副对联,原地思考了几秒钟,转身决定马上加入。

不过当时阿里内部对王坚的评价比较负面,也很少有人理解王坚的决定。YunOS的失败以及阿里云还没有起色,让很多人称呼王坚是骗子,叫马云不要听他的。“董事会除了马云也没有人支持阿里云,而且昨天一起开会的总监很可能第二天就不见了。”聂万泉形容那段创业经历就像“血战钢锯岭”,不断有人从身边离开。但是马云选择坚定的支持阿里云创业,在那一年的年会上,王坚泣不成声地演讲定格为国内云计算开拓者的悲情。

创业维艰,唯有曾和死神擦肩而过的人,余生才会用十倍的速度奔跑。

图片 11

他的理由是:“如果这种突然暴力断电都能撑得住,阿里云还有什么不稳定的呢?”

为何成就的是阿里云?

能用命换来梦想,未尝不是幸事。

图片 12

他们的愤怒完全合情合理。“如果上边铁了心要干,兄弟们的前途在哪里?”

然后是6月阿里云获得跨地区IDC牌照。那年阿里云发布了飞天5K集群,这是当时世界上第一家对外提供5K云计算服务能力的公司。外界慢慢对阿里云有一些认可,阿里云慢慢的获得了外界的一些支持和谅解。

2009年6月,马云找到胡晓明,准备交给他一个大任:内部创业,做阿里金融的总裁。

阿里云另一重要举措是利用政府关系和产品优势,参与各省市的上云计划。比如参与《浙江省“企业上云”行动计划(2017)》、《河南省智能制造和工业互联网发展三年行动计划(2018—2020年)》等各地计划,在云计算进一步下沉中获得优势。

就这样,一行行代码累积起来,在赛博世界的疆土上一眼望不到边界。他们交错重叠,像从白垩纪开始慢慢累积的地层。直到这片大陆,终于浮出海面。

《飞天路》

2009年秋天,轰轰烈烈的 IT 架构升级项目在淘宝网正式启动。一群 Oracle 工程师,就这样含着泪,一点一点亲手拆毁自己安身立命的系统。

飞天艰难起步

任何执拗都会成为过往,只有时间会告诉你对错。

第三是正如亚马逊CTO沃纳·威格尔博士所言,云计算还是蓝海市场,国内云计算市场份额也没有稳固。百度云和腾讯云是意料之中的对手,如今京东云也开始发力,刘强东提出“京东云必须做成”,雷军也承诺未来投入10亿美元支持金山云发展。另外进入2016年IT厂商开始发力,目前市场华为云、浪潮云、新华三都在集中发力。同时AWS和Azure也逐渐在国内站稳脚跟,2018年5月AWS宁夏区正式运营,世纪互联和西云数据两家公司同步运营AWS,未来2年AWS市场份额挤进国内市场前二亦未可知。

李超给我看了这张照片。

今年“中兴事件”暴露出国内科技产业“缺芯少魂”的事实,不过阿里云的飞天系统是在云计算操作系统层面真正的国产自研产品。不止于此,聂万泉如此评价阿里云成功带来的意义:“中国云计算的发展就是阿里云带动的,从现实意义上说,没有阿里云中国的云计算发展至少还要滞后3-5年,相关的云计算、大数据技术都不会有今天的商用规模,更不会给国计民生带来如此显著的影响。”

这场长征,从摩肩接踵走到踽踽独行。年轻的人们为了共同的梦想相互温暖,又难免为了各自的梦想互道珍重。只是那些曾经鲜活的伙伴,就这样成为离去的背影,越走越远,消失在视野里,也消失在生命里。

不过当时就下决心做云计算还是一件十分不容易的事情。原阿里云创始员工、默安科技创始人/CEO聂万泉告诉亿欧:“早期的阿里云属于摸着石头过河,云计算是什么没人讲得清楚。从虚拟化主机到飞天大数据操作系统,最终发展到今天真正的云计算,认知层面的经验是最宝贵的。 公司层面也经历从技术驱动到技术市场双驱动模式,换过两任CEO,都是踩过的坑。”

胡晓明任阿里云总裁。李津扛起产品研发,在淘宝网鼎力帮助阿里云的小邪作为技术顾问。等等等等。

阿里云的去IOE战略除了催热国产公有云服务外,还间接造福了阿里云。因为早期无论是云梯1(以Hadoop为底层的集群)还是云梯2(以飞天为底层的集群)提供的系统存储和计算能力都是分布式。“所以尽管头两年,阿里云也有几次大规模的系统宕机,甚至机房停电,但客户的存储数据损失很小,几可忽略。”《云计算时代:本质、技术、创新、战略》 一书作者鸣北林这样评价阿里云的战略成功。

褚霸回忆当时的场景:“早上9点进入项目,11点我们就开始解BUG。”

更重要的一件事是原阿里金融负责人胡晓明接替了王坚,成为阿里云的CEO。王坚本身对技术有足够的远见,适合阿里云的起步。胡晓明更善于管理,守业无疑胡晓明更适合。

每个季度,阿里云都保持同比增长100%,这样逆天的增长速度持续了12个季度。

第五、推出ET系列产品,参加各省份上云计划

马云:第二件事,你必须跟刚成立的阿里云绑在一起,用他们的技术架构支撑你的服务。

《云计算演义》)

图片 132009年阿里云的招聘海报

图片 14

换任何一个公司,吃不消内网上那么多人骂的,我有一段时间也是特别替大家难过,就像我骂儿子可以,我打儿子可以,不允许别人骂我儿子的,要不然我要翻脸的。

从阿里云看这一年也是至关重要。先是2013年月1月份, 阿里云和万网联姻。阿里云与万网合并为新的阿里云公司,万网能帮助企业备案让阿里云后续免去了很多麻烦。

云梯1、云梯2,两套系统一边搭建,一边在淘宝内部实验,一边承担部分计算任务以缓解现有系统不足的压力。

2012年的飞天奖颁给了阿里云事业部,颁奖词是“坚持就是伟大”。今天看来这句话无疑是最强的真理,相反例子是盛大云2年没有盈利便被陈天桥放弃,阿里云是坚持才成就的今天地位。

阿里巴巴的“脑力”,其实就是“计算力”。

阿里云自己的同事更是全力冲刺。

鲜有人知,那时的阿里像依赖氧气一样依赖 IOE。

结构化存储系统,就用会盖房子的“有巢”。

如果这个“大脑”思维速度跟不上,就没有办法让用户及时下单、付款。

成功登顶的“云梯2”,后来更名为 ODPS,“加冕”成为了阿里巴巴各项业务通用的大数据计算平台。

图片 15当时判卷的场景

ODPS 验证成功之后,阿里立刻启动“登月计划”,把所有的数据和计算都迁移到飞天为基础的系统上,全盘替代 IOE 和 云梯1。2013年5月,阿里巴巴最后一台小型机下线。7月,淘宝最后一个Oracle数据库下线。阿里巴巴这台战车,用了五年时间,在超高速行驶中,没有踩一脚刹车,成功更换了发动机。

所有的技术路线之争,所有的进退成败之辩,所有的隐忍委屈不甘,所有的怀疑嘲讽忧虑,就在此时此刻突然画上句号。

I(IBM,服务器提供商,他们提供的服务器俗称“小型机”)

2008 年中旬,马云召开了内部会议。事情已经刻不容缓,要研发一套新的技术架构来换掉阿里巴巴的旧引擎。

看到行癫都赌上了自己的身家性命,也就没人再说什么了。

此刻的阿里云,手握历史上最好的一把牌。

数据传输问题、计算稳定性问题、处理速度问题一样都不少,翻版篆版梅花版的错误层出不穷,各种 Bug 形式翻新,永不重复,这叫一个皮。。。

果然,满弓签完入职合同当天下午,就被“附赠”了一张火车票。他要去天津帮助招聘。

马云:第一件事,你只能做100万人民币以下的贷款生意,帮助像当年的我一样借不到钱的创业者。

无论是“伏羲”还是“盘古”,这些开天辟地的名字,此时都成为了阿里云这些人要满足“个人野心”的明证,成为了狂妄的代价,成为了“不自量力”的耻辱。

满弓这样回忆十年前的那个下午:

但马老师肯定有马老师的道理。阿里金融的同事们只能硬着头皮跟阿里云的朋友们握握手。

在他丰满的理想中,这个新架构的每一行代码都要自己来写。但现实骨感:环顾四周,他身边除了几位从微软带来的旧部,几乎一无所有。

林晨曦用来“忽悠”淘宝网的“几行代码”,是在北京写出来的。

飞天相当于一个发动机的,而时间紧迫,阿里巴巴准备同时做两件事:一边制造发动机,一边为自己的主力业务淘宝网顺便造一个整车出来。

阿里云的神坑,不仅“坑”了胡晓明的阿里金融,也在“坑”淘宝网。

图片 162009年阿里云成立

这话听上去没错。但是有两个小问题:

调度系统,需要“能掐会算”,就用懂得阴阳八卦的“伏羲”命名。

四个小时以后,当系统完全恢复运行的时候,很多阿里云同事的背后,已经被冷汗打湿了。经过系统自检,一切正常。虽然还有十台服务器光荣就义。但是,数据毫发无损!

1、要想成功肩负起阿里巴巴的底层计算系统,就必须有能力独自调度 5000 台服务器。

但所有人都没想到,有一只巨大的怪兽正在必经之路上静静等待着。

2008年9月,王坚加入阿里巴巴。

满弓是阿里云的第六位工程师。

图片 17马云、王坚和工程师们的合影

飞天团队一片斗志昂扬。

之前说过,淘宝网从2009年就开始了“云梯计划”。到了 2012 年,局面变得有些尴尬:

1、无论是云梯1和云梯2,都没有冲上云计算的技术标准:5K 的规模。

中国人研究的云计算,会“飞天”还是“坠毁”,旁人心里多多少少是有判断的,只是不便明说。

这两件事,胡晓明最终都答应了。不过阿里云这帮看上去疯疯癫癫的人,他们技术到底靠不靠谱,胡晓明可是真没底。

在芯片领域,我们面对美国垄断只得眼睁睁地沉默。

2015年7月22日,云栖大会北京峰会开幕。新的领导团队第一次在公众面前露面。

王坚是个理想主义者。

电影里才有疯子。麦克墨菲在疯人院里带领一群精神病人揭竿而起,怼天怼地;饿了三天的黑皮为了抢一口面包被店主追上高架桥,末路狂奔;杰克和泰勒在午夜的搏击俱乐部里挥拳相向,鲜血淋漓。屏幕对面,我们把爆米花塞进嘴里,哭成狗或者笑成狗。电影散场,各自回家。

说起来,这个地方算是阿里云最早的办公室,但是门口也没个牌子。直到半年后他们搬出大厦,保安都不知道这帮神神叨叨的人究竟是干什么的。(不过十年后的今天,他们的手机里的很多 App 也许都跑在阿里云的服务上。)

2018年初的云栖大会上,在一幅硕大的市场曲线图面前,胡晓明抬起右手,这一秒,时间像是凝固了一般。

你还记得“云梯1”和“云梯2”两个项目吗?此时,终于轮到他们唱主角了。

图片 18

他们把别人的目光变成聚光灯,把自己的生活变成真人秀,手提钢刀用肉身串演一个浓重的角色。他们的人生结局无外乎两种:黄.袍加身,或者玉石俱焚。

荒野求生

从这一刻开始,这些疯狂的技术宅才有了服务全世界企业的信心;也正是从这一刻开始,坐镇第一把交椅的传奇总裁胡晓明,带领阿里云进入了“攻城掠地”的时代。

图片 192018年现任阿里云产品总监何云飞身上就穿着“第一行代码T恤”

最初,因为要做两手准备,以 Hadoop 为基础的“云梯1”和以飞天为基础的“云梯2”一直并行。这个时候,时局已经紧迫到不允许团队分流,他们必须抛弃掉一个云梯。

2014年秋天,胡晓明来了。这个当年去王坚办公室“上访”的热血青年,陪着阿里云走过了最漫长艰难的岁月。也正因如此,此时他比任何人都更坚信云计算的力量。

国外的东西,无外乎“IOE”这三样标配:

2018年,当年为阿里云对接淘宝立下汗马功劳的小邪正式加入了阿里云,掌管“飞天八部”,阿里云所有的现役主力技术和前沿技术,都归至他麾下。

在这个关头,阿里云需要集团所有人的帮助。

刚才我说阿里云是“起名驱动型的公司”,你看看这帮疯子给飞天内部模块的命名,就知道他们心里在想什么了:

然而,事情发展到这里,就开始有些错位了。

人们总爱说一句话:认真你就输了。而我更相信另一句话。认输,你才真的输了。

飞天系统稳定得不像阿里云的作品……

图片 20

最终,一场恶斗转化成了几十个工程师坐在会议室促膝谈心。技术人是讲理的:淘宝已经这么大了,如果现在不刮骨疗毒,自己砸自己的饭碗,将来整个淘宝都会命悬一线,到时候大家还不是沦落天涯。想通了这些,工程师们也冷静多了。

我没有想过公司内部对阿里云有那么大的意见,我真没想到。但是你们都扛过来了,这是我深以为傲的,如果你们能抗得过内部人骂,抗得过那么多人指责,我们还有什么扛不过未来五年的发展?”

经过这样“连滚带爬”的招聘,到了2008年年底,阿里云凑够了了三十位工程师。

这个新的计算架构应该是什么样呢?

2、两兄弟谁先跑到 5000 这根线,就“赢者通吃”,继承家业。

李超又给我看了另一张照片。

这段时间,阿里云也迎来了两个变动:

这是当年参加 5K 项目的同事。他说,这些人中现在只有十几个还在阿里巴巴。

2009年春节上班第一天,在北京上地的汇众大厦203这间连暖气都没有的办公室里,一帮工程师一边口呼白气,一边敲出了“飞天”的第一行代码。

流言终于传到马云耳朵里。

那个时候的他们,看上去和一帮戴着眼镜的教徒无异。

招他进来的,是王坚在微软的旧部,阿里云的第一技术负责人林晨曦。面试结束时,林晨曦歪嘴一笑,提醒满弓:“你加入阿里云之后,要做好随时出差的准备。”

阿里云苦苦撑着,人心飘摇,流言四起。

这个时候,把飞天推上 5K,几乎已经是唯一的选择了。事到如今,这已经不是阿里云自己的战斗,而是整个阿里巴巴集团的“背水一战”了。

时间不等人,转眼到了2009年。

结果,八十多个 Oracle 工程师把他堵在会议室里。“你再说一句试试?”

再没有一句质疑,再没有一丝埋怨。那些曾经看好或者不看好飞天的技术大牛,这个时候撸起袖子一齐杀了进来。

王坚跟马云说,这帮人很能干,每天晚上都加班。马云惊了,在这种地方还能加班??没过几天,阿里云就搬出了这幢大楼,进入了有空调的办公室。

之前有人无心说的那句“没准将来我们成功了,我们写的飞天第一行代码还能印在T恤上呢!”也成为了现实。

2018年初,飞天的分布式存储系统“盘古”升级到了 2.0,成为阿里巴巴统一存储平台。

胡晓明:纳尼??!!

网络通信,就用追日的“夸父”。

历史就这样以汹涌的姿态,向那些准备好的和没准备好的人敞开。

“阿里研发院” 2008年10月才成立,已经错过了招聘季的黄金时期。但是我们又确实太需要人才了,于是刻不容缓,要再扫荡一下那些大学,把“漏网之鱼”打捞回来。

就在阿里云最危急的时候,好友朱珑找到林晨曦,鼓励他离职创业。但林晨曦给朋友撂下一句斩钉截铁的话:“现在我绝对不能走。如果你想等我创业,先让我把阿里云扶上正轨。”

巨大的计算力让阿里金融实现了“秒级”放贷。这种技术进步让“小额多次放贷”成为了可能,这就让阿里金融几乎等于开挂,不良贷款率远低于传统金融机构。也正是因为阿里云“高效低价”的加持,单账户每年的 IT 成本可以控制在1元以内。

不久前,王坚受央视《朗读者》节目邀请,回忆了阿里云的创业史。他平静地说:“阿里云是拿命换来的”。

2012年秋天,林晨赴约去创业。提及过往,他如此回忆:“阿里云的四年,像是过完了一辈子。以后的事情,都是下辈子的。”他和朱珑创立了依图科技,如今是人工智能领域最炙手可热的公司之一。

2008年,中国虽然已经加入 WTO,还把国际友人请来热热闹闹地开了一次奥运会,但在科技领域仍然是个标准的“三无”国家:没有自己的操作系统,没有自己的芯片,同样没有自己的计算力系统。所以,购买国外成熟的设备和系统,几乎是 BAT 和所有大国企的唯一选择。

小邪手中的弹药充足:

E(EMC,存储设备提供商,他们提供的是“集中式存储”)。

事情就这样定下来了。

阿里金融从一口口呛水的状态,一下子冲出海面。

阿里云这群疯子,就用56度的荷尔蒙,在横跨十年的悠长画布上涂抹了这样一个故事。

胡晓明:理解,这没问题。

“我每年给阿里云投 10 个亿,投个十年,做不出来再说。”他对着阿里巴巴集团所有人,斩钉截铁地说。

跟着阿里云的招聘队伍,满弓跑遍了全国主要的几大城市十几个学校。每到一个学校,只呆三天。

另一个问题是不好用。

核心技术系统的正明团队,全员投入 5K 的攻坚战;负责应用集测测试的许呙兢,在得知调度系统的日志自动收集和分析工具缺口严重,二话没说主动请缨;褚霸、多隆、长仁这些分散在各部门的的技术牛人也都冲进来了。各路神仙在这几个月亲近得不分彼此。

目标就摆在这,但无论是“云梯1”还是“云梯2”,都死活达不到这个指标。

胡晓明信心满怀,准备撸起袖子说干就干。不料,马老师悠悠地说,不要急,你要先答应我两件事。

“代码已经写了多少?”小邪问。

中国的网站登录阿里云的比例,从20%,上涨到30%,上涨到40%,上涨到50%。全球19个地域,两百多个飞天数据中心顺次点亮。

几亿用户无论是在淘宝剁手,还是支付宝上转账,这一切都要靠巨大的计算力来思考、记忆。

这只怪兽名为“5K”。

王坚说了两个字:“飞天!”

2017年发布的神龙云服务器,是对下一代云计算主机的探索。

阿里云这群疯子

那副对联是这样写的:

图片 21王坚

图片 22当时内网论坛里对阿里云和王坚的吐槽

“我知道,所有留下来的人其实是真正阿里云的精髓。

而一位叫做李泉的同事,连续几个礼拜连轴转,半夜两三点被叫起来解决问题,早晨八点又出现在工位上。被同事封为“李铁人”。

代码成就万世基积沙镇海

图片 23同事们往办公室里运冰

5K

被刀架在脖子上的行癫心急如焚。

图片 24小邪 蒋江伟

各个部门的技术大牛迅速组成增援大军列立山头,旌旗飘扬。但是在进入战斗序列之前,一个纠缠了各路大神五年恩怨情仇的问题必须有个了断:

在 2012 年的阿里云年会上,王坚走上台,他紧紧攥着话筒,几次抬眼望向远处,几次欲言又止,最终泣不成声。这个曾经扬言要用一己之力把中国云计算镌刻在世界科技史上的“疯子”,就那样孤零零站在原地,面对台下黑压压的一群错愕的人。仿佛无数时间的列车在他眼前呼啸飞逝,而他手里没有握着任何一张车票。

云梯1,依靠开源技术,更加成熟,但几年的实践证明,把它推到 5K 有明显的的技术瓶颈。而且,最核心的技术转向开源系统,也许会让阿里巴巴在未来遇到更多技术制约;

按照数据增量与未来业务增长的情况,云梯1和云梯2两套系统的存储和计算能力将在今年6月21日到达瓶颈。

就连在电梯里,都会人问阿里云的同事“最近怎么样?需不需要帮忙?”他们来自一些兄弟团队,有负责安全的,有负责集成测试的。

这一天终于来了。人们洪水般的“买买买”为阿里巴巴划定了 Deadline。要想维持正常的业务,他们必须在不到三个月的时间里解决问题。

如果把阿里云所有曾经的员工加起来,可能是现在的好几倍。有太多太多的人都在那段暗淡的日子里离开了。这不怪他们,任何一个能认真判断利弊的人,也许在那时候都应该离开阿里云。也许只有“疯子”,才会选择留下。

他说:“这两年我挨的骂甚至比我一辈子挨的骂还多。但是,我不后悔。只是,我上台之前看到几位同事,他们以前在阿里云,现在不在阿里云了…”

图片 25

2013年,中国企业IT架构升级最好的解决方式,再也不是买来一台新的机器替代掉原有机器,而是采用云计算。

在隔壁淘宝网的普通员工中,有人在“隔江犹唱后庭花”,有人却已经感到“山雨欲来风满楼”。

5K雕塑,上面刻着飞天团队所有工程师的名字,无论 Ta 是不是仍然在团队。

阿里云成立满六年的时候,为所有从第一年走到现在的员工做了一个人偶。所谓的“所有”,只是眼前这五个人偶。满弓和李超就在其中,他们相顾一笑。

图片 26

越是困难时刻,越会产生分歧。

真正的疯子,从来不看电影。

那时候小型机价格大概是从几十万到百万人民币;商业数据库软件费用差不多几千万,外加一大笔维护费。王坚 08 年刚来阿里时就给马云算了算,按照这样的速度“剁手”,光是买机器和软件就足够让阿里破产。阿里得找到一种成本更低的技术架构。

满弓、李超、飞天总架构师唐洪、林晨曦,他们每天都是低着头上班。今天,左边的工位空了,明天,右边的工位空了。。。

哦对了,还有一件小事。当年振飞和后羿的那场“世纪赌局”,后羿赢了。用了三年时间,新的淘宝核心系统果然实现了零故障。

2012年底,以开源软件为基础的“云梯1”计划实现了4000台集群调度,而阿里云团队更看好的纯自研的“云梯2”还在1500台集群的数量徘徊。

如果这个“大脑”记忆被填满,就没办法储存新的商品和交易记录。

从2010年到2012年,在阿里云最艰苦的长征三年,“战损率”只多不少。

2、虽然没达标,但是淘宝网没有选择,只能“赶鸭子上架”,让两架还在试验中的云梯承担一些重要负载。

淘宝的一场战争

就这样,一年过去了,两年过去了。

图片 27

“几行吧。”林晨曦说。

但后羿一个人的分量还远远不够重。毕竟淘宝上有这么多业务,这么多买家,这么多卖家,万一数据迁移失败,谁来负责?时任淘宝技术总架构师行癫见状,把心一横,宣布自己和部门也愿意站出来,共同承担技术风险:“干好了我们大家荣誉等身,干坏了要杀要剐我来扛!”

某一天,马云突然召集阿里集团高管开会,所有业务部门的负责人都估计是马云要宣布关掉阿里云的消息,于是纷纷带上自己的技术负责人参会,准备一声令下,就瓜分阿里云的技术人才。

图片 28胡晓明内心OS:宝宝心里苦,但宝宝要笑 T_T...

满弓回忆,每次一开会大家都会把桌子收拾干净,把水杯什么的拿走,以防出现“事故”。

到那时,数据业务将会停滞,淘数据,量子能业务都会受到影响;阿里金融的贷款业务将因为无法进行信用数据运算而中止。

图片 29

招兵买马

但飞天团队却黄巾高擎赤膊上阵左右开弓,想依靠一己之力,开发出一套改写世界历史,可以让中国人扬眉吐气的完美云计算系统。

如此,阿里云的疯子们,理应赢得光芒和荣耀。

由于招聘人手实在太少,面对堆积如山的笔试试卷,满弓他们根本判不过来。焦头烂额的满弓擦汗时一回头,看到了同行的 HR 小姐姐。满弓两眼放光,二话不说把她们揪过来,一晚上就教会了她们如何判卷。

有一次周六,马云来北京,专门到阿里云的办公室去看看。林晨曦赶紧想打开电脑给马老师展示一下自己团队的成果。结果按了半天开关,机器都没反应。他才发现大厦停电。。。马云就这样坐在办公室等了半个小时,直到物业恢复供电才一睹阿里云飞天系统最初的芳容。

这些成绩,也已经成功引起了其他公司的注意。于是 2010 年,在阿里巴巴出发两年后,很多大公司纷纷着手研究自己的云计算技术。

同年发布的 POLARDB,剑指商业数据库 Oracle 和它的继任者 MySQL,也称得上是阿里云未来之星。

马云深受王坚鼓舞。虽然不懂技术,但是他逐渐发现,云计算这件事情的价值比一开始想象中的要大得多。

一个大问题

怎么测试系统的问题定性呢?之前带领“八十勇士”围攻后羿的振飞,提出了一个真·钢铁直男的测试办法:拔电源。

怎么办?花钱继续买服务器和软件啊!

实际上,“云梯计划”关乎阿里的生死,不是儿戏。思来想去,公司内部还是做了两手准备:

王坚是一个性情温和的人,但是那段时间,他几乎天天跟团队拍桌子。

在阿里巴巴的云栖小镇,一尊雕像被竖立起来,雕像上只有两个字:“5K”。

O(Oracle,数据库提供商,他们的软件是着名的“甲骨文商业数据库”)

此时做出任何抉择,都会彻底改变阿里巴巴的历史。但历史又只在彼时彼刻给阿里巴巴一次机会,开弓没有回头箭。所有人的目光都看向王坚。

拉电的同学反复问了三遍:拉吗?拉吗?拉吗?最后才颤抖着双手拉下了电源。

阿里巴巴就像赛道上的跑车:速度飞快,但引擎已经发红,再踩几脚油估计就要冒烟,后果不堪设想。

作为合作伙伴,林晨曦每天的表情都有点儿尴尬,出则满脸堆笑地帮阿里金融排除 Bug,入则愁容满面地和同事们一起修改代码。

两座云梯,就像“争夺家产”的两兄弟,规则很明确:

阿里的很多的业务部门希望的是稳定地在现有系统上加以改进,最好别冒太大风险;

阿里云的创业故事走到了封底。书中悲欢离合,凡此种种,也许只博看客一叹。只有那些经历过这一切的活生生的人,才能在时间的风尘里,循着自己的脚印依稀辨别来路。

君不见,在无数个平行世界中,疯人院里的麦克墨菲最终都越狱失败,被医生切去前额叶,再无还手之力。

一般来说,三年时间足够判断一件事情到底靠不靠谱。“世界末日”那年,人们几乎已经认定了阿里云不可能做出一套云计算系统了。不仅如此,很多阿里的同事都叫王坚“骗子”。开始大家还在背地里说,后来,大家都不再忌讳,公司里流传着很多骗子王坚的笑话。“一个学心理的博士居然当上阿里巴巴的 CTO,心理学学得真好啊!”

这是阿里云故事里最为人所知的一个细节。但我猜很少有人记得,王坚一边哭,一边说了什么。

下有林晨曦招兵买马,上有王坚每天“画饼”。

后来人们说,阿里云是技术驱动型的企业。不过在我看来,最初阿里云应该是起名驱动型的企业。名字倒是起得不错,但作为“三无”国家,底层科技起步较晚的中国在对美国的复杂计算机系统的战争中,几十年都未尝胜绩。

可能连马云自己都没有想到,阻碍阿里巴巴增长最迫切的阻力不是商场上的博弈、不是政策的变化,而居然是 IT 基础设施的瓶颈。

有的时候不是你技术有多强,而是我们有多团结,互相多配合,多支持,多理解。

这一刻,时间停止了,只有机器重新启动的声音。

2013年6月底,5K进入了最后的稳定性测试。

我记得有一次博士很生气,砰砰地拍手机。有一个工程师实在受不了了,说博士,你拍的是我的手机……

解决了稳定性,阿里云就像抓住了救命稻草,总算可以暂时喘口气。

每天,工程师们除了噼里啪啦写代码,还得顺便“荒岛求生”——自己订水、买垃圾桶、修桌椅板凳、修无线网,连茶叶和咖啡都是从自己家带来的。

彼时绝没人想到,五年后的那个下午,这两座通向顶峰的云梯会用怎样的姿态占据画面的中心。千军万马雄列两旁,目睹荣耀的火焰和退潮的海水。

在操作系统领域,我们面对美国的背影只能艰难追赶;

在最后的测试阶段,杭州和北京两个办公室的同事电话24小时通着,人可以轮班休息,电话不能掉线,那部用来接听的电话都烧得滚烫。

由于没有成绩没有进展,连续几年阿里云整个部门都在集团拿最低分。

2009年,小邪刚刚加入阿里一年,在淘宝网参与系统研发。当时他和同事都感觉到,淘宝网面临的矛盾非常明显:

为了满足阿里巴巴庞大的计算任务,这套系统至少要比 IOE 表现更好,能同时调度数千台计算机,组成一个巨大无比的“大脑”。

阿里在08-09年的时候,业务增长速度实在太快。每年都是十几二十倍,IOE 虽然都是美国公司,但事实证明美国的月亮也不会更圆。它们的系统并没有经受过服务几亿人这么大规模的考验,此时已经变得非常难用了。

阿里金融的工程师必须24小时盯着系统,才能防止酿成大错。当时情况危急到了什么程度呢?一位奶爸工程师为了值夜班盯系统,把自己小孩的哭声设成了闹铃。因为只有听到这个声音,他才能在无论多困的情况下从床上弹起来。。。

而 5000 这个目标,就写为 5K。

被“猪队友”坑得够呛的胡晓明气鼓鼓地带着核心骨干跑到王坚办公室门口“讨说法”。胡晓明这个人,是出了名的“只要认定的事情就一定要办成”,大有在王坚办公室打地铺静坐的架势。王坚无奈,派出所有的技术工程师,驻扎在阿里金融的现场加班开发,只为了“让兄弟团队能过个好年”。

现实不是小说。神兵天降和剧情反转并不存在。纵然他们几乎尝试了所有可能的技术策略,但就是没有一种方案可以成功调度5000台机器。

2013年3月28日,一封来自集团技术保障部架构师云铮的邮件直达高层:

这段时间,提到阿里云,阿里金融的程序员们都是“眼睛干干的,有种想哭的心情”。他们的经典吐槽大概是这样:人家的是云计算,我们家的是“人肉云计算”;人家的是“分布式计算”,我们家的是“分步试计算”。。。

好不容易捱过了 2009 年,春节过后,阿里云发布了一次大版本升级。升级完成的一瞬间,空气突然安静了:

同一年,飞天云计算操作系统获得了一个特别的奖项——中国电子学会15年以来的第一个特等奖。

世事安稳,岁月静好。

一群理想主义者的长征路上,一片落叶微微改变飞舞的方向,都有可能把他们引向另一个方向,另一种结局。如果重来一次,阿里云也许无法复现今天的疆域和荣耀。但历史没有假设,可叹阿里云这群人从第一天就无来由地相信,中国人有权拥有自己的云计算。

其他部门的很多领导层,用半信半疑外加慈爱的眼光看着他们。

图片 30

当年用户激增,数据越来越多,每天早上八点到九点半之间,服务器的处理器使用率都会飙升到 98%。离爆棚就差两个百分点。

这一句话,让所有的流言顺次平息。

当时淘宝技术保障数据库管理员的负责人是后羿。他几次欲言又止,还是硬着头皮在内部会议上宣布了这个消息:淘宝要放弃 Oracle,转投自研的数据库架构了。

金融大咖胡晓明,2005 年加入阿里,以办事雷厉风行闻名全集团。

1)用一些已有的开源软件为基础,研发一个数据计算系统,这是“云梯1”计划。

盛夏的杭州,阿里巴巴热血翻涌,阿里云的“疯子”们却心如止水。

以身为棋,胜天半子。

2)而以“飞天”为基础,纯自研一套数据计算系统,被定为“云梯2”计划。

这是因为云计算系统会制造出一种具有极强弹性的计算力。这样的计算力一方面可以为阿里巴巴添置家当,另一方面还可以“批发零售”给无数中小企业,为未来世界建设了一整套“基础设施”。

就像一日和三餐一样,无论去哪家餐厅,都不如自己做饭更实惠。长远来看,自己开发一套计算架构显然是最经济的。

实话实说,当时大多数的技术大牛,都觉得用经过全世界验证的 Hadoop 为基础的“云梯1”更有希望,对“云梯2”嗤之以鼻。而阿里云这帮人就是不认,因为根据他们的推断,Hadoop 在4K到5K的路上,肯定会遇到一个不可逾越的沟壑,于是倔强地带着团队大举投入“云梯2”。

在阿里云年会上,马云做了这样的独白

眼看就要过春节了,两个项目都快撑不住了。

另一个奇迹

这样来看,就把“独善其身的工具”变成了“兼济天下的生意”,这不正是马云创建阿里巴巴的基本信念吗?

图片 31

1934年到1936年,从苏区出发到陕北会师,三年长征,工农红军从8万人锐减到3万人。

因为突破了技术瓶颈,在 5K 之后,ODPS 只用了几个月就冲上了单集群 10K,进而实现了无限制扩展。到 2018年,已经更名为 MaxCompute 的 ODPS 达到了数万台的规模。

2018年秋天的云栖大会上,唐洪、小邪、何导等阿里云大咖悉数登场,发布了飞天2.0。敢称 2.0,是因为他们把野心放到了“万物互联”的下一个20年。

云梯2,自研技术,难度更大,但它的架构和代码都是基于阿里自身诉求而设计的。自主可控的 5K 一旦成功,就会打下阿里巴巴下一个十年的江山。而一旦失败,后果也将不堪设想。。。

说回这个疯狂的计划。

这个老男孩,此时静静坐在时光的河岸边,痴痴傻笑。梦回少年,肝胆皆冰雪。

神坑,阿里云

新员工刚刚入职,就立刻被派往“战场”。本来是北京分公司的员工,入职之后直接拉到杭州帮忙 5K 项目。都加入公司两个月了,还不知道自己北京的工位在哪里。

“骗子”王坚

阿里金融,成为了后来的网商银行。他们就这样无意间成为了中国第一个上云的银行。

本文由betway必威登录平台发布于互联网农业,转载请注明出处:进口缺芯少魂?阿里云用10年时光成功自己作主研

Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。