导读:时代的需求,都不会等你,全部在倒逼你加速成长!
作者:冯斯基
文章来源:常垒资本(conswall_cap)
零.
>>>1949-1979<<<
1956年,周恩来总理亲自领导了“科学技术发展十二年规划”,标志着我国计算机事业的开始。
而那时,几乎没有人知道计算技术是怎么回事,不知道磁芯存储器,不知道集成电路,甚至没有人见过一台真正的数字计算机。
在前苏联的帮助下,相继研制出了我国第一台小型机—103机和第一台大型机—104机。之后又研制成功107、119、111、717、757等计算机。
这些遵从苏联的体系,上个世纪五十年代末中苏关系破裂开始一刀切的停滞了。
随着后来的十年动乱,中国计算机和数据库的研究基本停滞成为空白。
这也是为什么在70年代末,改革开放需要科技产品的时候,我们也没有重量级的信息技术公司诞生的原因。本身不存在这样的基础环境和人才储备。
那时候关系型数据库的概念刚刚兴起,1975年微软成立,1977年Oracle成立(70年代是美国的黄金年代)。
之前计算机还是为了单纯的计算而生,没有太多交易计算的概念。是什么让数据库的重要性提升上来了呢?
这个叫做:“OLTP”联机交易处理也称为面向交易的处理过程。也就是说,计算机不但承担的是结果的纯计算,现在要实时承担交易过程和结果记录。
这种特定的场景广泛的应用在:银行、证券、民航订票、电信计费等重要系统。
中国的银行业应该是最早应用商业计算机系统的行业(延伸阅读《激荡中国银行业信息科技四十年》)。
当中国银行史上第一台IBM3032在中国银行点亮的那一刻,就意味着,我们的整个信息技术体系都是遵循美国的技术架构和生态。(事实上,这也没什么可耻的,因为全世界的其他国家也是这样。)
白马过隙、时光荏苒,40年过去了,硬件部的部分我们早已硬了起来,不用再整机进口(虽然芯片还是软肋);
然而软的部分,我们还是很软。所谓软的部分,卡脖子的就是:“基础软件”和“复杂行业应用”。
复杂的行业应用是指的是工业软件、ERP系统等等,这个不在我们今天讨论的范畴。而更加广泛的是基础软件。
俗称三大件:操作系统、数据库、中间件。
操作系统在云化、容器化的时代重要性被弱化了。至于中间件,国产中间件或者开源替代用的不错。对于稍微有些技术能力的企业客户,开源中间件就能玩起来。更重要的是中间件在分布式体系下更容错了,没那么难啃。唯独数据库这个硬核,还是一样的硬而且很痛。
我们最典型的银行取款,微信、支付宝支付,其实我们背后的钱,就是在银行数据库中的一个数字。
能够保证大量的并发处理,一点儿不错,其实是个非常非常不容易的事。尤其是银行、电信、电力、航空等实时交易重要的环境中,可靠的数据库是重中之重,稳定压倒一切。
2017年2月9日,中国工业和信息化部,信软司发布了“《信息产业发展指南》解读:基础软件和工业软件”,着重描述了需要提高的基础软件和工业软件。
我们今天主要扒一扒在信息技术领域最卡脖子的“数据库”。(这里面特指最重要核心的OLTP交易型数据库)。
壹.
>>>1979-1989<<<
1977年,劳伦斯·埃里森、鲍勃·迈纳(Bob Miner)与埃德·奥茨(Ed Oates)3人,在美国加州合资成立公司,名为软件发展实验室(Software Development Laboratories,SDL)。
这个名字怎么听都不像一个正经公司,但是第一个订单却是来自CIA,CIA给这个项目取名字叫:Project Oracle。
后来SDL因为这个项目做的比较成功吧,把公司名字也改成了Oracle,把商业公司完全交给市场,这是美帝的一剂迷幻药。
其实它一直都在挺自己的公司,想想Xspace的技术来自于NASA,Oracle第一个拿CIA的订单就知道了。政府一直都在帮助自己的本土公司。
此时的神州大地刚刚苏醒,那时候只有数据库理论研究,而没有数据库商用产品。
同一年的11月9日,在黄山召开的第一次数据库年会。
中国有个学术组织叫“中国计算机学会”,在学会下面有34个专业委员会,那么数据库专业委会就是我国开始数据库研究的起源。
这里不得不提到两位在学术领域的重要前辈:萨师煊教授和王珊教授。
两位互为师徒关系。萨师煊教授率先在中国人民大学开设“数据库系统概论”课程,是我国数据库的“开山祖师”,国产数据库领域奠基人。
王珊老师从事数据库领域研究近40年,创办NDBC(中国数据库学术会议)等大型数据库会议交流平台,编著了中国第一部数据库教材《数据库系统概论》,相信学计算机的同学大学都学过这本教材。
两位老师都是来自于人民大学,这时候就知道为什么有个”人大金仓”了吧。
整个中国80年代的发展,具备“帕累托改进”的特质。
简单的讲,就是社会各个阶层都在变好,而不是变坏。所有的领域都刚刚苏醒,欣欣向荣,因此数据库这种重要产品需求极大。
但是当时的商业信息技术确实没什么家底,别说软件技术,就连硬件也没有办法造出来。
1979年1月1日,中美正式建交。整个80年的中国信息技术建设开始和世界开始接轨。
我们基本上属于引进的状态。这里不是说技术换市场,而是我们想发展,自己造不出来,就一定得用国际产品。
80年代初期,我们开始尝试引进 dBASE II。dBase是第一个在个人电脑上被广泛使用的单机版数据库系统,在CP/M与DOS的时期,由Ashton-Tate公司所发表。
在1980年,它最初是出现在CP/M的软件,而后被移植到Apple II与IBM PC的DOS上。这个产品在SQL时代迅速被其他产品打败。
中国80年代,自动化还没上马,信息化更是难寻踪迹。在数据库的研发和投入上,靠的是零星的科研力量和资金。
这个时期的学术和产业是脱钩的状态。学术研究的主要目的是科研和教学,产业上(银行电信等)的数据库需求全靠进口完成,快速上马。因此,产、学、研是三条平行线。
贰.
>>>1989-1999<<<
等到了90年代初,信息技术市场环境开始不一样了。
在冯斯基十岁那年。美国有数据库产品的科技公司组团进入中国。
1989年,Oracle进入中国市场靠代理开卖Oracle,1992年甲骨文在北京设立独资公司。1991年12月,Sybase进入中国大陆,随后投资230万美元正式设立赛贝斯软件。1992年,IBM 正式进入中国,并启动了“发展中国”的大战略,协助中国全面开放。带来了DB2和informix。1992年10月,Microsoft在北京设立代办处…..
这都是巧合么?
还是,这一切的背后都是有大势紧密相关?
1989年-1993年是中美关系的严峻时期。
美国单方面联合西方对中国实施打压,1989年6月5日下午,美国总统布什(即老布什)宣布了三项制裁措施:
在美国的带动下,西方国家纷纷制裁中国。
那时候的中国,远比现在弱的多得多(今天贸易战,在历史上也不是第一次打了,以前是单方面被揍)。
内忧外患的时刻,邓小平同志发挥出了高超的政治智慧和国际关系处理能力。
从1989年到1991年间,邓小平曾先后会见了来访的美国重要客人,并多次同其他外国客人谈中美关系(目的是不断给华盛顿决策层带话儿)。
同时,邓小平的指导和决策下,中国政府在美国和西方的巨大压力下保持了极大的克制,继续坚持改革开放路线,将自己的主要注意力放在中国国内的发展和改革开放上。
1992年春,邓小平在中国南方视察并发表谈话,在国内外引起了巨大反响,掀起了中国改革开放的新一轮热潮。
美国大量公司、产业这时候瞄准了这个新兴市场,纷纷涌入中国。中美贸易的随后强劲增长,也为中美关系的改善提供了新的契机。
随后,开始了外资和中国市场结婚的黄金十年。
1992-1997年,是外资在我国空前发展阶段。
我国的实际使用外资额从1991年的115.54亿美元快速增长到1997年的644.08亿美元,特别是在1992年邓小平“南巡”之后,FDI(外国直接投资)在一路攀升,成为我国利用外资的主要形式。
从1991年的43.66亿美元猛增到1997年的452.57亿美元,五年10倍!
在当时的中国政策,尤其是京、沪、广全面围绕外资企业提供优厚待遇。比如,购买外销房免个税啦,外企企业减税等政策。
那时候在外资打工,和洋大人与太君一起工作绝对是整个城市的金领,系上领带,见丈母娘提到公司名字都是倍有面子的事儿。
IBM早期加入公司的,先什么都别干,发8000元置装费,然后扔到新加坡给我培训一个月再说。
整个90年代是改革发展经济巨变的时代,外贸进出口总额突破4000亿美元大关。面对井喷的经济增长,中国的各行各业需要信息技术的支撑,软件中最硬的数据库部分,需求就全出来了。
这个时期对于信息技术的发展,核心数据库的应用主要解决的是有且能用的问题。至于是否国产、安不安全可控不是最关键的。
用国际主流产品,保障经济高速发展,不出事故不犯错,这也是领导政治上的需求。因此,在国产没有可用,外资受到追捧的年代,产品好又稳定。
不用说,不仅仅是数据库,整个信息技术核心基础软件都是在拥抱国际主流产品。在高可用系统和关键业务,Oracle和DB2成为不三的选择。跳出银行业,Oracle更是横扫市场所有产品。
中国90年代的时代红利,外资涌入、市场开放的红利一大部分也是让港、台、澳、新地区的同胞沾上了光(发财这个事还得做的早+红利)。
这里说Oracle进入中国,不能不提冯星君。这位哥们是香港出生,台湾长大的。1989年Oracle在北京还是一个办事处的时候,他就是头儿。
后来,甲骨文设立全资子公司他一直干到了1997年。
1989年,冯星君怀里揣着Oracle给的10万港币,只身一人住到了中关村燕山大酒店。
办完注册手续,冯星君骑着自行车在中关村兜了一圈,发现很多小公司在卖Oracle500,2500元一套,要求自己带软盘现拷,而且没有说明书。
(商业软件一般没有锁,Copyright就是一张授权纸,有了纸就是正版,没有就是盗版,你说中关村卖的是正版还是盗版?)
看到此种状况,冯星君做出了一个决定,“与其让盗版卖Oracle,倒不如我自己卖”。
在美国要卖1700美元一套的Oracle DOS版,冯星君说服了他的美国老板,准许他在中国只卖500美元。
有培训、有服务、有手册,价钱和盗版一样,只用3个月时间,冯星君就卖出了5000套,扫平了中关村的盗版。
就这样,冯星君一进中国就开始为Oracle赚钱而且获利颇丰,每年增长都在100%以上。不过根据很多故事,这位大哥离开Oracle卖掉Oracle股票的时候也很传奇。
冯星君丢失过两次赚到500万美元退休的机会,另外一次是他离开Oracle的时候,他一气之下将自己手中的7万股Oracle股票全卖掉了,他卖的时候每股28美元,隔了几个月,Oracle股票一路疯涨,一直涨到110美元。
冯星君当初如此激动地抛股票,是因为Oracle总裁埃里森两次来北京都给大家上了一课,当然这段算野史了,我们也来扒一扒:
1997年1月27日,埃里森乘专机飞临北京,冯星君通过关系安排国宾车队去接,国宾车队的车一直开到跑道上,一大队车闪着灯很威风。
机舱门开了,但人总是不出来,等了20分钟,从飞机上跳下来一个穿防弹衣的黑人保镖,他对迎接的车队说:“所有的车门全部打开,我要检查有没有炸弹。”
一边是美国来的大老板,一边是同样惹不起的国宾车队,这哥们太难受了,他忍了。
第二天,埃里森要到长城拍推广网络计算机的电视片,事前吩咐冯星君找了20个小学生参与拍摄。约好早上8点,直到9点,埃里森都不起床。
当天零下20多度,大巴没有暖气。冯星君去求埃里森:“那些小孩要冻死了。”冯星君眼泪都快流出来了,埃里森才勉强答应启程。
去了没多久,埃里森让副手打回电话给冯星君说:“埃里森挺喜欢长城,玩得挺高兴,中午就不回来了,你取消下午3点跟李鹏的会面吧。”
这哥们差点晕过去。“下午的会面不是开玩笑的,如果我2点钟看不见埃里森,我辞职,我要走了,这个责任我担不起。”
那边一听怕了,埃里森一行匆匆赶回人民大会堂,那个黑人保镖还要跟着进去,说要保护老板,吵闹得不可开交。
Larry 有个嗜好,他喜欢人等,越多人等他,他越不出现。
时至今日,根据Oracle的年报显示亚太占整个公司年收入的16%,推测的中国大陆占总收入约5%吧。
当自己没有只能买别人的时候,别人卖给你也是不一定要给你好脸色看。你讨厌我,但不能不用我,这就是刚性、卡脖子产品的力量。
整个90年代,我国自主的数据库研发也没闲着。
国家还是有投入的,主要以大学和研发机构为主,主要面向OLTP的关系型数据库,认为只要做出功能、性能、稳定合适的国产数据库就能有一定的市场,至少价格是有优势的,即便市场化不成功,作为科研教学也具有一定价值,至少申请科研经费和政府补贴。
主要受益于 “十五”期间,国家863计划设立了“数据库重大专项”。就这样轰隆隆,第一批国产数据库厂商出炉啦。
叁.
>>>1999-2009<<<
凡是种的因,就一定会结出果子。
80年代以研究所和大学为主的国家投入,那么在90年代产出这样几家国产数据库公司。
这些产品和背景主要源自于国家的“863”研究计划,“核高基”重大科研专项,以及“973”研究计划等等。
本质上,这些经费和项目都是通过大学去申请并且实施的,因此,从研究数据库的产品研究开始就是缺乏行业、产业端的接入,产品在商业市场的拓展也比较弱。
这也是为什么,在2000初期成立的数据库产品公司都有大学背景的原因。
十几年过去了,目前中国市场数据库应该在80亿-100亿元每年左右,而国产数据库的占比应该在5亿人民币,还不到整个市场的10%。
究其背后的原因,数据库的核心使用大户:金融、电信、航空等重要的关键体统并没有广泛批量采用这些国产产品。
这里主要有两个原因:
自2001年中国加入WTO之后,这台发动机开始出现了井喷的态势。
中国出口金额从2001年的2661亿美元,猛增到2007年的12200.6亿美元,六年时间增长了4.585倍。
那时没有自主可控的背景,主要是一切向经济发展看齐,快速上马,能用好用就行。不用说,让市场选择一定选择成熟的国际产品。
先说电信,2001年数字电话大幅出现以后,河南移动的数据量从十几万一下子增加到90多万,并且以每年500万的数量增长。
“2003年数字电话普及以后,河南的移动用户很快就增加到了3000万,原本数据库也就需要三五台,后来增加到了几百台。这还是15年前的事。历史当时的情况就是,娃还没长大,但是战场上需要要有战士了。就这样,Oracle在电信行业横扫市场。
在中国数据库公司刚刚成立想开发产品追赶Oracle的时候,市场的需求已经迸发出来,国产产品接不住,所以市场就是Oracle的天下了。
再说银行,钱就是数据库中的一个数,根本不能错,系统不能停。银行业监管又十分苛刻,不是没有钱去买,而是钱可以花,价格高低不是原因,但是绝对不能出问题,这个有政治要求。
就这样出现了一个死循环:
产品初期需要不断的试错和验证的机会;客户没有时间和办法陪着试错和成长;没有客户,生态就更差,更没有办法进行产品的投入和迭代。
这也是在第一批国产数据库厂商出现数据库上的主要问题。
说实话总会让人不高兴,不管你同不同意,如果一个高科技企业20年都没能发展起来,一定有一些关键的内在因素制约,其实已经说明他们不可能发展起来了。
成熟产品收购,吸收再创新这个国内企业也考虑过。但出现了一房多卖。在informix上也发生了多方引进代码的故事。如果高铁是我们引进生产技术,吸收再创新的过程。
那么,数据库产品代码的引进就有点像汽车产业,引进的人很多,但是自主升级开发却很难。
Informix原来是IBM的一款数据库,2015年以来,IBM把代码授权了多家中国的公司:华胜天成、南大通用(Gbase 8t)和星瑞格。
这套代码搁置了十多年了,虽然可靠但是创新其实不足。另外一个问题有点像数字币,分叉严重。授权了的代码,大家都是可以升级开发。就连IBM自己也会开发升级。
这就会造成一个产品的碎片化和混乱。同时买下这些代码容易,消化不容易啊。
informix的主要模块的源代码就有2000多万行,Informix当年在美国的核心研发队伍就有超过200人,加上测试和周边团队,不下500人。
要快速追赶世界先进水平,研发的规模不能小于这个(读别人的代码其实比自己写代码还要累!)。
但是,目前的市场容量又不支持这样的投入。这是一个现实的困境,是不容易突破的。
无论是华胜天成、南大通用,还是星瑞格,都没有像样的、有规模的研发队伍投入到Informix的源代码掌握中。
他们对Informix的研发投入,有没有100人都是个未知数。
这次代码买断,不像高铁技术引进有铁总这样的强权统一管理,资源调度;数据库引进、消化、都是很难再复制高铁的成功案例。
2017年5月,IBM把整个Informix业务卖给了三哥(印度公司HCL)。这次不是转卖代码了,是把整个人员、办公室、客户都卖了。
(为什么没有整体卖给中国厂商,我想可能不是因为价格原因,而是美国政府背后的捣鬼。就不是卖给你全套,知道你光有代码是肯定消化不了的)。
这样,未来如果我们开发Informix有问题,就要向三哥公司求助了。
不过不能否认,我们第一代国产数据库公司还是帮助中国做到了从无到有的过程。不少涉密、政府、军队的应用,对可用度要求不高但是对保密要求不低的客户还是适用的。
不过历史看来,追赶复制,是很难超越的。
唯一弯道超车的机会,就是当环境和产业发生拐点和变化。
就像汽车行业,汽油柴油我们肯定拼不过了。但我们的机会就是互联网电动车;而数据库领域,这个机会可能发生在云计算的普及。
肆.
>>>2009-2019<<<
2009年阿里云成立。
2008年,当全球金融危机出现失控的9月,王坚被马云从微软亚洲研究院副院长的位置上挖了过来。
其实当时目的很明确:解决阿里爸爸吃饭的问题,整个算力快撑不住了。
2007年开始阿里巴巴的IT开销史无前例,一度成为IBM、Oracle中国的标杆客户,淘宝、阿里巴巴B2B和支付宝等公司,98%以上的软件系统和业务都是采用Oracle数据库提供数据服务。
2009年淘宝更是上了全球排名前几位的大RAC集群,据说当年有16个节点。每天早上CPU还是跑到98%。
换句话来说,三年几千万买Oracle产品+服务也没办法支撑阿里成长的速度,只能开启自研模式。
王坚推行的是全面去商业数据库,因此后面就有了Oracle全面转向MySQL的进程。
拆分Oracle数据库+Hadoop其实也可以撑一撑,但是这样的话,还要向Oracle购买更多的License(再花几千万,不是没钱,是即便花钱也不能彻底解决问题)。
因此,阿里巴巴B2B将中文站压力和数据容量最大的Offer数据库,成功从Oracle数据库+IBM小型机+EMC2存储设备,迁移到MySQL数据库+PC Server的模式;
以及大淘宝核心系统部门招聘到 淘宝褚霸、淘宝丁奇等能修改MySQL源码和Hbase源码的人才,让其他产品线使用MySQL数据库提供服务,也使大淘宝的MySQL DBA的经验和技术大幅提高,大淘宝也就有能力把所有产品线的Oracle数据库迁移到MySQL数据库提供服务。
淘宝2013年下线了最后一个Oracle,2014年支付宝交易替换了Oracle。2016年支付宝总账全面用OceanBase替换Oracle。
说明:如果有超强的研发团队、运维能力的情况下。在云时代还是有机会替换Oracle的。
在这次阿里去IOE的运动和历程中也出现了两个儿子,Polar DB 和OceanBase。
一个来自于阿里云体系,一个来自于蚂蚁金服。
那么让我们扒一扒,在云时代还有哪些数据库厂商:
哎呦,这次的玩家好像都有点实力啊。
多数还是互联网公司背景,要不就是硬核的科技大玩家。
PingCAP和巨杉作为创业型公司也是得到多轮次的融资,估值一个劲的往上涨。
Google Spanner是Google自己研发的数据库,并把原理写成Paper公布于众。这样也生出了两个儿子:PingCAP的TiDB和美国的CockroachDB。目前百度在和CockroachDB合作推出数据库产品。
其实基于开源产品二次开发的还有好几家。具体这种模式到底行还是不行,还真不好下结论!!!
中国目前企业级关键应用90%应该都跑在了Oracle上。这些刚需型大客户其实并不介意到底产品是纯自研,还是基于开源产品的二次开发。
自研不代表性能好,二次开发不代表安全可靠(开源核心代码都是公开的)。核心的需求还是到底能不能用?!保证我功能正常的使用,性能可靠。
目前大型客户新的外围系统,进行了一轮上面产品的尝试。每家数据库公司都在攻城占地的找客户实践POC。
单凭网上公开的资料以及舆论导向来评判到底哪一款产品会成为中国的“Oracle”,这个真的很难预测。不过其实也不用预测,最终客户的选择会做出答案。
现实是这样,如果企业客户有公有云计算厂商的系统开发和维护能力,关键系统是可以跑在国产数据库的(参考支付宝)。但是这些客户,由于很多原因又很难上公有云。
一种可能是这些厂商可以不断开发迭代产品,直到出一款产品像Oracle可以让普通企业客户也能舒适使用;
另外一个种可能就是由政府或者监管部门牵头,建造一个行业云,让这些国内一流厂商产品+服务团队一同进入,建立一个小型的行业内部公有云进行对行业提供服务。
这个行业云,找到最优秀的开发和运维供应商,统一向外服务。这样实现两个优点:
当然风险不是没有,就是如果大集中后,集中的中心出现了问题,上了行业云所有的公司系统可能会瘫痪,所以,未来越来越多的公司企业、组织会选择混合部署。
我们也看到伴随着人口红利,在软件开发领域的我国实力已今非昔比,大部分企业的 “去IOE”的进程更多的是自发的因系统架构优化而进行,同时各种数据库技术与产品也蓬勃发展,所以,在技术上看Oracle并非不能取代,更多的是出于综合成本(改造与建设成本、分享)的考量,需要的是时间和意志。
伍.
>>>2019-2029<<<
有些路都是要走一遍的,国产产品的成熟,都是需要历史特定的背景和机遇。
中国产业升级,互联网流量红利下产生的流量红利大怪兽,能不能在未来成为我们中国信息科技的中坚力量,这个我们拭目以待。
凡是一个产品的成功,一个企业的成功都有它历史的环境属性和红利属性。
没有中国互联网崛起这十年,也很难有像现在数据库2.0版本的公司出现。
注意!!!以下才是干货:
让我来历数一下过去每个十年宏观红利:
1992~1999:外资在中国的投资,衍生的产品代理、渠道、服务,一系列生意;1999~2009:中国加入WTO,对外出口和贸易一路攀升;2009-2019:天量的“铁工基”固投,房地产,以及移动互联网流量红利;
不搭上这些时代的红利,不一定不成,但大成的肯定多多少少都搭上了时代的红利高铁。那么,2019~2029,我们的超级时代红利是什么呢?
成熟市场的新技术or 新市场的成熟技术?
也许是中华Di国的新科技、新经济模式,在降维广阔市场的复制…….
附录参考文献:
1. 高屹:邓小平与1989~1993年的中美关系
2. 大风号:回首数据库发展往事。
3. 刘韧 :冯星君自主:Oracle中国往事。
4. 陈书悦:外企的江湖水也深。
5. 《中国经济周刊》2016年第17期:不使用IBM、Oracle、EMC,国产数据库能弯道超车吗?
6. 晓军dataondemand0514:国产数据库发展现状分析(本文作者冯斯基,顾问云和恩墨、戴工玖、周家晶,来源于常垒资本,IT大佬已获得作者授权、经IT大佬编辑发布,文中观点为作者观点、不代表IT大佬观点。)