说起人工智能为何学术界认为人工智能三起两落六十多岁了,而产业界认为也就十岁左右?
为何炒的火热5G的市场规模仅有云和数据中心的一半?
为何说元宇宙是下一代互联网?
……
科技产业未来发展风向吹到何方?
人工智能、大数据还是元宇宙?
日前
【边界】共创共生共赢的圈层活动现场
中国信息通信研究院云计算与大数据研究所所长何宝宏
针对“探寻产业未来 照亮发展之路”为主题
探讨了大数据、人工智能、元宇宙等等话题
既有技术角度的思考,亦有市场落地维度的意见参考
(注:下方观点均根据现场实录整理)
01
人工智能的问题,从学术到应用
“人工智能被列入新基建的一部分,新型基础设施或者说新一代数字技术一系列,你会看到其他的技术基本年龄在十岁左右,大概是初中生的一个年龄状态,但只有人工智能它六十多岁,该退休了。
前几年,我们要人工智能会让放射科医生做试验,最后导致的结果就是全世界都短缺放射科医生。因为大家一看人工智能能替代,没人学了,结果导致反方向问题的一些出现。另外学界的影响应该最大,这个是跟所有的新一代数字计划里面有重大的区别,学术界对人工智能影响是最大的。
像云计算、大数据,还有一些技术学界影响很小,坦白的讲是产业链在拉着学术界往前走,学术界是个跟随者,但是人工智能不一样,人工智能是一个算法突破带来的新的一轮革命,当然有算力,根本上还有个算法,算法不突破,再强的算力,再多数据也没用,所以学界影响非常大。那么就引发一个问题,就是人工智能三起两落,其实这是两个说法。学术界认为人工智能三起两落,而产业界认为就来了一把,前两次没成功,所以这就是为什么人工智能会六十多岁了还在这活着的原因,学术界认为六十多岁了,产业界认为也就十岁左右,2012年,2014年开始取得突破,也就十岁左右,所以这是个根本,所以在做人工智能时候特别区分,讲这个人是来自学界还是来自产业界,他给出的结论是不一样的。
走到今天,人工智能全球增长的速度大概百分之十几,比较平稳。这个速度,我们国家人工智能增速是低于我们的云计算、大数据等其他行业增速的,而且低了一半,我们云其他的新一代数据技术的增速大概是百分之二十到三十,人工智能是百分之十几,这是一个很明显的现象。我们几年前说人工智能什么数据算法算力,实际上根据我们的研究,现在我们在业界的关注点七年之后发生了很大的一个变化。我们现在关注的当然有技术的一些创新,都在做什么样技术创新。第二个是工程,这是其他的技术里面都没有的一个现象,就是因为学界影响太大,所以我们今天必须把学术的问题转化成一个产业界工程界的问题,所以要谈人工智能工程化问题,不会去谈云计算的工程化问题,我们也不谈大数据的工程,因为有些算法太像学术了,所以我们必须做工程化一些的工作。
我们去年也联合业界国内企业,发起AI工程化的一个组织专门来做这个事情,我们必须把它工程化,否则这事没法做,安全可信的问题、科技伦理问题、涉及很多算法。这是技术发展的自然现象,我原来总结把它叫做七年之痒,技术讲七年的时候必须换一个故事讲,或者换个重点讲,这是自然而然的。2014年、2021年,所有的技术都会在七年左右发生变化,故事一定要重新讲,这是自然而然的事情,而且前五年你要谈这个技术多么美好,从第六年开始这个技术好像会带来很多安全问题、隐私保护问题、可靠性的问题,这是不会有错的。
像元宇宙一开始谈安全可靠谈错了,一开始要谈我们能干啥,我觉得弄错次序了,这个也不是说你想什么时候谈,要看准时间点,那么技术创新方面主要就是大模型的问题。
大模型这几年特别火,学术界、产业界都有,这个准确性是提高很多,但是太贵了,不可大规模推广应用,所以我们还有暴力美学的问题。学术界希望做一些,但没钱,产业侧说我可以做一些,当然这就会导致这个技术只能在特定领域特定场景下用,没办法大规模普及推广,成本太高。
本质上来说很难认为这是人工智能这几年算法技术的突破,只能是说资源叠加产生的效果,这个趋势跟计算机的趋势是一模一样的,就必然有一部分计算会转向HPC,转向高性能,必然有一部分人工智能会转向这,但是只能让一小部分人工智能转向这个方向,不能让所有人工智能转向方向,这是不科学的,但是我们没有找到新的方向。我们有一个方向,但是缺其他方向,这是很明显的,缺其他可普及的方向,后面在哪我也不知道,反正基本上是一个改良性的。
从项目化到工程化,这两年我们的观察是非常清晰的,以前做人工智能企业主要落地是项目,现在做项目永远会把自己慢慢做死,所以慢慢要转向平台化、工业化、标准化、模块化,要做成一些产品,这个非常明显。原来我们是做一个个项目,现在把它横着能不能打通一下,很多机构也在做类似的事情,我们也在做如何把它产业化,要不然永远停留在学术上,永远参加竞赛的成绩很好,回来以后就不好使了,因为竞赛只是学术的想法,回来用是工业界的想法,它俩套不上。
还有一个要特别注意,人工智能用于科学发现创造这几年非常火,切实取得很多突破。但这在我们国内实在是太少了,或者说我都没看到,就是将人工智能技术用于科学发现、科学探索。现在基本上将人工智能用于量化交易、人脸识别安防等,我们国家干这活比较多一点,用户画像,明显就是短频快。
科学杂志2021年十大科学发现,排第一位的是人工智能预测蛋白质结构、分析蛋白质结构,这是非常大的一个突破,因为整个蛋白质结构预测是靠阿尔法来解决这个问题的。然后MAT刚刚公布的2022年的全球十大突破性技术,这里面很多东西,有一个人工智能相关的,就是我们是不是用生物识别活体检测慢慢替代我们的密码的问题,因为我们用户名口令这个东西太土了,用了那么多年我们能不能替代掉。
另外就是人工智能这两年带来很大的社会问题:伪造问题。深度伪造问题现在变得非常的突出,因为人工智能如果反向使用它就是伪造,现在我们网上通过人工智能伪造的音视频,每六个月翻一倍。
最近俄乌战争期间不断就有伪造的,伪造的视频层出不穷,这就是因为人工智能的一些进步,当然打仗会用很多。那么这块给我们社会带来巨大的挑战就是,数字经济、数字社会拿什么来当证据,拿什么当值得信任的数据,这个问题就变得非常突出。区块链是在解决问题的办法之一,但是这块问题显然光靠区块链搞不定。而且这个问题越来越突出,你连一个数据都不相信,剩下事情一切都不可信。
人工智能这几年的进入城市,我们原来只是个学习魔法,现在可以创造,可以自己生成一些新的内容,新的东西等等,甚至一些新闻等等,这块也是非常大。机器生成的新的新闻、视频、图片真的还是假的?算不算数?现在中性的词叫深度合成,深度合成和深度伪造是一步之遥,技术上是一模一样的,完全就是看法律和道德问题。中央刚推的关于科技伦理的问题政策文件,这块变得非常突出,但这块空间变得非常大。我们来到一个零信任的时代,一切东西都不值得信任,但是我又不得不依靠数字世界,数字这些东西。”
02
新型基础设施–数据中心与云
“新基建实际一直在路上,不是两年前中央提的时候我们才搞新基建。比如互联网二十多年一直致力讲通信基础,讲设施的通用化。通信一直就是国家关键的基础设施,但互联网是专用的,计算机是计算机的,广播电视是广播电视的,所以我们前些年有个“三网融合”的词,现在这个词消失了。消失是因为这活干完了,我们都融于互联网,所以将通信通用化啥都能干,出现通用化的通信基础设施,这是个很了不起的东西。紧接着我们将计算基础设施化,就是这几年云计算数字中心在干的活,计算也要基础设施化,也要服务化。网络算力服务端现在这些年一直在炒,所以这是个算力的基础设施化的过程,云和数据中心在干这个活。算力的基础设施化一定要比通用设施化要晚,这是可以肯定的事情,因为所有基础设施化都必须基于网络,所以算力要搞基础设施一定是晚于通信的,而且一定要有个强大的通信基础设施支持,才可能做算力的基础设施化。有了计算基础设施化,有了通信,基于它上面所有数字化的东西都可能变成基础设施。整个计算和通信是核心,是两个支柱,有了它后面都可以基础设施化,所以中央会提人工智能工业互联网等等。区块链的基础设施化就是在讲这个,实际上就是因为这个活干差不多了就该提这个事了,这是个次序问题,不能算。
那么云和数字中心的基础设施市场规模有多大呢?我们经常会发布一些报告,你就看最核心这一块,十四五期间5G大概是1.25万亿,公有云加数据中心大概是2.45万亿,大整整一倍。所以5G虽然炒的热,实际上它的市场规模只有云加数据中心的一半,要注意这是我们发布的数据,理论上来说5G要偏大一点,实际上就是这样,清晰的表明这块空间有多大。当然还有周围的一些没法算,基本靠谱就可以了。数据中心这两年非常的火,尤其是两年前在中央政治局3月份会议第一次将数据中心纳入新基建的时候。数据中心我把它叫做传统基建中搞新基建的,新基建里搞传统基建。就像房地产,又像互联网,因为它底下是风火水电,但数据中心它是技术密集型的、资本密集型、也是能耗密集型,这三个都已经有了。原来这几个都不重要,现在这三个都变得越来越重要。就能耗指标的问题,很多时候卡的非常严,资本和需求量非常大,所以好多人都做这东西。实际上它现在也变成技术密集型了,数据中心原来叫机房,我原来一直在游说各个政府领导的时候,很多领导就说“数据中心是个机房,机房有什么技术含量,你还把它称为高科技”,我说“你被上学时候的导师误导了,你以为导师那个机房那么烂,数据中心也这么烂吗?不是这么回事,数据中心真的是个高科技”。
我简单提一下它为什么空间很大,左边是市场全球的规模,实际上数据中心技术十年来发生了非常大的变化。原来数据中心的技术基本上我把它叫做拿来主义。计算机有什么,通信有什么,供配电有什么,智能有什么,直接拿直接用。为什么?因为太小了,谁会给你干这活。而今天数据中心的这些技术都是定制的,体量大,因为流量都会聚到数据中心,流量非常大,所以定制就是创新。
我们国家数据中心的市场,实际上是这几年以近百分之三十的速度在增长。核心产业2021年大概是2000亿的一个市场规模,当然今年热炒的是东数西算。很多人问东数西算到底在干什么,其实工信部在去年就出台相关文件,就是我们究竟要达到什么目标,提了量化指标。时间延迟降低问题,就两个城市之间,两个枢纽节点逐渐数据中心的延迟时间降低问题。我刚才讲数据中心就是计算机这个标题,数据肯定是计算机,是个大号的计算机,数据中心跟计算机的区别也很简单,人在里面的叫计算中心,人在外面叫计算机,数据中心必须要联网,这是个毫无疑问的事情。但是两个城市之间,我们测试的结果基本上两个城市之间的,两个数据中心时间在六十毫秒以上,所以现在要求降到二十毫秒,理论上二十毫秒完全可以做到,本质上跳数太多了,就说我们两个之间羊肠小道卡口太多,没有直接通,包括一些PUE的算力等等,是有指标和要求的。
还有一个数据中心相关的热点,就是液体制冷的问题。液冷实际上这几年发展是非常快的,关注度越来越高,从技术上来说已经成熟了,主要是生态的问题,价格下不来,规模还没上去,怎么做运营,怎么证明它的安全性等等。从任何产业来说这些问题的提出,就表明这个事情已经可以做了,这块关注度非常高,包括一些大的互联网公司已经纷纷在试点了,因为计算的密度太高了,用风吹已经不行了。大概在2017年的时候我召集国内一些企业讨论关于数据中心的液冷问题,制冷问题的时候,来了十几个专家,有几家公司特别感兴趣;到去年我们讨论液冷会有将近两百个专家会参加我们液冷的标准化的研究和制定工作,有几十家企业参与。从参会的人数的明显变化你就感觉到并且能统计出来什么在变热,这是非常简单的采样方法。这块高度,它带来的不仅仅是一个液体制冷问题,它会带来我们整个数据中心服务器芯片一些很多架构的设计和调整问题,因为散发突然变成液体,很多设计就变了。但计算密度确实越来越高,还有一个是故障率会降低很多,密度会提升很多,因为风冷的时候会很容易引发固燃,空气会振动,而液冷没这个问题。
还有数据中心谈算力网络的问题,我们梳理了一下,不同时代影响制约算力的瓶颈点是不一样的。在上世纪八十年代主要是CPU不行;九十年代时候用户的接入网络不行,接入宽带不行;两千年以后是存储设备不行,到现在核心问题变成数据中心的网络了。
十年前数据中心的网络对整个算力的时间影响大概是百分之六左右,现在已经上升到百分之六十,整个算力的时间,数据中心的时间,网络的时间已经对它由百分之六上升到百分之六十,所以网络成了瓶颈。为什么网络成瓶颈,因为过去的十年网络的能力提升了大概十倍,存储的能力提升了一万倍,计算的量也提高了很多,反正听起来提高了十倍,实际上你太慢,这是个相对的问题。还有搞元宇宙的,要搞成真正的沉浸式模拟,算力要求太大。我跟其他专家讨论大概是多少倍,结果是支持这个需要今天算力一百万倍,所以做不到,坦率的说一下两下做不到一百万倍。
再往上就是云了,云的市场每年也是我们国内比国际高每年三十多。我们说疫情拉动了数字化转型的步伐,确实是在我们的统计中。2020年云计算的市场明显往上走大概是2000亿。2020年,反正十四五末大概是1万亿的一个体量。云今天也是继续往上走,原来谈云的时候实际上是以资源为中心,如何管理调度与虚拟化,管理和调度一些资源等等。现在再谈云,就是土生土长的云上一些应用问题,底层的技术相对来说已经稳定下来。稳定下来要搞什么,搞基建,你不稳定下来怎么搞大规模基建,你不能搞技术搞一半,技术变了,所以搞基建是因为这个技术已经成熟稳定下来,所以云的这块底层技术不可能有大的变化。我个人判断这块不会有大的颠覆性创新了,不是智慧不够,是不允许你变,就你带来一些改良性的优点的话没人允许的,所以云也陷入这个状态了。那么底下做云的人在做什么?根据我们的统计,底下的人在做优化。云走到今天很多时候其实没有做优化,甚至有很多企业用了云计算而成本上升了,所以很多人在优化。我们做网络的知道有个网优,做网络要不断的优化和调整,云也一样要,我把它起个名叫云优,逻辑是一样的,在我们统计中也能清楚的看到资源的浪费问题。云延伸,我们原来的云上应用是迁移过来的,迁移过来后能够发挥云的一部分作用,但是很难发挥它全部作用,就说效果不好的重要原因是你是移民来的,不适应这个新的环境,所以我们需要原生的,从一个应用的开始就要,假设底层的基础设施是云,从需求设计开发测试都在云端,所以我们叫云延伸。根据我们的统计,容器微服等等已经非常的多了,容器已经很成熟了,已经越来越多进入核心业务系统了,微服务的话可用架构号称有54.8%,这是我们统计的,这个数据明显是偏高的,因为每个企业稍微试一下就会说我用了微服了,谁都愿意吹牛是吧,所以这个数据肯定是偏高的。就像国外说我们云的超过60%的市场普及度,真正一看连30%都不到,这个也一样,当然一开始吹一吹是有道理的,鼓舞信心,鼓舞自信,要不然你一开始就不行,后面往下降,做优化。
逻辑是一样的,任何一个新型基础设施出现之后,肯定是分两步走的,第一步迁移,把老的拿过来;第二自己根据这个新环境能不能创造出一些新的物种来,互联网当年也这样走过来的。还记得我们二十多年前,互联网应用基本上是从其他网络上迁移来的,最著名就是IP电话,IPTV,还有雅虎那一套东西。今年的互联网原生电话,就我们经常能用的是微信电话,跟当年的电话完全不一样了,当一个新的基础设施出现之后,你肯定要想如何充分发挥新的基础设施的价值,其实云今天走到这一块估值最高的已经不是云的基础设施服务,而是如何能够充分的利用好多云混合制的场景。做音乐的,如何把底层的资源能够用好;做数据库的,假设底下是个多云的场景,多云的环境如何用好。做其他的也一样的,就怎么把底层资源用好,这变成了一个核心的问题,资源就是资源,你不会用还是不会用。”
03
元宇宙的乌托邦
“元宇宙是下一代互联网。其实在我研究互联网历史,自互联网商用之后的三十年里,每隔几年都会出现一个叫下一代互联网,每次还都不一样,每次都是一拨一拨的,所以我们现在说元宇宙是下一代互联网,前几年说区块链是下一代互联网,再往前我们说移动互联网,倒推的话都是这样。说元宇宙是下一代互联网有可能,但是说互联网尽头是元宇宙那是绝对不可能的,要不元宇宙失败,要不然就是互联网成了元宇宙的一部分,这个理论上来说不可能。
因为如果用VR理论上不可能,光有VR是不可以的,咱们在座有企业,光有VR显然不会是尽头,它还仍然是一个过程。这个整体思路我觉得是没有问题的,因为我们人类总是有创世情节的,一代一代人都是这样。我们原来搞创世过程是你的来世会是什么样子的,现在编来世故事都没人信了,只好说你这个数字的世界会是什么样子的,数字化的现世会长什么样,所以都会给出这样的算法,我把它认为是个数字版的创世。还有人说元宇宙是科幻小说的,这是不对的,我们国内措词很明显出现这个问题,元宇宙这个词是这个小说创造的,不是元宇宙的思想元宇宙的概念从这来的,这是两个事,这是思想和概念早已有之,古已有之,而且很多很多。你去看严谨的文献都是这么说的,这个词起源于这,而不是元宇宙起源于这,这是两个概念一定要区分。
任何一个大的思想概念都是找不到明确起源的,老是想找明确,这不可能的。技术没有起跑线,它是个持续演进的过程,你所看的起跑线只是你看到它那一刻,不是真的起跑线,你再往前一秒还有,再往前还有。我们孩子教育时候不能输在起跑线上,你突然发现起跑线一直往前在移是吧,一直在往前推,不知道推哪去,心里推到你必须是富二代才行,你这起跑线是起源你爸,原来说的是你小学幼儿园,你的胎教,没生的时候,现在不行,胎教都不行,所以起跑线你怎么说都行。
这个确实符合人的一代一代历史背景的,我们有精神世界,有物质世界,现在出了数字世界,新冠疫情把人都憋疯了,肯定会想出一些稀奇古怪问题,经济衰退问题、财经问题、货币问题,我们现在急需一个故事,尤其投资人、产业界急需一个故事,如果讲不好这个故事就要裁员了。因为我们实际上是靠着一代一代新的故事支撑着我们这个行业往前走的,如果没有靠谱的故事我们面临的必然是大规模裁员,这是没有办法的事情,这不以任何人、任何企业的意志为转移的。
走到今天你会发现元宇宙两个理念,一个是狭义的,一个是广义的,如果你去看百科里的狭义就是聚焦社交连接的3D虚拟世界,就是一个类似于游戏性质的3D方式的一个游戏世界,具有社交能力,这叫元宇宙。在我看来,元宇宙很重要的一块是需要加入经济效应的一些东西,技术性一些东西,一个是身份问题,今天互联网设计很大一个问题就是没有设计ID,这是一个早年设计互联网很大缺陷,后面补上去,现在人的设备身份ID补的乱七八糟,导致很多问题的出现。当然数字人什么都算,还有交互,人跟虚拟世界的交互问题,通过VR其他一些交互,脑机都有可能,还有一些平台,还有经济问题,基于区块链的经济问题。VR现在在我看至少这一代VR是扛不起元宇宙这个大旗的,我很直白的表达我的个人观点,除了分辨率,除了眩晕。我举个简单的重量问题,达不到今天的眼镜的重量,我们不可能长时间戴这样一个眼镜,现在重量基本上十到二十倍,售价大概三百美元到两千美元一个量级。所以不仅是成本,首先得把重量降下来,扛不住,剩下我觉得都是次要,现在重量太沉了。我们就是要做元宇宙的话也要发展下一代的VR、AR,而不是现在这样一种模式,因为VR、AR现在目的主要还停留在视觉和听觉方面,我们要沉浸式的还有很多,还有其他几个感觉,就是视觉和听觉还是不足,这两个本身也有很多技术要值得进步的地方。
另外就元宇宙相关,经济体系的问题,在我看如果元宇宙没有自己的一套经济体系的话,这故事就变得太小了,不足以撑起这么庞大的一个故事,所以一定要带,不带的话就回退到VR、AR了。我个人的一些想法,我把它叫做数字原生的经济体系,我们今天谈数字经济,更多的是把传统经济数字化,或者叫迁移到数字时代,我刚才用云计算来说,我们需要原生的体系,所以什么叫数字原生的经济体系,就是它可以自循环,我从一个数字化内容,从生产、消费、流通、交易、消耗全可以在这个系统里完成,而不需要出来,我就认为可以称为元宇宙的数字原生的一套经济,就这套经济体系可以脱离我们现实云,可以自循环,那你说现实世界怎么样,现实世界在交互。我去跟领导汇报说我们最大的机会应该在数字原生那套经济体系,他说吃喝拉撒怎么办,我说工业时代,搞工业的人也要去搞农业人去做交互,搞数字经济的人为什么非要去生产粮食,我的也有价值你也有,咱们交换,你不能强求一个数字时代,数字经济这一套东西啥都干,这不现实。需要一部分是赋能于实体经济的,一部分就是自己原生的,在我看来这部分空间很大,所以我们叫乡村中国,后来是城市中国,现在叫数字中国,大概就这个意思,要不断往前走。”
更多现场观点,请锁定中关村壹号服务下期微信!
如若转载,请注明出处:https://www.daxuejiayuan.com/23508.html