数字先锋|百度马杰:希壤是百度第二成长曲线的重要尝试

2022年10月10日 16:36  

本文5489字,约8分钟

本期特邀嘉宾

马杰

百度副总裁

 

目前,对于元宇宙未来的市场规模,众说不一。摩根士丹利预测元宇宙未来市场达8万亿美元,高盛预测的这一数字是8~12万亿美元,而花旗则是13万亿美元。这个市场到底有多大?

“现在还不要看这些数字。而要通过数字看到,大家对元宇宙这件事的预期都比较大,这体现了人们对它的信心。”百度副总裁马杰认为。

人们对于元宇宙的定义也各有不同。在马杰看来,“元宇宙最有趣的部分是,它一定会与线下实体有大量结合的要素,只有做到这一点才叫元宇宙。”

马杰和他的团队2021年初发布希壤的第一个版本-7.0版时,“跟大家解释这是什么还比较费劲,但是后来发现到了年终就好办了,这就是Meta。”

对外界而言,希壤的定位是“元宇宙中的类似于‘云’的基础设施”。而对于百度,希壤是第二增长曲线智能云在产业创新层面非常重要的尝试之一。”马杰表示。

百度从2016年已经开始做 VR。元宇宙团队也是从VR一路走来,所以本身对技术研究和投入有比较长时间。再加上内部“兄弟团队”做的数字人、区块链等底层技术,还有人工智能、智能云、物联网等相关技术。“除了游戏引擎之外,好像百度过去积累的技术做Meta的底层还挺‘全乎’的。这也是给我们团队的机会,能把积累的各种技术集合起来服务合作伙伴。”马杰表示。

希壤希望合作伙伴“在我们的基础设施上发挥想象力,构造虚拟世界,打造自己的商业模式。”马杰说,“我们有信心的是可以把技术做得比较扎实,由我们的伙伴做好面向用户的服务,特别有想象力的这一侧。在数字世界里,唯一的限制就是想象力。”

就目前而言,在想象力充分实现的过程中,还需要跨越三座技术大山,即视觉、听觉和超大型交互。比如听觉,要复刻现实中特定空间的声波传导,以及墙壁、桌椅等反射而最终形成的“自然空间”状态并非易事。而且,“不是跨过‘三座山’就完事了,只是我们首先看到有三座大山,跨过去之后还有多少山,我们尚且不知道。”马杰说。

 

Q:中外各大互联网巨头都已通过不同的方式入局元宇宙。您认为元宇宙最有吸引力的要素是什么?

马杰:元宇宙最有趣的部分在于,它跟线下的实体有大量结合的要素,我觉得只有做到这一点才叫元宇宙。

元宇宙最重要的特点是虚实共生,它不能只是虚拟的,而是要跟线下打通,从最简单的传感器的打通,到一些非常复杂的交互和打通模式。在这个里面,物联网是第一站。这些年大家在物联网上所做的各种协议接入方式,就是这件事情的一个桥头堡。

元宇宙还有几个大的好处,比如它能跨越时间和空间。虽然我们也可以用现在的技术去看视频回放,但临场感还是不一样的。

元宇宙的另外一个特点就是沉浸式。我们做了陈丹青老师实体版画的元宇宙拍卖,虚拟作品的拍卖大家做过无数次了,但对实体化艺术作品的元宇宙拍卖还很少有人做。在这个过程中,我们第一次感受到:一个数字展厅,其实比二维的、传统的在线商店的感受还是要好很多。当你做了一个漂亮的数字展厅,把画挂在里面,还是会有不一样的沉浸式的感受。你知道这幅画的比例有多大,你知道它挂在墙上的样子,你知道它跟环境融合在一起之后的感觉,你就可以想象:如果这幅画我有机会抢下来,挂在家里是不是合适?所以我觉得这种感受还是挺不一样的。

未来,元宇宙在时间、空间和沉浸感上的特点是可以被放大和用好的,比如在举办会展方面,它肯定是一个有效手段。现在确实还没有做到大家理想中的那种效果,还需要一些时间去发展完善。

 

Q:您认为大约需要多长时间?

马杰:5年,是起点,但不是终点。

前几天看比尔•盖茨在95年关于互联网预见的访谈,我们看到现在已经完全变了。95年的时候互联网才刚萌芽,元宇宙现在也是萌芽状态,所以我觉得元宇宙还有很长的路要走。

互联网1.0从90年代中后期,一直到真正的蓬勃发展,走了十几年时间。移动互联网自2010年后,发展要比之前快很多,就是因为有上一代的大量基础。Web3的技术更为复杂,发展起来的时间不会很短,但是也不会更久,毕竟有很多基础。所以我们之前猜测大概需要5~7年,才会有一个合格的、能让用户体验的成果。

 

Q:希壤是一个什么样的产品?它在百度的版图中被如何定位?

马杰:我们对希壤的定位就是:它是元宇宙里类似于云这样的基础设施。我们的伙伴在我们的基础设施之上可以发挥想象力,构造虚拟世界,打造自己的商业模式。

我们有信心把底层技术做得比较扎实,由我们的伙伴做好面向用户的服务,或者特别漂亮、特别有想象力的这一侧。

元宇宙的未来特别值得期待,我们现在提供的是最基础的交互能力,但随着这些能力的拓展,设计师能想象出更有趣的方式。内容才是灵魂,我们的技术不能成为内容的限制。

在数字世界里,唯一的限制就是想象力。

百度已经做 VR好多年了,我们Meta团队也是从VR一路做过来的,本身对技术的研究和投入也有挺长时间,加上我们有别的兄弟团队在做像数字人、区块链这样的底层技术,百度自身也有人工智能、智能云、物联网等相关技术,所以除了游戏引擎之外,Meta所需要的技术,百度做的还挺全乎。这也是给我们团队的机会,能把积累的各种技术集合起来服务合作伙伴。

云计算可以算作百度的第二增长曲线,而希壤应该是我们第二增长曲线里面在产业创新层面非常重要的尝试之一。

 

Q:感觉像是房地产行业中的“地主”,大家要买你的“地”建房子,然后卖出去。

马杰:我们这些地是只租不卖的,“租金”能有多少?我们真正的伙伴最后会发现是没有“租地”这一概念的,我们收的实际上是算力和存储的费用。

 

Q:元宇宙的发展需要解决哪些关键技术?它们的“难度”有多大?

马杰:视觉、听觉和超大型交互,我们叫它三座技术大山。

实际上,不是说跨过三座山就完事了,只是我们首先就看到了有三座大山,跨过去之后还有多少山,我们尚且不知道,先把眼前的搞定。

视觉技术上,最大的问题不是做不出来,而在于如何平衡。恰恰是因为人类现在能做到,我们在动画、电影里看到的都是非常精美的画面,恨不得头发丝都看得清楚。就是现在的CG做的太牛了,所以观众对它有很高预期,而没有注意到这其中的算力区别。

电影每一帧大约需要100小时到数百小时渲染出来,我们做的VR视觉,第一不是用那么高级的GPU渲染,要在手机上或头显上,只有做到30毫秒渲染一帧,每秒才能30帧以上,这中间的算力可能有千万倍以上的差距,不可能做到类似电影的效果。所以大家心中的效果和实际效果之间的差距,其实是很大的。

另外一大难题是我们的头显不能太重,这与现在的电池技术有关;它也不能太热,这与显示设备的功耗有关。所以需要综合平衡重量、功耗、散热,最后评判它能不能戴在头上或者拿在手上。

听觉技术方面的挑战在于复杂的声音系统。声学家或数学家可以写出来房间或者大会场的声学效果公式,但实际模拟的时候,这么复杂的声音反射其实极其消耗效率,也很难用一组公式把它写清楚,或者写了也不一定能达到想要的效果。

事实上我们所处的场所从来就不是一个理想场合,这里有桌子、椅子和别的东西,它的反射是特别复杂的声音效果。大自然的鬼斧神工,我们很难特别快地把它模拟得很棒,需要用挺长时间学习和进步。

最后,第三个问题——交互。交互随着人数会膨胀,我们两个人的交互是二条讯息的传递:我给你发一条,你给我回一条,就构成了一个交互过程,我们也完成了两条讯息传递;但是如果是三个人在一个场合的时候,我发出的讯息是两个人接收,因为他也能听见我说话,这样我就同时和两个人交互。

所以当人数增加的时候,信息传递的数据量是平方倍增长的,加上还要保证每秒几十次的帧率。在虚拟世界里开10万人大会,理论上是特别合适的;但事实上,在虚拟世界里的10万人大场合听上去很美好,它的传输会变成数量,变成10万乘10万,就是100亿的传输量。

从以上就可以看出,人数带来的好处以及背后的技术挑战。

 

Q:在当下的互联网环境中,人们希望不看太多的广告,甚至愿意为不看广告而付费。未来的元宇宙广告会是什么样的生态?您有哪些展望。

马杰:世界里的信息量和广告量是由构成这个世界的各个伙伴共同组成的。如果广告过多,大家会觉得你做过了,就可能不去你这了;如果你做的特别有意思,哪怕广告多大家也觉得有趣。

最后会自然形成平衡,大家会探索应该多加广告还是减少广告,但最终完全由用户驱动、以服务好用户为目的,而不是简单地把广告数量加上去。大家需要提升的是广告的接受度或转化度。

 

Q:有没有用户抱怨现在的希壤APP太“重”了,下载之前要把几个其它的APP删除后才有手机空间?您和团队怎样看待这一的问题?

马杰:大家对我们有期待,所以才有要求,所以我们一方面很兴奋,一方面也比较诚惶诚恐地想要做好这件事情。

去年年初发的第一个版本是-7.0,当时还没有元宇宙赛道特别明确的提法。到了去年年终,元宇宙的提法和这一赛道一下子火了,我们当时还有点紧张,觉得这事火的稍微早了点。我心里想的是:应该再晚几年,元宇宙的技术才能成熟到可以真正交付给用户。

未来,评价APP的“轻重”,一是需要看事情的轻重程度。如果会议是在三亚开,虽然我很开心飞到三亚去参加,但是毕竟还是要飞三个多小时,还要留出2~3天时间订酒店等等。而我们提供了在线参会的方式,虽然现在得先删几个APP,但在计算机领域,容量是不值钱的,在30年前我买电脑的时候,咬咬牙买了一个540兆的硬盘,不咬牙可能买的就是一两百兆的硬盘。现在几个T的硬盘比当年540兆的硬盘便宜多了。

从这里就能看出来,存储是进步很快的技术领域。我们每一代手机的容量都在飞速上涨,这样我们也有动力换下一台手机。所以存储量不是问题,只是一件新事物刚出来的时候,你总会觉得它有点不方便、有点大。我们最早看高清电影的时候都觉得“天哪!看一部电影我不就破产了?”但是运营商很快就把流量价格降下来了,影视长视频的服务平台也都包会员了,所以流量存储可以留给技术和平台解决。只是因为希壤现在走在稍微超前一点点,就觉得好像挺大。当然,我们也会积极地让它变得更小一些,给我们点时间服务好大家。

 

Q:百度希壤是从什么时候开始布局的?当时出于哪些方面的洞察和思考?为什么是现在,而不是5年后更“令人满意”的时候再推出?

马杰:我觉得很多厂商因为 VR技术相对成熟,加上在疫情期间感到很多不便,还有现在各方面的技术,云计算、区块链等都在快速成熟,所以大家可能不约而同的想到这一方向。只是当时每个人的切入点不同,也没有找到一个共同的名词去描绘它。去年年初我们在发-7.0版的时候,跟大家解释“这是什么”还比较费劲,到了年终就好办了,原来这就是Meta。

“希壤”是来自山海经传说中的一块神奇土壤,原本是“休息”的“息”,它是能够无限生长的一块土壤。息壤最早也是女娲补天的原材料,另外大禹治水最初曾经还尝试用息壤把水堵住。但是我们把“息”字换成了“希望”的“希”,延续了传统故事里面的美好寓意,同时也希望它是更有希望的一块土地。

 

Q:您也是百度安全业务的负责人,其实在元宇宙的发展过程中,人们也非常关注,或者说有些担忧网络安全问题。对此您怎么看?

马杰:这几年随着大家对网络安全的普遍关注,大家提出了很多问题,而且是很多非常好的问题,我们是怕提不出一个正确的问题,解决问题从来都不是事儿。

更复杂的是,大家现在可能有一种感受,现在好像还没有以前安全。其实客观的讲,现在各个系统的安全性做的比以前好非常多。大家有这种感受是因为我们的数字化生存的广度和深度极大加强了。以前我没有这么依赖它,所以没有什么重要的数据;以前我们也不是所有的生活和工作都跟它关联,所以出个事我们觉得无所谓。

现在这种关联度加深,它的使用面和使用程度变大了,所以我们面临的总问题量在上升,但是我们面临的问题比例其实一直在下降。所有的公司都在很积极的解决问题,也切实看到这些系统中存在的问题比例跟以前相比极大的下降了,已经越做越完善了。

每一项新技术的引入都一定会同步引入新风险,所以我们在看到大家努力的同时不能放松警惕,意识永远是安全里面最重要的第一环节。我们意识到它有风险,我们重视它,那么我们就可以把它解决好。元宇宙也一定会引入很多新的安全问题,我们可能都没有想到的安全问题,但是我们早一点往前走,就可以提前做研究和解决。

 

Q:高盛、麦肯锡、IDC等众多机构都对元宇宙的未来经济规模做出了预判。有的认为是5万亿美元,有的认为是8万亿美元。您更倾向于哪个数字范围?为什么?

马杰:我觉得现在不要看这些数字,而要通过数字看到:

第一,不管是几千亿还是上万亿,我们从中看到了一种期待。第二,在期待中,不论是哪个数字都不小,所以是很大的期待值,可以看到人们对它的信心。

 

策划:于慧媛  编辑:康路  摄制:张守斌

(实习生王悦对本文亦有贡献)