中科大教授陆朝阳:高斯玻色采样是重要发展方向 为量子科学打基础

日期:01-12
量子量子计算

新浪科技讯 1月12日上午消息,由新浪财经客户端、新浪科技联合主办的“2020科技风云榜”今日开幕,今年活动主题为“万物再生长”。中国科学技术大学教授陆朝阳在主题演讲中围绕量子计算科学话题进行分享。

陆朝阳首先简单介绍了量子基本概念,他表示量子是组成物质和能量的一个最基本的单位。量子力学中最重要的性质是它允许一个物体可以同时处于多种状态。随着多年来科学家的工作,可以说量子计算理论方面基本上框架已经建立好。但是当今科学前沿的一个最重大的挑战之一就是“怎么样在实验上和在物理上把一个量子计算机相关硬件给造出来”。

陆朝阳表示,一个很悲观或者过于乐观的情绪,对一个领域的发展都可能是不利的。例如人工智能领域就经历了很多过高或过低的预期,以及随之所带来的寒冬。所以为了让量子计算领域能够有一个比较健康的发展,我们既没有太高的期望,也没有太悲观的预期。

“我们在规划一些国家项目的时候,就希望提出一个“分步走、沿途下蛋”的策略。把领域的发展设置了三个里程碑,从简单到容易,一个一个能实现,然后再可以基于这个实现,看看再增加多少投资。”

陆朝阳总结称,高斯玻色采样在图论、机器学习、量子化学等领域有很多潜在的应用,是后续发展的重要方向。“我们希望可能在2021年,在一些很小规模的问题上做一些初步的演示,也为最终迈向可应用、可实用以及通用的量子计算打下相关科学和技术的基础。”

今年是新浪“科技风云榜”的第八年,欢迎持续关注。与中国工程院院士邬贺铨,携程集团CEO孙洁,华为消费者BG软件部总裁,愉悦资本创始及执行合伙人刘二海等一起复盘变革,展望新生。(李诗韵)

以下为演讲全文:

当今科学前沿的一个最重大的挑战之一就是怎样在实验上、物理上把量子计算机的硬件给造出来,这将是一个非常大的挑战。

陆朝阳:大家好,很高兴有这个机会跟大家汇报一下量子计算目前的一些发展的情况。

首先,说到量子计算,我们第一个要问的问题是“什么是量子”。量子其实是一种物理上的概念,比如说屏幕上我们现在看到这么一个斜坡,从数学上,我们可以把它认为是无限光滑的,不管你拿一个放大镜来看,看得多么仔细,它都是光滑的。量子是一个什么概念呢?我们认为我们把这个自然界细分的话,它不再是光滑的,它是连续的。比如说这个斜坡,如果我分得足够细,我就会发现它是像我们的台阶一样的这么一种离散的,你可以站在第一个台阶、第二个台阶,但是没有1.5个台阶,这中间是不能站的,这个叫做“量子”的概念。

量子是组成我们物质和能量的一个最基本的单位,比如说我们看到光或者是电磁波,光的最小的单位叫做光子,组成我们物质的一个最基本的单位是原子和分子,我们只能说一个一个的原子,不能说1.5个、1.3个原子。所以,它就是这么一个最基本的不可分的单位。

对于原子比纳米还小十倍,10的负10次方米这么一个尺度空间里面,也就是我们经常说的微观世界。在微观世界里它会有什么样新的运动规律呢?我们先用一个游戏来说明一下量子世界和经典世界是怎么样不一样的。

在大家所熟悉的经典世界,我们来玩一个游戏,比如说叫做“保龄球游戏”。我们把这个保龄球,中间我设了三个木板(障碍物),保龄球只能从中间的狭缝过去,最后大家可以预见到肯定是这么一个情况,分别跟这两个狭缝对应的这个直线,在这个屏幕上就会有保龄球撞击的痕迹。我现在把这个保龄球给缩小,缩小成只有一个原子大小或者只有一个电子大小,然后我重新来玩这个游戏,那我会看到一个什么样新的情况呢?我把这个狭缝也缩小,大概我们玩了几百次之后,我们会发现看到了一个跟刚才完全不一样的现象,就是它不再是两个条纹,它会出现很多个干涉条纹,而且最中间是出现干涉的条纹最多的地方。所以,我们就看到了经典世界这两个非常鲜明的不同的一个对比,经典世界是两个条纹,量子世界是多条条纹。

为什么会出现量子保龄球这么一个现象呢?量子力学里面它一个最重要的性质是它允许一个物体可以同时处于多种状态。比如说在这个游戏里面,量子的保龄球是从红色和蓝色这条线一起过去的,就像我们经常讲的波一样,它可以让这个物体可以同时过去。假设这个可以扩展到我们人,我可以同时在上海,又可以在北京出现。比如说一个光,光都有偏振,可以水平,也可以垂直,同时又可以水平+垂直同时存在,正45度,这么一个性质。

我们知道我们用来做计算的基本单元0和1就是通过不同的物体的状态来编码,比如说我们电压的0伏和5伏,我们开关的开和关。所以,在我们的经典世界里,比如我们用的笔记本、手机,我们用的一个最基本的计算单元比特,我们都很熟悉,它只能是0伏或者是5伏。所以当有两个比特的时候,这个寄存器它将会处于四种状态其中的一个,00、01、10或者是11。但是我们刚刚看到了,在我们的例子里面,对于一个量子保龄球,红色和蓝色两种状态可以一起存在。假设说红色用它编码作为0,蓝色编码作为1的话,其实0和1在这个寄存器里面是一起存在的。这样的话,如果我有两个量子比特的话,我就有00、01、10、11四种状态存在了,如果有三个(量子比特)的话有8种状态,如果我有50个,就有2的50次方个状态同时存在,2的50次方是一个非常大的数字,一张A4纸假设是0.1毫米,把它对折50次之后,0.1毫米乘以2的50次方是超过地球到太阳的距离。所以,我一旦把同时存在这么多状态的一个寄存器,经过一个函数之后,我就可以同时算出很多个数值,当然通过适当的量子算法,我就可以得到一个指数级的变形计算的一个加速的能力。

我们刚刚说的这个原理,其实科学家早就发现了,1981年的时候,Feynman第一次提出了量子计算的概念,之后Deutsch在1985年也建立好了量子图灵机的这么一个理论框架。之后Shor分别在1994年和1995年提出大数分解算法,可以威胁到我们现在的密码系统以及提出了量子纠错,怎么在物理上可以让我们建立一个量子计算机。

所以,随着这些科学家的工作,应该说量子计算理论方面基本上这个框架已经建立好了。

当今科学前沿的一个最重大的挑战之一就是怎么样在实验上、在物理上把一个量子计算机这个硬件给造出来,这是一个非常大的挑战。为什么说它是一个很大的挑战呢?我们举一个例子。

2000年的时候,两位非常著名的科学家Charles H.Bennett、David DiVincenzo在《Nature》上写了一个综述,在这个综述文章里,他们回忆了1995年的时候,当时五年之前的时候,他们开了一个国际会议,因为1995年的时候,正好是Shor提出大数分解算法的第二年,当时Shor在会议上设置了一个赌局,说一个500位的大数,是先用一个量子的机器还是先用一个经典的机器把它给分解掉。我们知道因为经典的机器最快的算法也需要几百万年、几千万年,很多科学家都认为量子计算机会先把它给分解掉。当时认为建造一个量子计算机的难度如此之大,但是有不少的科学家非常悲观,他们会打第三个赌,他们会认为太阳会先燃烧干净,到那个时候量子计算机都造不出来。他们的文章里面最后也说了,其实随着时间的发展,科学家乐观的程度不断地在改进。

我们知道一个很悲观的情绪对一个领域的发展可能是不利的,但是一个过于乐观的估计以及由此产生的不切实际的一些期望,也是不利的。我们经常说看历史可以给我们带来很多启发,其实我们可以看到在人工智能这个领域,我们也可以看到这个领域已经经历了很多过高、过低的预期,以及随之所带来的寒冬,经过了多次的高潮和低谷。

我引用一下美国国家量子专项发起人之一Jake Taylor的一个相关的报告,大家都知道,这是一个很典型的新兴量子技术所不可避免的经过的泡沫曲线。目前大家认为量子计算正处于这个泡沫的上升期,Y轴是我们普通民众所认为的很快就有的一个市场的产值。泡沫曲线的存在说明如果我们没有一个很好的引导或者是管控,最终我们会沿着这条红线走。这个泡沫曲线的存在,目标是要让我们远期的曲线能够符合,这是我们能够做到的一个最好的结果。因为前期过高的期望本身肯定是达不到的。如果没有很好地管控,我们看到的是这么一条红色的曲线,因为太过于起伏,整个领域也没有做到很好,最终也达不到我们最开始的预期。如果有一个很好的管控,前期肯定也是达不到的,在后期能够很好地接上。

为了让量子计算的领域能够有一个比较健康的发展,既没有太高的期望,也没有太悲观的预期。所以,我们在规划一些国家项目的时候,我们就希望提出一个“分步走”、“沿途下蛋”的策略。我们把这个领域的发展设置了三个里程碑,从简单到容易,一个一个能实现,然后再可以基于这个实现,看看再增加多少投资。

从这个算法提出来之后,接近40年,我们都处于这个灰色区。我们做了很多事情,其实都可以用经典计算机把它给重现或者模拟。走入这个区域之后,我们第一个要做到的是量子计算优越性的展示,大概需要50—100个物理比特,精度要求非常高。这里主要有两个算法,一个是玻色取样,一个是随机线路取样,这两个都可以归结为同一个大的问题,就是量子采样问题,从某个概率分布抽取样本的过程,主要目的是通过少量的关键样本来高效获取整体分布的关键信息。分别是由中国科大和Google两个团队,分别沿着这两条路线开展的。这是第一步,需要50—100个物理比特。

在这个基础上我们展示了我们有这个能力来操作这个量子系统之后,我们就会寻求一些实际上有应用价值的问题,比如优化问题、量子化学、机器学习……这样一些问题,我们预计在未来五年左右,我们能够达到数百到数千个物理比特,差不多精度能做到99.9%以上,我们就可以做一些实用的量子模拟。最终也是最难的一步是要实现一个通用的量子计算机,这就意味着我们要大规模地扩展,我们需要发展纠错和容错的技术,大概需要几千万个物理比特,我们可以做大数分解等等相关的事情,当然这一步我们认为是最难的,也是最难去预期、预测,也许需要15年,也许需要20年,也许需要更长的时间才能完成。

三步走的里程碑,第一步在2019年10月23日,Google在《Nature》上发表了一篇非常重要的文章,他们构建了一个53个比特的超大量子比特系统,叫“悬铃木”。在他们的文章里,他们估计可以在悬铃木里200秒所采用的样本,在当时的超算方面大概需要1万年。当然IBM随即挑战,认为经典计算机的耗时可以缩短到2.5天。我们小组也进一步提出来,其实他们这个工作里存在着一个“样本数量依赖”的漏洞。

(前面)我讲得可能比较学术,下面我们就用周星驰的一个电影比较形象的给大家说一下量子计算的优越性,为什么我们要做这么一个事情,以及我们后面科大所做的一些相关的实验的背景。

这就是Google悬铃木芯片,我们希望用一条完全不同的途径,用光子,用玻色取样的途径,实现这么一个类似的里程碑的目标。当然我们其实后面我们人员的规模大概是Google的1/3到1/4,我们的经费大概是它的1%左右的规模。

下面我们来讲一讲用光子做玻色取样这个过程是一个什么样的过程。

其实这个算法也是我们通用的光量子计算的一个简化的模型,或者说是一个必要的条件,我们需要一系列的量子光源作为一个输入,一个非经典的光源,经过这样一个光学的网络,在这个网络里有单网的干涉,两个光子的一个量子干涉,最后我在终端用单光子探测器对它进行读取。

我们刚刚开始做这个实验的时候大概是2013年的时候,当时用世界上最好的技术、最好的光源、最好的线路和最好的探测器,但是难度是非常大的,应该说是超级超级大的一个天文数字,10的负150次方赫兹。为了来解决光源的问题、网络的问题、线路的问题,我们在2013年首次解决了光源的品质问题,让它可以确定性产生,而且有很高的品质。2016年我们又解决了高效率提取的问题。2018年我们实现了所有的指标都可以做到完美的纠缠光源的制备。2019年做到了单光子源方面可以让它产生品质和效率单体化。

做了这样一系列工作之后,我们在2017年做了第一次比较小的尝试,我们做了5到7个光子的玻色取样,当时这个工作入选了2018年习主席的新年贺词,比国际上的同行要快24000多倍。

2019年是跟Google同步的时间进展,我们在年底实现了20光子输入到60模式干涉线路的玻色取样,输出复杂度相当于48个量子比特,当然跟Google的工作还是有一定差距。

2020年我们又做了一些非常重要的创新,包括从概念上,我们利用了高斯玻色采样这么一个算法,这样一个算法可依更加有效地利用量子光源,不仅可以利用到量子一些叠加态,不仅可以利用光子的不同路径的叠加态同时传载,我们还可以利用到光子数的叠加态,0个光子,2个光子,4个光子,6个光子,这样一种不可分辨的叠加态。此外,高斯玻色采样还有另外一个优势在于它有很多个潜在的应用,在很多量子化学里面、图论里面、机器学习里面,在未来都可以找到一些相关的,我们可以把它的数学问题影射到高斯玻色采样的算法上面去。

当然这样一个算法也带来了很多技术上的挑战,比如我们需要同时具备高效率、高品质、特别高的亮度,大概每个脉冲都要有4到5个光子,还有大规模的扩展能力的量子光源,我们目前都发展好了。往往做一个器件最难的不是把单项指标做得最好,而是要把所有的指标都要做得很好。它利用了不仅是光子的不同空间模式的叠加性,而且还利用了它不同光子数的叠加的状态。要利用这个,我们就得需要把这个相位要锁定,不同的光子的数目,之间有一个相位,这个相位要锁定,它的难度是相当于我们要在一百公里的距离上要能够保证这些光子之间的长度、它通过的路程,要小于一根头发丝的宽度。

这些光子需要在一个很大的干涉仪上进行我们所需要的计算过程,我们就组建了一个最大规模的100×100的全连通、随机矩阵、相位稳定、波包重合>99.5%,透过率>98%的这么一个大规模矩阵。最终的结果我们需要用高灵敏的单光子探测器把它读取出来,我们也跟中科院上海微系统所进行了很好的合作,他们提供了我们所需要的单光子探测器。

探讨出这样一些结果之后,因为我现在的这个实验规模,这个量子系统已经做得非常大,这么一个量子计算的装置,我怎么来验证它计算出来的结果是对的?我们就需要和无锡的56所相关的一些老师和同学进行相关的合作,在小规模上面全面地验证它确实是按照我们所需要的结果产生的。我们大概能验证40个光子,因为超过40个光子,计算量会变得非常大,电能的消耗是指数增长的、不可扩展的。我们同样在一起合作,排除了一些假设的模型,证明我们这个实验确实是由量子力学所主导的。

这张图展示了我们整个装置,从机关器,从我们自主设计的机关器到关联的光源,到主动锁相,到干涉仪,到被动锁相,到最后光子的读取,应该说是目前最最最复杂的一个量子光学的一个实验。

我们刚才也讲到了,高斯玻采样的算法跟Google的随机线路采样算法都是属于一大类的量子采样的问题,所以我们可以以超算作为一个比较,做一些进阶的等项的比较。一个比较重要的是,我们这个工作里最终样本的数量空间是10的30次方,要远远大于Google实验里10的16次方。所以,在这个实验里我们所验证的量子计算的优越性是不依赖于样本数量的。打个比喻,不管是采很少的样本还是很多的样本,我们始终有这么一个优势。也就是不管是“短跑”还是“长跑”,我们都对超算有一个优势,但是Google的实验,只在短跑项有优势,长跑项没有优势。当然所有的量子优越性的实验都不是一蹴而就的,这个工作出来之后肯定会有很多艰难的算法的工作会来构想出更快的算法,我们也希望我们这个工作能来激发更多的经典算法方面的工作,来挑战我们所看到的10的14次方(10000亿次)的gap。其实我们工作出来之后,像Google的很多科学家,还有以色列的、加拿大的、荷兰的科学家已经开始跟我们联系,我们也把这个原始数据共享给他们,开始算一算,看看大家在经典上面有没有更快的一些算法。

我们实现了优越性的展示之后,很自然的我们进一步要做的工作就是看看既要有加速,同时又要有应用价值。高斯玻色采样在图论、机器学习、量子化学等领域有很多潜在的应用,这也是我们后续要发展的重要方向。我们希望可能在2021年能够在一些很小规模的问题上做一些初步的演示,也为最终迈向可应用、可实用以及通用的量子计算打下相关的一些科学和技术的基础。

谢谢大家!

国内5G市场份额目标35% 中兴通讯“瘦身”转让高达通信股权 延长一年时间 LG Display将继续在韩国生产LCD面板
相关阅读: