查看原文
其他

重磅揭示!广受认可的量子计算评估标准曝光“严重缺陷”

光子盒研究院 光子盒 2024-03-26
光子盒研究院


科技革命中,量子计算无疑占据了一个前沿地位。这一创新技术,以其在处理速度和复杂问题解决能力上的潜在优势,正在引领一场可能彻底改变我们对数据处理和计算的理解的革命。然而,随着这一领域的迅猛发展,量子计算也面临着一系列前所未有的挑战,其中最显著的便是如何准确评估量子计算机的性能。
迄今为止,量子比特的评估标准主要包括以下几个方面:
1)量子体积(Quantum Volume, QV)
由IBM提出,用于衡量量子计算机的综合性能和错误率。考虑了量子比特的数量、质量和连接方式,综合评估量子计算机处理复杂量子电路的能力。
VQ即量子体积,对于一个n量子比特处理器,m≤n,d(m)是最大方形电路中的量子比特数。也就是说量子体积与处理器拥有的量子比特数有关,还与量子处理器能够可靠运行的最大方形电路的深度有关
2)保真度(Fidelity)
衡量量子操作(如量子门、量子态的制备和测量)执行的准确度;高保真度意味着量子操作的执行接近理想状态。
3)相干时间(Coherence Time)
指量子比特保持其量子态不被环境干扰的时间长度。相干时间越长,量子计算机执行复杂操作的能力越强。
4)量子错误率
量子计算中的错误率,包括量子门错误率和测量错误率。错误率越低,量子计算的准确性越高。
5)算法量子比特(Algorithmic Qubits, AQ)
主要用于评估量子计算机在特定算法任务上的性能,由IonQ提出,反映了量子计算机处理特定量子算法时的有效量子比特数量。
IonQ观测AQ的步骤
网页链接:https://ionq.com/algorithmic-qubits
6)可编程性和可用性
评估量子计算机对不同类型量子算法的适应性和易用性;包括量子比特的布局灵活性、编程接口的友好度等。
7)可扩展性
考虑到量子计算机系统增加量子比特数量时的性能变化,包括量子比特的扩展性以及维持性能的能力。
以上这些标准共同构成了评估量子计算机性能的多维度框架,旨在全面理解和衡量量子计算机的能力及其潜在的应用前景。
随着量子计算技术的不断进步,这些评估标准也在持续发展和完善中。例如,2023年11月,IBM还介绍了两个新的指标:每层门误差(Error Per Layered Gate, EPLG)和CLOPSh,旨在更全面地评估超过100比特处理器的性能,弥补量子体积(QV)指标的一些评估不足。
随着量子处理器的规模不断扩大,传统的基准测试正在面临新的挑战。现代量子计算机的复杂性和多样性要求我们采用更为全面和精细的方法来评估其性能,确保能够精确捕捉到量子计算机在实际应用中的真实能力。因此,探索和开发更先进的基准测试标准已成为量子计算领域的一个迫切需求。

最近,Quantinuum公司在一份研究中,深入剖析了两种主要的量子计算机基准测试:量子体积(QV)和算法量子比特(AQ)。这份报告不仅展示了Quantinuum H系列计算机在这些测试中的出色表现,更重要的是,它揭示了AQ测试的根本缺陷和潜在的误导性质
“我们证明,被称为算法量子比特(algorithmic qubits)的替代基准存在严重缺陷,它将计算机性能隐藏在复数投票技巧和门编译背后,并没有广泛用途。”
算法量子比特(AQ)作为一种评估量子计算性能的方法,旨在衡量量子计算机执行特定算法任务的效率。AQ被定义为能够完美运行的最大量子比特数,类似于量子体积概念,但考虑到纠错因素。纠错通过利用多个物理量子比特来形成一个改进的量子比特,以克服错误。因此,AQ反映了特定量子计算机在执行真实量子算法时“有用”的编码量子比特数量。
AQ指标源于量子经济发展联盟 (QED-C) 的全行业研究和算法基准协议,其中最复杂的电路确定了AQ分数。例如,IonQ公司的Forte芯片在2024年宣布的AQ为35,意味着它能够处理超过340亿种不同的可能性。

论文链接:https://arxiv.org/abs/2110.03137
然而,Quantinuum团队在其报告中指出,AQ测试在某些情况下可能导致量子计算机性能的高估。这种高估源于错误缓解技术(如简单多数票法)和电路编译策略的应用。这些技术虽然在特定情境中有效,但可能在全面评估量子计算机性能时产生误导。
通过采用简单多数票法的错误缓解技术,可以显著提高计算结果的准确性,但这并不反映量子计算机在没有这些额外处理的情况下的真实性能。
通过AQ=32所需的最大相位估算和振幅估算测试分别指定了992个和868个纠缠门,但应用pytket优化后,电路分别减少到141个和72个纠缠门——由于AQ报告的是预编译门计数,可能导致用户期望一台机器能够运行比基准硬件实际可能运行的更多的纠缠门
特别地,简单多数票法等错误缓解技术虽然能显著提升计算准确性,却不能真实反映量子计算机在未采用这些附加处理的情况下的实际性能。此外,AQ测试中某些算法电路可通过编译优化显著减少所需量子门数量。这虽理论上提高了性能,实际上却可能掩盖了量子计算机处理更复杂或现实世界问题的真实能力。
因此,AQ测试结果可能与量子计算机处理实际任务时的性能存在较大偏差
测试以三种不同选项运行:(基础)运行算法量子比特Github代码库指定的精确电路;(门编译)运行带有自定义Pytket编译器的电路,以减少双量子比特栅极计数;以及(门编译 + 多轮投票)运行编译电路,同时应用简单多数票法减少误差,对25个随机变体进行投票,每个变体100次。请注意,机器的量子体积(QV)与不进行编译和简单多数票法的情况最为接近,但即使是AQ的基本情况也会高估机器的QV

H2-1的测量量子体积为2^16。根据Forte公开提供的数据,结合上述AQ模拟数据,Quantinuum估计Forte的量子体积约为25(尽管量子比特保真度和电路编译细节的差异可能会影响这一估计值)
Quantinuum的研究特别强调了量子体积作为一个全面且难以操控的性能衡量工具的重要性,与AQ相比,它更能真实反映量子计算机的实际能力。这些分析为理解量子计算机的实际应用能力提供了重要价值,为量子计算领域的研究者、开发人员和用户提供了宝贵的指导和参考。


Quantinuum的最新研究揭示了算法量子比特(AQ)测试可能存在的局限性和误导性,这一发现对整个量子计算领域而言具有划时代的意义。它不仅促使行业内部重新审视和评估现行的基准测试方法,更强调了在量子计算领域内建立更加严谨和透明的性能评估标准的迫切性。这对于所有依赖离子阱技术的公司,包括Quantinuum和IonQ在内,都是一个不容忽视的提醒:评估方法必须与时俱进,以准确反映量子计算机的真实能力。
为了进一步拓宽对量子计算领域的理解和讨论,感兴趣的读者可以观看Dr. Charlie Baldwin的专题讲解视频。
视频链接:https://www.quantinuum.com/webinar/h-series-benchmarking
在这个视频中,Dr. Baldwin不仅详细解读了Quantinuum最新的研究成果,还深入讨论了量子体积(QV)和算法量子比特(AQ)的基准测试方法,以及它们对于量子计算发展的意义。
Quantinuum对QV和AQ测试的研究成果不仅揭示了现有量子计算基准测试的局限,尤其是AQ测试中的问题,更可能引导量子计算技术的发展方向发生根本性转变。此研究提出的问题表明,量子计算技术的发展不应仅仅局限于提高量子比特数量,更应关注提升量子系统整体的性能和稳定性
随着评估标准的改进和量子计算技术的不断进步,量子计算的实用化和商业化发展将可能得到加速。更准确的性能评估将为企业和研究机构在运用量子计算解决实际问题上提供有效的指导,进而推动量子计算在多个领域的广泛应用。
Quantinuum的这一研究成果无疑为量子计算技术的前进路径指明了新的方向。

参考链接:[1]https://www.zdnet.com/article/ionq-introduces-algorithmic-qubits-to-counter-quantum-volume-in-quantum-computing/[2]https://www.quantinuum.com/news/debunking-algorithmic-qubits

相关阅读:
如何评估量子计算机性能?IBM提出两大新指标——
Q-score:评估量子性能和优势的唯一通用指标
是什么让量子计算机更强大?量化“量子性能”给出了具体指标
量子计算机有哪些性能指标?分别代表了什么?
IBM提出首个衡量量子计算速度的指标CLOPS

#光子盒视频号开通啦!你要的,这里全都有#

每周一到周五,我们都将与光子盒的新老朋友相聚在微信视频号,不见不散!

你可能会错过:
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存