您当前的位置 : > 财商

110万美元悬赏!AMD发起全球战书:谁能打破DeepSeek与Kimi的推理速度极限?

日期: 2026-03-25

面向所有热爱硬核技术的你:这一次,用代码说话,用性能封神。

北京2026年3月25日 美通社 -- 在 DeepSeek-R1 和 Kimi K2.5 等顶级开源模型确立了万亿参数的工业基准后,真正的极限性能压榨才刚刚开始。谁能在极高并发下打破内存墙?谁能用最优雅的代码实现最高效的算子重构?在当下的 AI 战场,速度即是正义,吞吐量决定生死。由 AMD 与 GPU MODE 联合发起的极客巅峰对决,正式向全球发榜:2026 线上黑客松:AMD E2E Model Speedrun 正式吹响集结号!

  • 在这里,你将直接操控 AMD 专为大模型打造的顶配云端 GPU 阵列
  • 在这里,没有纸上谈兵的 PPT,只有硬核的绝对速度与吞吐量。
  • 在这里,你的极限优化不仅能赢取巨额美金,更将直接合入主流开源框架,定义下一代 AI 推理的工业标准!

作为本次活动的战略社区合作伙伴,CSDN 将全程见证这场智力与算力的巅峰对决。

你,敢来迎战吗?


立即报名:AMD x GPU MODE - E2E Model Speedrun Luma

百万美金奖池,凭实力“拿钱”

本次挑战赛设立了高达 110 万美元的总奖金池!只要你的技术够硬,名与利双丰收。

决赛入围奖:只要从预选赛杀出重围,跻身 Top 10,每支队伍保底斩获 10,000 美金!

  • Track 1 赛道桂冠 (DeepSeek-R1-0528):$350,000 独揽!
  • Track 2 赛道桂冠 (Kimi K2.5 1T FP4):$650,000 独揽!

注:两大赛道完全独立,有实力的团队完全可以双线作战,包揽百万美金!

赛制硬核,分秒必争的“大逃杀”

比赛绝非易事,本次大赛将采用“底层算子突围 + 端到端决赛大考”的双阶段赛制。能留到最后的,注定是地表最强的性能架构师。

预选赛 底层内核的绝对厮杀

所有参赛者需对三大核心 GPU 算子进行极限打磨:

  1. MXFP4 MoE (最高 1500 分)
  2. MLA Decode (最高 1250 分)
  3. MXFP4 GEMM (最高 1000 分)每个内核问题的得分= 最大分值 × 【1 -(排名分值20)】。排名按顺序所对应分值= 0,1,2,18,19。总分为三项内核问题得分之和,采用上述方法。只有排名前 20 的算子才能获得积分,总分排名前 10 的战队个人,方可拿到通往决赛的门票。

总决赛 真实世界的端到端狂飙

Top 10 选手将获得 AMD 提供的单节点 8 卡云端 Instinct™ GPU 集群。你们需要在极致并发下,挑战两大明星模型:

  • 赛道 1:DeepSeek-R1-0528 FP4 + MTP
  • 赛道 1 评判标准

在 4、32、128 三种并发度下,你不仅要保证极高的吞吐量 (Token Throughput),还要死守低延迟的交互性 (Interactivity),更要确保模型精度不能掉(本赛道要求 GSM8K ≥ 0.93)。性能门槛(三个并发级别必须同时达标):


  • 赛道 2:Kimi K2.5 1T FP4
  • 赛道 2 评判标准

在4、32、128三种并发度下,你不仅要保证极高的吞吐量 (Token Throughput),还要死守低延迟的交互性 (Interactivity),更要确保模型精度不能掉(如 Track 1 要求 GSM8K ≥ 0.93)性能门槛(三个并发级别必须同时达标):


评分:Token Throughput per GPU(最高 600 分)+ Interactivity(最高 400 分),三个并发级别满分 3000 分。

跑分不是终点

我们寻找的不是为了跑分的“特供版代码”,而是能真正造福全人类 AI 社区的工业级优化。终极必杀规则:代码必须可 Merge!所有具备获奖资格的团队,其提交的代码必须在赛后 2-4 周内,在 AMD 工程师的指导下,成功向 AMD 官方仓库(AMD ATOM vLLM SGLang)发起 Pull Request 并完成合并。让你的名字,永远镌刻在推动大模型时代前行的开源主分支上!

决战时刻表 (北京标准时间)

报名&预选赛截止时间:4 月 7 日 2:59 PM(TOP 10 诞生)

决赛排位战:4 月 8 日 0:00 AM 5 月 16 日 2:59 PM

全球颁奖典礼: 5 月 19 日

如何加入这场算力狂欢?

无论你是 AI 底层优化老兵、CUDATriton 极客,还是系统架构师、开源社区贡献者,只要你对 AI 系统性能工程充满狂热,这里就是你的主场!(支持个人或至多 3 人组队参赛)

第一步:加入 AMD AI Developer Program,获取官方弹药库。

AI 开发者计划注册表

第二步:查阅预选赛参考 kernels,使用 Popcorn CLI 准备你的提交。 预选赛入口及工具库:https:github.comgpu-modereference-kernels别一个人战斗!立刻加入 GPU MODE Discord 社区 及 微信比赛专属群,与全球顶尖开发者同频共振,获取实时赛事更新与官方技术支持!