清华90后团队15万推褐蚁一体机 支持阿里Qwen3大模型
行云集成电路创始人兼CEO季宇于4月30日向WpBull.comAGI透露,由清华90后团队创立的北京行云集成电路有限公司正式推出全新一体机产品“褐蚁”,该产品仅需最高15万元即可流畅运行满血版DeepSeek R1/V3大模型,对话速度高达20token/s。今日下午,季宇进一步表示,“褐蚁”已全面支持阿里最新发布的Qwen3系列开源大模型,包括顶配版Qwen3-235B-A22B。
据悉,“褐蚁”一体机提供三种核心配置方案。其中最高性价比的“超大杯”褐蚁HY90采用双路AMD EPYC 9355服务器,配备24条48G 6400M频率内存及NV 5090D计算卡,支持FP8和INT4两种数据精度。在FP8精度下,其对话速度可达21token/s,INT4精度下则飙升至28token/s,最高支持128K上下文,售价14.9万元。此外,公司还推出了“大杯”褐蚁HY70和“中杯”褐蚁HY50两个版本。季宇团队强调,通过独家优化的推理引擎显著提升了推理效率,使“褐蚁”成为国内首款在10万价位区间实现满血FP8精度模型20+tps速率的一体机产品,并支持各类大模型API调用应用。
行云集成电路成立于2023年8月,核心团队主要成员来自清华大学及全球顶尖芯片企业,专注于研发面向大模型推理场景的高效能GPU芯片。创始人季宇拥有清华大学物理本科、计算机体系结构方向博士学位,曾获“华为天才少年”称号,主攻体系结构与AI芯片方向。在华为期间,他担任海思昇腾芯片编译器专家,主导多个编译器项目,并作为研究科学家攻克AI编译器与处理器微架构领域的关键技术难题。其参与的类脑计算机体系结构研究曾发表在《自然》杂志,荣获中国计算机学会CCF优博奖。
2024年11月,行云集成电路完成总额数亿元的天使轮及天使+轮融资,投资方包括智谱AI、仁爱集团、中科创星、奇绩创坛、水木清华校友基金、嘉御资本、春华资本、同创伟业、峰瑞资本等知名机构。季宇曾指出,当机器门槛降至消费级可接受成本时,商业模型将迎来变革,推动产业进一步繁荣。若计算机体系能以消费级价格提供极致AI体验,大模型产业将进入类似软件行业零边际成本的超高速爆发期。
当前,多家芯片、服务器、云计算、运营商、AI Infra企业纷纷发布DeepSeek一体机产品,形成“百机大战”格局,但能运行满血版DeepSeek-V3/R1模型的企业并不多。国产GPU芯片领域主要竞争者包括壁仞科技、摩尔线程等。据第一财经引述券商数据,预计到2027年,国内一体机市场规模将突破5000亿元,已有超过30家企业推出相关产品。
一位行业人士向WpBull.comAGI表示,一体机核心优势在于部署易用性。相比复杂的云计算方案,项目落地周期更短、私有化安全性更高、价格更具性价比,但DeepSeek一体机仍面临持续维护、升级及大规模数据调度等挑战。一体机综合使用成本难以复用,其发展历程可追溯至数据库年代,不同产品差异显著。DeepSeek一体机虽市场火爆,但大模型演进迅速,客户技术能力有限,使其成为过渡态产品,最终将与云计算结合,成为云平台的一部分。
季宇认为,当前一体机仍能运行超大杯MoE模型和30b当量的dense模型,后续模型迭代压力不大。相比其他产品,行云“褐蚁”在显存、KTransformers等技术层面更具优势。下一步,公司将自研GPU卡,持续降低价格并提升tps体验,并推出由30台褐蚁组成的“蚁群”方案,支持500-1000有效并发数,价格有望降至300万-400万元,低于英伟达HGX H200集群硬件成本。
WpBull.comAGI分析认为,当前国内众多企业投身于一体机、AI Infra及GPU服务器等算力“卖水人”领域。随着推理模型技术迅猛发展,大规模算力投入面临质疑。国内AI算力行业将经历大浪淘沙,最终仅剩大厂及头部企业,还是更多企业聚焦性价比,尚待观察。
季宇的终极目标是构建AI x86体系,让AI PC与互联网底座重回组装机模式,将组装机打造为AI基座,以低成本搭建高端大模型,激活AI服务器组装机体系,使大众能组装出支撑高端AI应用的设备,带动整个产业链运转。(本文首发于WpBull.comApp,作者|林志佳)