24人硅谷初创推出AI芯片速度超Cerebras10倍成本仅1/20

AI小创 1 个月前

AI快讯

近日，一款来自硅谷初创公司Taalas的AI芯片HC1引爆科技圈。这支仅24人的团队多由AMD前高管组成，成立两年便交出首款产品：峰值推理速度达每秒17000个token，是当前高性能标杆Cerebras的10倍，同时成本降至1/20、功耗削减10倍，凭借把大模型直接刻在硅片上的极端方案，实现了LLM的亚毫秒级即时响应。

这款一夜之间登上硅谷热榜的芯片，其性能参数足以让行业巨头侧目。要知道，当前AI推理领域公认的高性能芯片Cerebras，峰值速度仅为每秒2000个token，HC1在速度上实现了10倍的碾压；而在成本和功耗的控制上，它更是打出了“成本减20倍、功耗降10倍”的组合拳——这意味着，大语言模型（LLM）的推理门槛被彻底拉低，同时用户能体验到真正的“零等待”交互。

更具反差感的是，打造出这款“性能怪兽”的并非英伟达、AMD这样的芯片巨头，而是一支仅有24人的小团队。这支被称为“梦之队”的核心成员大多来自AMD的资深管理层，在芯片设计、AI算力优化领域拥有深厚积累，成立仅两年就拿出了首款颠覆性产品，刷新了行业对初创公司研发效率的认知。

HC1的颠覆性，根源在于它跳出了AI芯片的传统技术框架。目前行业主流方案是将大模型加载到内存中运行，但这一模式始终受限于内存带宽瓶颈：模型数据需要在内存与计算单元之间频繁传输，不仅产生高额延迟，还消耗大量功耗。而Taalas选择了最极端的路径——直接将大模型的权重刻在硅片上，让计算单元可以直接访问模型参数，从根源上消除了数据传输的延迟和额外能耗。

AI芯片大模型推理 Taalas 低功耗芯片初创科技公司

本文内容来源于公开互联网信息，并包含平台新增内容及用户发布内容，旨在进行知识整理与分享。文中所有信息与观点均仅供参考，不代表任何官方或特定立场，亦不构成任何操作或决策建议，请读者谨慎甄别，详情请见完整免责声明

GPT Image 2

一站式AI图像视频创作平台

Narrato

AI内容创作营销全流程平台

Swyft AI

AI驱动RevOps流程自动化

SJinn

AI多模态内容创作智能代理

Limbiks

AI闪卡生成工具，提升学习效率

ProMind AI

专业AI代理，内容代码生成提效

SourceNext（ソースネクスト）

综合软硬件与AI服务平台

OpenResume

免费开源简历制作与检测工具