2026年3月26日,蚂蚁集团CodeFuse团队联合上海交通大学正式发布全尺寸多语种F2LLM-v2系列Embedding嵌入模型。该模型在全球权威语义表征评测MTEB中拿下11项榜单SOTA,支持282种自然语言与40余种编程语言,目前已全开源向全球开发者开放,旨在打破语义表征领域长期存在的“英语中心主义”壁垒。
在大模型应用落地的产业链中,嵌入模型(Embedding)是连接用户query、知识库与大模型的核心中间件,但长期以来,全球主流嵌入模型的训练语料均以英语为主,非英语语种的语义表征精度普遍偏低,多语种应用开发一直存在较高的技术门槛。

作为全球衡量嵌入模型性能最权威的基准,MTEB榜单的测试覆盖多语种理解、代码检索、医疗问答等430个细分场景,是全球开发者选型嵌入模型的核心参考指标。本次发布的F2LLM-v2系列模型在该榜单中拿下11个细分赛道的冠军,覆盖德语、法语、日语等多个非英语语种榜单及代码检索等垂直领域。
哪怕是该系列中的轻量级版本,在同参数尺寸下的表现也多次击败了业界主流的知名嵌入模型,实现了跨级性能突破。据官方披露,F2LLM-v2系列目前可支持282种自然语言与40余种编程语言的语义表征,基本覆盖全球绝大多数国家和地区的商用语言需求。
此前全球主流嵌入模型的训练语料中,英语占比普遍超过70%,小语种、非英语地区的开发者想要获得符合当地语言习惯的语义表征能力,往往需要投入大量算力二次微调,开发成本居高不下。
蚂蚁CodeFuse团队与上海交通大学的联合研发团队针对这一痛点,大幅提升了训练语料中的非英语占比,同时优化了模型的跨语言注意力机制,在保证模型效率的前提下大幅提升了多语种表征精度。同时该系列模型采用全尺寸设计,覆盖从1B以内的轻量级版本到百亿级参数的高性能版本,开发者可根据自身的算力储备、应用场景灵活选型,且所有版本均全开源免费商用,进一步降低了使用门槛。
嵌入模型是检索增强生成(RAG)、语义搜索、智能客服、内容推荐等诸多AI应用的核心基础组件,F2LLM-v2的开源,相当于为全球尤其是非英语地区的开发者提供了开箱即用的SOTA级语义表征工具。
有业内人士测算,对于中小开发团队而言,使用开源的F2LLM-v2替代此前的商用嵌入模型服务,单项目的年成本可降低至少40%,同时出海应用的多语种适配周期可缩短60%以上,将进一步推动多语种AI应用的普及。

4 小时前
2026年3月31日,AI接入层头部初创公司LiteLLM正式宣布全面移除平台内争议辅助工具Delve,回应开发者社区关于该工具数据隐私、模型透明度的质疑。LiteLLM创始人公开承认此前合作伙伴安全评估存在疏漏,团队将剔除全部关联代码,转向可审计的开源替代方案,该事件也暴露出AI中间层架构平衡效率与安全的行业共性难题。

4 天前
2026年3月26日,AI企业Cohere正式推出20亿参数开源语音识别模型Cohere Transcribe。该模型采用Apache 2.0协议开源,专为边缘设备设计,支持14种语言,据Hugging Face开放ASR排行榜最新数据,其性能已超越ElevenLabs Scribe、阿里Qwen3等主流竞品,有望破解边缘侧语音识别高延迟痛点。

6 天前
2026年3月24日,开源项目N.O.M.A.D.(Node for Offline Media, Archives, and Data)正式发布,这款被称为“末日生存工具箱”的离线服务器系统,可在Debian、Ubuntu系统运行或通过Docker快速部署,内置离线大模型、维基百科、医学资料、可汗学院课程等资源,可在断网未断电的极端场景下为用户提供完整的文明信息与技术工具支撑。

7 天前
2026年3月24日,美团龙猫团队正式开源面向数学形式化与定理证明的深度学习模型LongCat-Flash-Prover。该模型将形式化推理拆解为三大原子能力,破解大语言模型逻辑推演短板,在MiniF2F-Test基准测试中仅用72次推理预算即实现97.1%通过率,刷新开源Prover模型SOTA,在高难度竞赛级任务中表现也领先现有开源方案。

8 天前
2026年3月,蚂蚁集团通过旗下全资子公司上海云玚企业管理咨询有限公司正式入股AI玩具初创企业深圳跃然创新科技有限公司,完成增资后后者注册资本提升至316.52万元。成立于2021年的跃然创新主打AI交互技术落地儿童玩具产品,此次获巨头入股也释放出AI技术加速下沉儿童消费市场的明确信号。

8 天前
2026年3月,美国高估值AI编程初创公司Cursor发布新一代AI编程模型Composer2,随即因底层架构疑似直接复用Moonshot AI(月之暗面)开源Kimi k2.5模型遭网友代码取证质疑。Cursor开发者教育副总裁Lee Robinson公开回应确认合作关系,称仅25%计算量来自开源底座,其余为自主训练成果,Moonshot AI随后证实双方已达成商业授权。

14 天前
2026年3月,凭借可自主执行任务的核心优势,开源AI智能体工具OpenClaw(昵称“龙虾”)成为国内现象级AI产品,民间兴起“养龙虾”使用热潮。因该工具区别于传统大模型的高权限属性带来原生安全风险,国家安全部近日正式发布《“龙虾”安全养殖手册》,提醒广大用户理性辨别功能边界、规范使用这款具备全链路执行能力的新型AI工具。

14 天前
2026年3月17日,阿里巴巴通义实验室联合中国科学技术大学正式开源Fun-CineForge电影级多模态配音项目。该项目推出端到端AI配音生产流水线,搭载多模态大模型架构与国内首个标注完备的CineDub中文影视配音数据集,可解决传统AI配音口型错位、情感生硬、适配复杂场景能力弱等行业痛点,相关技术已达到影视制作商用标准。