2026年4月20日,阿里旗下通义实验室正式发布新一代语音识别大模型Fun-ASR1.5。该模型采用统一大模型架构,解决了语音AI领域长期存在的通用性与精准度平衡难题,可支持全球30种主流语言、汉语七大方言及20余种地方口音的高精度转写,目前已上架阿里云百炼平台,将通过API服务为多行业智能化升级提供技术支撑。
在AI语音赛道,技术落地已经渗透到各行各业,但长期以来存在一个难以调和的核心痛点:针对单一场景优化的模型识别精度高,但换场景、换语种就容易出错;而追求全场景适配的通用模型,又往往会在复杂语境下牺牲识别精度。中国市场本身存在多方言、口音差异大的特点,不少特殊场景如传统文化音频的数字化转写,更是过往模型的能力盲区。
此次发布的Fun-ASR1.5,核心突破就是通过统一大模型架构,实现了通用性与精准度的平衡。该模型在训练阶段就整合了多语种、多方言的海量语料,不需要开发者针对不同场景单独做差异化微调,既降低了适配成本,也保证了全场景的识别表现。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
QuestMobile发布的《2026年一季度AI应用洞察报告》显示,截至2026年3月国内AI原生APP月活跃用户突破4.4亿,一季度新增用户超1.3亿,行业头部效应凸显。字节跳动旗下豆包以3.45亿月活领跑市场,阿里巴巴旗下千问、深度求索旗下DeepSeek分别以1.66亿、1.27亿月活稳居行业前三,用户使用粘性正持续提升。

5 小时前
2026年4月22日,纽约州总检察长莱蒂西亚·詹姆斯正式对加密货币交易所Coinbase、Gemini提起诉讼,指控两家平台在州内运营未经授权的AI预测市场,实质上构成非法赌博,存在允许未满21岁未成年人参与投注、违规开放纽约大学校队赛事投注通道、涉嫌偷逃博彩税款等多项违法行为,目前州方正向法院申请高额赔偿。

5 小时前
2026年4月发布的Z世代AI态度专项民调显示,2025年以来该群体对AI技术的兴奋度下降14%,不满情绪持续攀升:48%的在职Z世代认为AI职场所带来的风险超过便利,52%的未成年学生认可AI技能的必要性但对校园AI应用持保守态度,整体呈现既认同AI核心价值又担忧技术失控的矛盾心态。

5 小时前
2026年4月22日,蚂蚁集团正式发布旗下百灵大模型迭代产品Ling-2.6-flash Instruct。该模型总参数量达104B,运行时激活参数仅7.4B,据国际权威机构Artificial Analysis评测,其完成同等任务仅消耗15M tokens,推理成本仅为Nemotron-3-Super等主流同类模型的十分之一,凭极高“智效比”引发AI行业广泛关注。

5 小时前
2026年4月,谷歌正式发布基于Gemini 3.1 Pro大模型打造的Deep Research、Deep Research Max两款AI调研智能体,可自动化完成全流程资料搜集与分析工作,支持公开网页检索及企业内部私有数据调用,目前已通过付费版Gemini API向开发者开放预览,标志着AI工具从问答交互向复杂任务执行阶段升级。

6 小时前
2026年4月,AI初创公司NeoCognition正式走出隐身模式,宣布完成由Cambium Capital、Walden Catalyst Ventures领投,英特尔CEO基辛格等产业方知名人士参投的4000万美元种子轮融资。该公司将重点研发可自主构建“世界模型”的类人学习AI智能体,解决当前主流AI智能体复杂任务成功率仅50%的行业痛点,提升垂直场景适配与执行可靠性。

7 小时前
2026年4月,由俄亥俄州立大学教授余苏创立的AI智能体研究实验室NeoCognition正式走出隐身模式,宣布完成4000万美元种子轮融资。本轮融资由Cambium Capital、Walden Catalyst Ventures领投,英特尔首席执行官陈立步、Databricks联合创始人Ion Stoica等产业界资深人士跟投,资金将全部用于攻克当前AI智能体可靠性不足的行业痛点。

7 小时前
2026年4月22日,福布斯正式发布第八届全球AI50榜单,聚焦全球最具潜力的非上市人工智能企业。本届榜单共有20家新企业上榜,50家上榜企业总融资额达3056亿美元,其中头部厂商OpenAI、Anthropic累计融资2426亿美元,占总额近八成,凸显AI赛道资本向顶级玩家集中的明显趋势。