2026年4月20日,阿里巴巴正式推出新一代端到端语音识别大模型Fun-ASR1.5,该模型基于阿里千问大模型体系迭代研发,公开测试数据显示其语音转写准确率超过字节跳动、腾讯等业内头部厂商的同类产品。Fun-ASR1.5可识别30种语言,覆盖中文七大方言与20余种地方口音,优化了标点预测等核心能力,可广泛应用于会议纪要整理等多个生产力场景。
对于经常需要整理会议录音、采访素材的办公人群与内容从业者来说,语音转写后的人工校对往往要花费数倍于录音本身的时间,方言口音、标点错乱、专有名词错漏都是行业长期存在的痛点,阿里新一代语音识别大模型直指这些用户痛点。
近年来,远程办公普及、内容行业发展、司法数字化推进,带动全行业对自动化语音转写的需求持续攀升,市场规模逐年增长。但此前绝大多数产品在方言识别、复杂场景准确率上始终存在明显瓶颈,不少带口音的语音转写错误率超过15%,严重影响使用效率,行业呼唤精度更高、适配场景更广的技术方案。
作为阿里千问端到端语音识别大模型的新一代版本,Fun-ASR1.5 在多个核心维度实现了升级。除了支持30种主流语言的识别能力,它完整覆盖中文七大方言体系,可适配20余种地方口音,甚至专门强化了古诗词诵读的专项识别能力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
QuestMobile发布的《2026年一季度AI应用洞察报告》显示,截至2026年3月国内AI原生APP月活跃用户突破4.4亿,一季度新增用户超1.3亿,行业头部效应凸显。字节跳动旗下豆包以3.45亿月活领跑市场,阿里巴巴旗下千问、深度求索旗下DeepSeek分别以1.66亿、1.27亿月活稳居行业前三,用户使用粘性正持续提升。

5 小时前
2026年4月22日,纽约州总检察长莱蒂西亚·詹姆斯正式对加密货币交易所Coinbase、Gemini提起诉讼,指控两家平台在州内运营未经授权的AI预测市场,实质上构成非法赌博,存在允许未满21岁未成年人参与投注、违规开放纽约大学校队赛事投注通道、涉嫌偷逃博彩税款等多项违法行为,目前州方正向法院申请高额赔偿。

5 小时前
2026年4月发布的Z世代AI态度专项民调显示,2025年以来该群体对AI技术的兴奋度下降14%,不满情绪持续攀升:48%的在职Z世代认为AI职场所带来的风险超过便利,52%的未成年学生认可AI技能的必要性但对校园AI应用持保守态度,整体呈现既认同AI核心价值又担忧技术失控的矛盾心态。

5 小时前
2026年4月22日,蚂蚁集团正式发布旗下百灵大模型迭代产品Ling-2.6-flash Instruct。该模型总参数量达104B,运行时激活参数仅7.4B,据国际权威机构Artificial Analysis评测,其完成同等任务仅消耗15M tokens,推理成本仅为Nemotron-3-Super等主流同类模型的十分之一,凭极高“智效比”引发AI行业广泛关注。

5 小时前
2026年4月,谷歌正式发布基于Gemini 3.1 Pro大模型打造的Deep Research、Deep Research Max两款AI调研智能体,可自动化完成全流程资料搜集与分析工作,支持公开网页检索及企业内部私有数据调用,目前已通过付费版Gemini API向开发者开放预览,标志着AI工具从问答交互向复杂任务执行阶段升级。

6 小时前
2026年4月,AI初创公司NeoCognition正式走出隐身模式,宣布完成由Cambium Capital、Walden Catalyst Ventures领投,英特尔CEO基辛格等产业方知名人士参投的4000万美元种子轮融资。该公司将重点研发可自主构建“世界模型”的类人学习AI智能体,解决当前主流AI智能体复杂任务成功率仅50%的行业痛点,提升垂直场景适配与执行可靠性。

7 小时前
2026年4月,由俄亥俄州立大学教授余苏创立的AI智能体研究实验室NeoCognition正式走出隐身模式,宣布完成4000万美元种子轮融资。本轮融资由Cambium Capital、Walden Catalyst Ventures领投,英特尔首席执行官陈立步、Databricks联合创始人Ion Stoica等产业界资深人士跟投,资金将全部用于攻克当前AI智能体可靠性不足的行业痛点。

7 小时前
2026年4月22日,福布斯正式发布第八届全球AI50榜单,聚焦全球最具潜力的非上市人工智能企业。本届榜单共有20家新企业上榜,50家上榜企业总融资额达3056亿美元,其中头部厂商OpenAI、Anthropic累计融资2426亿美元,占总额近八成,凸显AI赛道资本向顶级玩家集中的明显趋势。