网站截图
DeVoice是一款国外AI音视频处理工具,核心提供不限量音视频转文字服务,支持MP3、YouTube视频等多格式快速转录,精准度较高。同时集成AI背景噪音去除、语音增强功能,还具备AI语音合成能力,操作流程简单,无需复杂设置,可一站式解决多种音频处理需求。
短视频创作者/自媒体人,影视剪辑师,在校学生,职场办公人士
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
8 小时前
2026年5月21日,网易有道正式发布子曰大模型4.0全模态版本,宣布将核心27B多模态模型、语音合成(TTS)引擎全面开源。该版本中文纯文本数理难题准确率达81.4%,拿下同参数规模SOTA成绩,还实现3秒情感语音克隆,重构后的翻译模块同步实现质量与效率双升,将为AI教育领域开发者提供高适配性的开源底座。

5 天前
智能眼镜厂商Innovative Eyewear于2026年5月15日宣布旗下Lucyd应用完成重大更新,正式上线AI实时翻译通话功能,依托AI语音转录、原声线合成技术实现对讲机式双向母语交流,翻译语音可完整保留说话人音色特征,该功能落地也标志着智能眼镜赛道正从硬件比拼转向语音AI平台的生态博弈。

13 分钟前
近期谷歌正式面向消费级市场推出完整的AI代理生态规划,计划2026年年内上线超20款覆盖生活全场景的原生AI代理应用,同时向第三方开发者开放全栈适配接口。不过最新行业调研数据显示,目前仅32%的普通消费者愿意授权AI代理处理个人事务,这套酝酿已久的新生态落地前景仍存在不小的不确定性。

15 分钟前
近期国内工业铝锭现货价同比上涨20%,下游光伏、新能源汽车产业链的铝原料缺口持续扩大,多家资源回收赛道初创企业正在落地基于计算机视觉的AI分选系统,行业技术负责人李默透露,该套AI方案可将废铝识别回收率提升37%,大幅压缩传统人工分选的运营成本,有望在2027年形成千万吨级的稳定再生铝供给源。

19 分钟前
近日谷歌正式官宣,原本仅搭载在Pixel系列手机上的端侧AI功能Magic Cue将全面开放适配更多第三方应用。该功能依托谷歌Gemini端侧大模型实现上下文智能识别,预计2024年底将覆盖超20款安卓生态头部应用,用户无需跳转就能完成信息提取、快捷操作,大幅降低跨应用操作的交互成本。

49 分钟前
近期网络安全研究团队披露,海外匿名社区4chan内依托AI生成技术开展非伦理图像定制的从业者(圈内被称为“AI巫师”),近半年数量上涨370%。这类从业者依托基于开源Stable Diffusion微调的专属模型,仅需数分钟就能将普通日常照片转换为高度逼真的非授权裸照,单张定制报价从5美元到上百美元不等,现有主流平台的AI内容反滥用机制几乎完全失效。

1 小时前
全球半导体厂商AMD正式发布面向端侧AI场景的全新Ryzen AI Max 400系列处理器,最高可支持192GB统一内存容量,彻底打破过往移动端AI算力平台的内存瓶颈。该产品可直接本地运行70B甚至更大参数的开源大模型,首批适配的移动工作站产品预计2025年第二季度逐步放量,有望重构端侧AI硬件的现有竞争格局。

2 小时前
2026年5月21日,AI编程工具厂商Cursor正式推出完全自研的新一代编程专属大模型Composer 2.5,彻底摆脱此前对Claude系列的技术依赖。该模型实测编程性能追平当前行业头部产品Claude Code,定价仅为后者的十分之一,有望扭转此前Cursor被竞品抢占市场份额的不利局面。