网站截图
Onit Dictate是专为Mac设备打造的本地语音听写工具,是Wispr Flow的高性价比免费替代选择。工具核心优势在于所有转写、优化操作全程在本地运行,无需上传语音数据到云端,隐私安全性更强,转写响应速度极快。针对日常语音输入场景搭载了专属定制本地大模型,可直接输出符合使用规范的规整文本,适配办公、创作、编程等多场景需求,前5000名安装用户可享终身免费使用权益。
用户口述零散工作内容时,工具可自动去除“嗯、呃”等填充词,直接输出通顺的工作记录;口述邮件收件人信息时,可自动识别口语化表述并格式化为标准邮箱地址;口述会议时间调整需求时,可自动规范时间格式与沟通话术,直接生成可发送的正式沟通内容,无需二次调整。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 个月前
2026年4月7日,谷歌正式在iOS App Store上架AI语音转写应用Google AI Edge Eloquent,该应用面向用户免费开放且无使用次数限制,默认搭载本地Gemma ASR模型完成语音识别与文本整理,全程无需联网、数据不流出用户设备,同时支持切换至云端调用Gemini大模型进行文本润色,兼顾隐私安全与转写效果。

1 个月前
2026年4月3日,微软正式发布自研MAI系列第三款AI模型MAI-Transcribe-1,该语音转写模型在FLEURS基准测试中实现25种语言平均词错误率仅3.9%,11种核心语言转写精度登顶,性能优于OpenAI Whisper-large-v3、Google Gemini 3.1 Flash等同类产品,是目前全球精度最高的通用多语种语音转写模型。

8 小时前
国内大模型厂商DeepSeek近日宣布旗下旗舰级通用大模型服务价格下调75%,其模型性能在MMLU、GSM8K等多项国际通用基准测试中位列全球第一梯队,降价后单位Token推理成本仅为OpenAI GPT-4的1/20。此次调价被业内视为大模型商用落地的标志性事件,有望加速AI服务在中小企业、C端场景的普及,同时倒逼全球大模型厂商调整定价逻辑。

9 小时前
亚马逊近期发布旗下首款消费级AI可穿戴设备Bee,主打多模态场景感知能力,可实现实时语音转写、日程智能提醒、周边服务主动推送等功能,实测交互响应延迟低于0.3秒,服务匹配准确率达92%,但设备需持续采集周边环境音与位置数据的设计,也引发了行业对用户隐私安全的普遍讨论。

10 小时前
近期全球科技行业监测数据显示,2024年第三季度全球C端AI工具月活跃用户规模突破8.5亿,OpenAI GPT-5研发进展、谷歌Gemini多模态能力升级、DeepSeek开源模型放量、苹果Apple Intelligence端侧落地等事件成为行业核心关注焦点,AI agent、AI PC等新落地场景也进入规模化渗透前期,整个赛道的商业化节奏明显加快。

15 小时前
近日微软研究院推出终端原生网页智能代理框架Webwright,在通用网页任务测试集Odysseys中拿下60.1%的得分,较基础版GPT-5.4的33.5%提升近80%,同时在Online-Mind2Web测试中得分达86.7%,是当前网页代理领域性能最优的开源框架之一,为网页自动化、智能信息检索等场景落地提供了新的技术路径。

1 天前
腾讯于近期正式开源面向AI Agent的专属内存方案TencentDB Agent Memory,该项目采用MIT开源协议,基于OpenClaw与Hermes框架打造,创新性推出四层本地内存流水线架构,可大幅降低AI Agent的记忆调用延迟、提升长上下文处理稳定性,为AI Agent的落地应用提供了新的底层基础设施选项。

1 天前
近日有行业消息披露,谷歌、Meta、微软三家全球科技巨头正在采购由雇主端监控工具(Bossware)采集的海量员工办公行为数据,用于旗下大语言模型、办公AI助手等产品的训练优化。涉及数据包含打字记录、会议交流内容、任务处理流程等多维度信息,相关交易的合规性已引发科技伦理领域的广泛讨论。