网站截图
Spoke是专为macOS系统打造的原生语音处理工具,核心定位是为苹果用户提供高隐私、高响应速度的语音能力支持。它所有运算都在设备本地完成,无需上传数据到云端,彻底规避语音数据泄露风险,同时无需订阅即可使用。相比同类云端语音转写工具,Spoke隐私性更强、响应速度更快,无网络也可正常使用,适配各类需要语音操作的办公、开发场景。
用户口述会议内容时,Spoke可实时转写为精准文字,识别准确率不受网络波动影响;开发者口述代码指令,Spoke可直接触发对应IDE操作,无需手动敲击键盘;用户口述待办事项,Spoke可自动同步到系统待办清单,完成事项添加、提醒设置等操作,全程无延迟、无数据上传。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
11 天前
先说个真事 上周朋友准备考研,问我有没有好用的思维导图工具。我把手机里装的几个APP翻出来数了数,好家伙,不知不觉用了七八款。 他说:“你别跟我报菜名,直接告诉我哪个好用。” 我想了想,这事儿还真没法一句话说清。你用来复习考试,跟老板用来画项目规划,能是同一个工具吗? 干脆花了几天时间,把市面上主流的在线脑图工具重新捋了一遍,写成这篇。不管你是学生、上班族、...

1 个月前
2026年4月7日,谷歌正式在iOS App Store上架AI语音转写应用Google AI Edge Eloquent,该应用面向用户免费开放且无使用次数限制,默认搭载本地Gemma ASR模型完成语音识别与文本整理,全程无需联网、数据不流出用户设备,同时支持切换至云端调用Gemini大模型进行文本润色,兼顾隐私安全与转写效果。

1 个月前
2026年4月7日,网易有道正式推出旗下首个AI知识库产品「有道宝库」。该产品主打海量文档深度管理与智能再创作能力,支持全格式文档上传、对话式信息提取,可基于上传素材一键生成播客脚本、PPT提纲、研究报告等内容,旨在为个人及企业用户打造可主动生成内容的「会思考的数字资料库」。

1 个月前
2026年4月3日,微软正式发布自研MAI系列第三款AI模型MAI-Transcribe-1,该语音转写模型在FLEURS基准测试中实现25种语言平均词错误率仅3.9%,11种核心语言转写精度登顶,性能优于OpenAI Whisper-large-v3、Google Gemini 3.1 Flash等同类产品,是目前全球精度最高的通用多语种语音转写模型。

8 小时前
国内大模型厂商DeepSeek近日宣布旗下旗舰级通用大模型服务价格下调75%,其模型性能在MMLU、GSM8K等多项国际通用基准测试中位列全球第一梯队,降价后单位Token推理成本仅为OpenAI GPT-4的1/20。此次调价被业内视为大模型商用落地的标志性事件,有望加速AI服务在中小企业、C端场景的普及,同时倒逼全球大模型厂商调整定价逻辑。

9 小时前
亚马逊近期发布旗下首款消费级AI可穿戴设备Bee,主打多模态场景感知能力,可实现实时语音转写、日程智能提醒、周边服务主动推送等功能,实测交互响应延迟低于0.3秒,服务匹配准确率达92%,但设备需持续采集周边环境音与位置数据的设计,也引发了行业对用户隐私安全的普遍讨论。

10 小时前
近期全球科技行业监测数据显示,2024年第三季度全球C端AI工具月活跃用户规模突破8.5亿,OpenAI GPT-5研发进展、谷歌Gemini多模态能力升级、DeepSeek开源模型放量、苹果Apple Intelligence端侧落地等事件成为行业核心关注焦点,AI agent、AI PC等新落地场景也进入规模化渗透前期,整个赛道的商业化节奏明显加快。

15 小时前
近日微软研究院推出终端原生网页智能代理框架Webwright,在通用网页任务测试集Odysseys中拿下60.1%的得分,较基础版GPT-5.4的33.5%提升近80%,同时在Online-Mind2Web测试中得分达86.7%,是当前网页代理领域性能最优的开源框架之一,为网页自动化、智能信息检索等场景落地提供了新的技术路径。