网站截图
Caption.IM是一款面向桌面端的AI实时字幕与语音输入工具,主打跨全场景的语音转写与翻译能力,目前已经获得Shopify、Vercel、Linear、Figma等多家海外知名企业团队的认可。该工具无需复杂配置即可适配任意桌面应用,核心解决线上会议、跨语言交流、音视频内容观看等场景下的语音信息获取痛点。相较于传统单一平台内置的字幕工具,其覆盖场景更广、转写准确率更高,支持多语言实时互译,能够大幅降低跨语言沟通门槛,提升语音信息处理效率。
在30人规模的跨境线上会议场景下,Caption.IM可同步捕捉会议软件的语音流,实时生成准确率98%以上的原语言字幕,同时可一键切换为法语、中文等50+语言的翻译字幕,延迟低于1秒,专业术语识别准确;在观看无字幕外文播客、讲座视频时,可自动生成悬浮同屏字幕,无需切换应用即可清晰获取语音内容;针对2小时以上的长时段课程录制场景,可完整记录全部语音内容,保留语气、停顿等表达细节,方便后续内容整理。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 个月前
2026年4月7日,谷歌正式在iOS App Store上架AI语音转写应用Google AI Edge Eloquent,该应用面向用户免费开放且无使用次数限制,默认搭载本地Gemma ASR模型完成语音识别与文本整理,全程无需联网、数据不流出用户设备,同时支持切换至云端调用Gemini大模型进行文本润色,兼顾隐私安全与转写效果。

1 个月前
2026年4月3日,微软正式发布自研MAI系列第三款AI模型MAI-Transcribe-1,该语音转写模型在FLEURS基准测试中实现25种语言平均词错误率仅3.9%,11种核心语言转写精度登顶,性能优于OpenAI Whisper-large-v3、Google Gemini 3.1 Flash等同类产品,是目前全球精度最高的通用多语种语音转写模型。

3 小时前
2026年5月,世界一级方程式锦标赛(F1)Scuderia Ferrari HP车队与科技巨头IBM达成技术合作,将基于IBM定制化AI交互系统重构赛事粉丝服务体系。双方已披露多套落地场景,预计可覆盖全球超2亿法拉利F1核心粉丝,将观赛互动转化率提升30%以上,同时为车队周边消费、会员运营提供全链路数据支撑。

4 小时前
近日,微软宣布调整Office套件的Copilot AI助手交互逻辑,新增悬浮Copilot按钮的手动关闭选项,解决了此前用户反馈的常驻悬浮键遮挡编辑区域、误触率高等问题。作为微软面向办公场景落地的核心AI工具,Copilot目前已覆盖Office全系列办公应用,全球付费企业用户规模已突破3000万,本次功能更新将进一步优化不同使用习惯用户的体验。

5 小时前
知名企业家埃隆·马斯克旗下人工智能公司xAI近期签订总金额超120亿美元的长期协议,全面转向天然气为AI算力供电,同时其执掌的SpaceX正加速推进轨道数据中心布局,二者动作均与马斯克早年提出的“全球太阳能电力经济”目标形成明显背离,引发行业对AI高能耗背景下能源选择逻辑的广泛讨论。

7 小时前
近日,AI开源研究机构Nous Research正式发布全新大模型调控技术对比神经元归因(Contrastive Neuron Attribution,简称CNA)。该技术无需进行稀疏自动编码器(SAE)训练,也不需要修改模型权重参数,仅通过消融稀疏MLP电路即可实现对大语言模型行为的精准控制,大幅降低了大模型对齐与功能定向修改的技术门槛与算力成本。

10 小时前
AI搜索企业Perplexity于近期宣布开源供应链安全工具Bumblebee,该工具基于Go语言开发,采用只读架构设计,可在不获取额外权限的前提下,精准扫描开发者端点的供应链包暴露风险,为全球开发团队防范软件供应链攻击提供了轻量化的开源解决方案,上线仅一周便获得GitHub超2000星的社区关注度。

18 小时前
2026年5月,谷歌面向全球全量用户推送搜索产品的AI功能迭代后,被曝出现罕见功能性漏洞:用户在搜索框输入英文关键词“disregard”检索时,会直接导致搜索界面加载失败、功能完全失效。该漏洞已在全球多个地区的PC端、移动端搜索场景复现,目前谷歌官方尚未作出公开回应,也未推送针对性修复补丁。