2026年4月29日,字节跳动旗下AI编程平台TRAE正式在SOLO模式中上线高级语音输入功能,同时联合影石Insta360发布Mic Air TRAE联名无线麦克风套装。该组合可实现结构化转录、语义修正、语音控制AI命令等功能,推动Vibe Coding与语音办公落地,覆盖开发者及职场人群,进一步降低高效办公门槛。
对于不少开发者而言,每天坐在电脑前连续数小时敲击代码、反复调整prompt调试AI功能是工作常态,长时间的键盘输入不仅容易造成肩颈劳损,也往往打断思路的连贯性。而字节跳动此次推出的TRAE SOLO语音功能,恰好瞄准了这一痛点。
不同于市面上普通的语音转文字工具,TRAE SOLO此次上线的高级语音输入功能实现了多个维度的体验突破。它不仅能自动过滤用户口语中的语气词、卡顿停顿、无效表述,还能将逻辑零散的口语表达自动整理为结构清晰的书面内容。
更具突破性的是其语义理解能力:即便用户说话时出现错漏、临时补充、中途改口甚至语序混乱,AI也能精准识别核心语义,自动梳理为逻辑连贯的内容。除此之外,用户还可以直接通过语音发布AI指令,比如在编程场景下口头说出功能需求,系统就会直接生成对应代码,完全无需手动输入prompt。
为了进一步降低语音办公的场景限制,TRAE此次联合影石Insta360推出了Mic Air TRAE联名无线麦克风套装。依托Insta360在消费级音频硬件领域的技术积累,这款联名麦支持深度AI降噪,即便在开放办公区、咖啡馆、户外等嘈杂环境下,也能精准拾取用用户人声,大幅减少因为收音质量不佳导致的语义识别误差。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
15 分钟前
2026年4月29日,大模型厂商DeepSeek宣布启动全新“识图模式”灰度测试,该功能与现有“快速模式”“专家模式”并列,区别于普通OCR文字识别,可实现深度图像分析与描述,参与灰度测试的用户反馈其响应速度极快,目前功能仍处于完善迭代阶段,将为用户带来更高效的图像信息处理智能化体验。

16 分钟前
2026年4月OpenAI披露最新业务增长目标,预计2026年全年ChatGPT消费端订阅用户将突破1.22亿,核心增长动力为定价8美元/月的低价订阅服务ChatGPT Go。该服务自2025年8月起已覆盖171个国家和地区,定价远低于ChatGPT标准订阅套餐,是OpenAI推进产品大众化、抢占全球消费级AI市场的核心布局。

42 分钟前
2026年4月29日,美图公司宣布旗下影像AI Agent RoboNeo完成重大升级,推出行业首创的影像创作Agent Teams,将AI影像工具从单体应用升级为多智能体协同系统。该方案瞄准通用大模型泛化局限、创作者多工具切换内耗两大核心痛点,覆盖AI短剧、自媒体、电商内容创作等场景,为个人创作者、内容团队及“一人公司”提供全链路影像创作解决方案。

1 小时前
2026年4月29日公开的SuperCLUE最新文生图模型评测结果显示,OpenAI于4月21日上线的新一代文生图模型GPT Image 2,正式超越谷歌此前的榜首产品Nano Banana2登顶全球第一。该模型在画质、指令理解、细节还原维度均实现突破,尤其汉字生成板块获93.07分、文字准确度满分,解决了海外模型汉语文本生成的长期痛点。

3 小时前
2026年4月29日公布的OpenRouter全球大模型API调用量排行榜显示,腾讯旗下混元Hy3 preview模型凭借高频使用度超越一众国际竞品,拿下总榜第一,同时位居工具调用维度榜首、编程场景榜第二位。该成绩印证了全球开发者对其性能的认可,也标志着国产大模型在全球AI生态的影响力正加速提升。

3 小时前
2026年4月披露的运营数据显示OpenAI季度营收未达预期,引发周二美股科技板块短期承压,但一级市场投资者并未放缓对大模型赛道的出资节奏,核心竞品Anthropic因聚焦企业级服务受资本热捧,行业普遍认为当前AI竞赛仍处早期不会出现赢家通吃,提价策略有望缓解高算力成本带来的营收压力。

3 小时前
国家数据局2026年4月发布的最新预测数据显示,2025年中国人工智能领域训练与推理数据总量达199.48EB,同比增长42.86%,其中推理数据首次超过训练数据达101.34EB。此外2025年系统软件与AI生成数据总量达26.92ZB,首次超越传统物联感知数据量级,国内AI应用落地与产业渗透速度超出市场预期。

3 小时前
2026年4月29日,美国科技巨头谷歌正式与美国国防部签署合作协议,将自主研发的Gemini大模型开放给军方用于机密任务,调用其算力与多模态分析能力。双方已明确约定合作边界,禁止该技术被用于美国国内大规模监控及完全自主武器系统。此前美国国防部已与OpenAI、xAI达成同类合作,生成式AI正加速渗透国防核心场景。