Sieve是一家定位为「视频数据研究实验室」的专业服务商,核心用途是为各类AI应用提供合规、优质的视频素材与配套数据服务。它拥有数百PB规模的精心筛选视频库,覆盖维度远超部分同类窄场景数据平台,同时配套有清晰版权、专业标注的特色内容,能直接降低AI模型训练的数据筛选与处理成本,适配从基础视觉理解到复杂条件生成的各类AI研发场景。
在通用场景训练上,其大跨度场景、多元主体的视频素材可帮助视觉模型快速构建基础识别能力;在影视内容授权方面,其提供的叙事连贯、动作连续的影视片段可用于生成式AI的多帧连贯性训练;在媒体配对数据上,其密集的多模态(音频-视频-文字)标注能直接支撑条件化的视频生成、声音提取等AI功能落地。

1 天前
全球科技内容平台InfoWorld最新报道显示,当前计算机视觉领域正兴起“先数据筛选、后智能标注”的全新开发范式,该模式通过策略化数据选品与治理流程,可平均降低30%以上的标注成本,同时将AI模型开发效率提升至少45%,成为计算机视觉落地降本增效的核心路径之一。

1 天前
2026年4月1日,华语知名歌手周深发布古装奇幻剧《月鳞绮纪》主题曲《月之纪》,首发阶段即在歌曲前奏、电子版权页标注禁止用于AI训练及声线模仿的明确声明,成为国内首例发布即划定AI版权红线的音乐作品,标志着国内音乐人对声音权、创作主权的保护正式进入数字化防御新阶段,也为AI训练数据授权合规提供了全新参照。

2 天前
据MIT科技评论2026年4月报道,当前全球人形机器人产业训练数据缺口持续扩大,尼日利亚、印度等地大量零工通过头戴iPhone记录日常家务、手工操作等动作数据,为人形机器人运动模型提供训练素材,这种低成本灵活的供给模式,正在填补通用动作数据集不足的短板,也为全球零工经济开辟了新的细分领域。

8 天前
2026年3月25日,月之暗面创始人杨植麟在中关村论坛年会上公开提出,大模型训练已进入由AI主导的第三发展阶段,研发范式将从依赖人工标注、人工设计任务转向AI高度自动化自我进化,研发人员角色将转型为AI算力调度者,AI研发效率有望进入指数级加速期。旗下核心产品Kimi也将围绕这一路线联合开源社区共建协同进化生态。

8 小时前
谷歌近期正在推进端侧轻量化大模型Gemini Nano 4的终端适配工作,预计2025年第一季度发布的下一代安卓旗舰机型将率先搭载该模型。其端侧推理性能较上一代提升62%,支持离线语音交互、实时图像生成等12项新增本地AI功能,无需上传数据至云端即可完成运算,在隐私安全性、响应速度上均有显著提升。

8 小时前
近日一项智能体工作流落地实测显示,开发者通过搭建单款定制AI智能体,搭配开源免费工具与可直接复用的提示词模板,成功替换掉原有的月费150美元的SaaS工具栈,覆盖内容生成、日程管理、数据统计三类核心办公需求,实测运行30天无功能断层,为中小企业和个体开发者降低AI工具成本提供了可复制的落地路径。

9 小时前
2026年4月3日,美团技术团队正式发布原生多模态大模型LongCat-Next,该产品依托自主研发的DiNA(离散原生自回归)架构,突破传统“语言基座+插件”的拼凑式架构局限,实现图像、语音、文本的同源离散Token转化,视觉分词器压缩比达28倍,可原生实现对物理世界的“看”“听”能力,为多模态大模型发展提供了新的技术路径。

9 小时前
2026年4月3日,谷歌DeepMind正式开源推出旗下迄今最强开放大模型Gemma 4系列,共覆盖4种参数规模,最小版本仅2B参数可直接在手机端运行,且全系列支持免费商用。该系列单位参数性能远超参数规模达其20倍的同类模型,31B参数版本位列Arena AI文本排行榜全球开放模型第三位,高难度科学推理基准GPQA Diamond准确率达85.7%。