Cloudflare上线Markdown for Agents 优化AI读取网页内容效率

10 小时前 AI快讯 1

Cloudflare上线Markdown for Agents 优化AI读取网页内容效率

当地时间2月12日,全球云服务巨头Cloudflare正式推出Markdown for Agents功能,从源头将网页的HTML格式内容转换为更适配AI爬虫与智能体的Markdown格式。这一举措直指当前AI读取网页内容的核心痛点——HTML结构化不足导致Token消耗过高,有望帮助内容方在生成式AI浪潮中抢占内容分发的主动权。

长期以来,网页内容的HTML格式都是为人类用户的浏览体验设计的,包含大量与核心信息无关的冗余元素:样式标签、导航栏、广告模块、互动按钮……这些元素对人类用户来说是浏览体验的一部分,但对AI爬虫和智能体而言,却是读取有效内容的“障碍”。AI要从杂乱的HTML中提取出核心文本,需要处理大量无关代码,直接导致Token消耗量激增。Cloudflare的内部测试数据显示,提取相同篇幅的核心博客内容,HTML格式所需的Token量是Markdown格式的6到8倍,这意味着AI调用成本也会随之攀升数倍。

在生成式AI成为主流信息获取渠道的今天,Token成本的高低直接影响着AI开发者是否愿意将某一网站的内容纳入训练数据集或实时调用范围。对于内容运营方而言,自己的内容能否被AI高效读取、准确理解,决定了其在AI生成的回答、推荐中是否能获得曝光,进而影响流量获取。此前,不少内容方为了让AI更好地抓取内容,要么手动将内容同步为Markdown格式发布,要么开发复杂的结构化数据标记系统,这对技术资源有限的中小网站来说门槛极高。

Markdown for Agents的出现,恰好解决了这一痛点。作为部署在网络边缘的云服务,Cloudflare可以在AI爬虫请求网页内容时,实时将HTML转换为干净的Markdown格式——只保留核心文本、标题层级、列表等结构化信息,自动过滤掉所有冗余的样式与交互元素。整个过程无需内容方做任何代码修改,仅需在Cloudflare控制台开启功能即可,大幅降低了内容AI友好化的技术门槛。

AI内容生态观察分析师张磊认为,Cloudflare此次推出的功能,标志着网页内容的“可机读性”正在成为与“可读性”同等重要的运营指标。“过去十年,网页设计围绕人类用户体验迭代;未来十年,网页内容的生产与分发必须兼顾AI的读取需求。Markdown for Agents不是一个孤立的功能,而是内容生态适配生成式AI的一个明确信号。”

从更宏观的角度看,这一功能也反映了生成式AI浪潮下的行业转向:此前不少网站通过robots.txt限制AI爬虫抓取内容,以保护版权或避免内容被滥用;但随着AI成为新的流量入口,越来越多的内容方开始主动优化内容的AI可访问性,希望借助AI扩大内容的传播范围。Cloudflare作为连接内容方与终端(包括AI终端)的中间层,其推出的标准化解决方案,将加速这一转向的进程。

对于AI开发者而言,Markdown for Agents带来的不仅是Token成本的降低,还有内容提取效率的提升。干净的Markdown格式让AI无需额外处理冗余信息,能更精准地理解内容的逻辑结构,生成的回答也会更贴合原内容的本意,减少信息偏差。

随着生成式AI与内容生态的融合持续深化,类似Markdown for Agents这样的基础设施服务会逐步成为行业标配。未来,网页内容的生产可能会从“单一人类友好”向“人机AI双友好”转变,这或将催生出全新的内容创作规范与分发机制,进一步重构数字内容的生态格局。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创