本工具用于将包含 HTML 的文本剥离为可读取的纯文本,或在安全范围内仅保留指定的标签(白名单)。适合清洗抓取内容、导出文章摘要、生成 SEO 元描述、或将富文本转为更易处理的格式。
- 使用场景:清理网页复制的内容、生成纯文本版本、在保留加粗/斜体/代码等基础样式的前提下去除复杂结构。
- 处理模式:“全部去标签”输出纯文本;“保留白名单标签”仅保留您选择的安全标签,其余标签剥离但保留其内部文本。
- 白名单标签:勾选常用标签(如 b/strong/i/em/code/pre/p/span/br 等),并可通过逗号添加自定义标签。出于安全考虑默认不保留 a 的链接属性。
- 换行处理:可将 <br> 与段落标签视为换行,避免文本连成一行,提升可读性。
- 空白压缩:可将连续空白压缩为单个空格,并在最终输出时进行首尾修剪。
- 隐私说明:仅在本地浏览器运行,刷新即清空。
所有处理均在浏览器本地完成;不发起网络请求。刷新页面会清空数据,保护您的隐私。