关于HTML 转文本
HTML 转文本工具把 HTML 内容转换成带基本格式的纯文本。它去除所有标签,同时智能保留结构:<h1>-<h6> 标题、<p> 段落、<li> 列表项(转为 • 符号)、<br> 换行都会合理转换成文本格式,<script> 和 <style> 内容会被删除,HTML 实体还原成普通字符。比简单的「HTML 标签过滤」更注重保留可读结构。常用于从网页提取正文、转换邮件、文档格式转换等。
常见使用场景
- 从完整网页提取正文
- 转换 HTML 邮件为纯文本
- 网页内容转文档
- 清理富文本保留结构
常见问题
- 和 HTML 标签过滤工具有什么区别?
- 本工具更注重保留结构:标题、段落、列表会转换成对应的文本格式,而标签过滤工具只做简单的标签去除。
- 会保留链接地址吗?
- 默认只保留链接文字,不保留 URL。如果需要保留 URL,可以先用其他方式提取。