跳到主要内容

HTML#

HTML节点提供在n8n中处理HTML的操作功能。

HTML提取节点

自0.213.0版本起,HTML节点已取代HTML提取节点。如果您使用的是旧版n8n,仍可查看HTML提取节点文档

跨站脚本风险

使用HTML节点生成HTML模板时可能引发XSS(跨站脚本)攻击。此为安全风险,请谨慎处理不可信输入。

操作#

节点参数和选项取决于所选操作。各操作的详细配置请参阅以下章节。

生成HTML模板#

创建HTML模板,将工作流数据输出为HTML格式。

可包含内容:

  • 标准HTML
  • <style>标签内的CSS
  • <script>标签内的JavaScript(n8n不会执行JavaScript代码)
  • {{}}包裹的表达式

模板中可使用表达式,包括n8n内置方法和变量

提取HTML内容#

从HTML格式的源数据中提取内容,支持JSON或二进制文件(.html)。

参数配置:

源数据#

选择HTML内容的源类型:

  • JSON:选择此源数据时,需填写JSON属性——包含待提取HTML的输入字段名称,该属性可包含字符串或字符串数组
  • 二进制:选择此源数据时,需填写输入二进制字段——包含待提取HTML的输入字段名称,该属性可包含字符串或字符串数组

提取值#

  • :设置保存提取值的键名
  • CSS选择器:输入要查找的CSS选择器
  • 返回值:选择返回数据类型:
    • 属性:返回元素的属性值(如class
      • 选择此选项需填写要返回值的属性名称
    • HTML:返回元素包含的HTML代码
    • 文本:返回元素的文本内容
      • 选择此选项可在跳过选择器中输入逗号分隔的选择器列表以跳过特定元素
    • :返回输入框、选择框或文本区域的值
  • 返回数组:选择是否将多个提取值以数组形式返回(开启)或单字符串形式返回(关闭)

提取HTML内容选项#

可选配置项:

  • 修剪值:控制是否移除值首尾的所有空格和换行符(开启)或保留原格式(关闭)
  • 清理文本:控制是否移除首尾空白符和换行符,并将连续多个空格合并为单个空格(开启)或保持原样(关闭)

转换为HTML表格#

此操作需接收来自其他节点的数据,无参数配置,包含以下选项:

  • 标题大写:控制是否将表头转为大写(开启/关闭)
  • 自定义样式:控制是否使用自定义样式(开启/关闭)
  • 标题:为表格添加标题文字
  • 表格属性:输入要应用于<table>的属性(如样式属性)
  • 表头属性:输入要应用于表头<th>的属性
  • 行属性:输入要应用于表格行<tr>的属性
  • 单元格属性:输入要应用于表格单元格<td>的属性

模板与示例#

使用AI抓取并总结网页 by n8n团队 查看模板详情

从n8n未预置集成的服务中提取数据 by Jonathan 查看模板详情

自动化网页抓取:发送CSV邮件,保存至Google Sheets和Microsoft Excel by Mihai Farcas 查看模板详情

浏览HTML集成模板搜索所有模板