跳到主要内容

从文件中提取#

在n8n工作流中,常见模式是接收文件——可能来自HTTP请求节点(用于从网站获取文件)、Webhook节点(用于接收外部发送至工作流的文件)或本地源。通过此方式获取的数据通常为二进制格式,例如电子表格或PDF文件。

从文件中提取节点能够从二进制格式文件中提取数据,并将其转换为JSON格式,便于工作流后续环节进行处理。若需将JSON转换回二进制文件类型,请参阅转换为文件节点。

操作类型#

通过操作类型下拉菜单选择待提取数据的源文件格式:

  • 从CSV提取:适用于处理表格数据的"逗号分隔值"文件类型
  • 从HTML提取:从标准网页HTML格式文件中提取字段
  • 从JSON提取:从二进制文件中提取JSON数据
  • 从ICS提取:处理iCalendar格式文件的字段提取
  • 从ODS提取:从ODS电子表格文件中提取字段
  • 从PDF提取:处理便携式文档格式文件的字段提取
  • 从RTF提取:从富文本格式文件中提取字段
  • 从文本文件提取:处理标准文本文件格式的字段提取
  • 从XLS提取:从旧版Microsoft Excel文件中提取字段
  • 从XLSX提取:从Microsoft Excel文件中提取字段
  • 将文件转为Base64字符串:将二进制数据转换为文本友好的base64格式

工作流示例#

本示例使用Webhook节点触发工作流。当CSV文件发送至webhook地址时,文件数据将由"从文件中提取"节点接收并输出。

查看工作流文件

节点设置为"从CSV提取"操作模式后,会将数据输出为一系列JSON行对象:

{ "row": { "0": "apple", "1": "1", "2": "2", "3": "3" } ...

使用 Webhook 接收文件

点击 Webhook 节点的 添加选项 按钮并选择 原始主体,随后启用该设置以使节点输出后续节点所需的二进制文件。

节点参数#

输入二进制字段#

输入节点输入数据中包含二进制文件的字段名称。默认为 "data"。

目标输出字段#

输入节点输出中将包含提取数据的字段名称。

此参数仅适用于以下操作:

  • 从 JSON 提取
  • 从 ICS 提取
  • 从文本文件提取
  • 将文件移动为 Base64 字符串

模板与示例#

构建您的首个 WhatsApp 聊天机器人

作者:Jimleuk
查看模板详情

从 PDF 文件提取文本

作者:amudhan
查看模板详情

从多个网页抓取并存储数据

作者:Miquel Colomer
查看模板详情

浏览“从文件提取”集成模板,或搜索所有模板