从文件中提取#
在n8n工作流中,常见模式是接收文件——可能来自HTTP请求节点(用于从网站获取文件)、Webhook节点(用于接收外部发送至工作流的文件)或本地源。通过此方式获取的数据通常为二进制格式,例如电子表格或PDF文件。
从 文件中提取节点能够从二进制格式文件中提取数据,并将其转换为JSON格式,便于工作流后续环节进行处理。若需将JSON转换回二进制文件类型,请参阅转换为文件节点。
操作类型#
通过操作类型下拉菜单选择待提取数据的源文件格式:
- 从CSV提取:适用于处理表格数据的"逗号分隔值"文件类型
- 从HTML提取:从标准网页HTML格式文件中提取字段
- 从JSON提取:从二进制文件中提取JSON数据
- 从ICS提取:处理iCalendar格式文件的字段提取
- 从ODS提取:从ODS电子表格文件中提取字段
- 从PDF提取:处理便携式文档格式文件的字段提取
- 从RTF提取:从富文本格式文件中提取字段
- 从文本文件提取:处理标准文本文件格式的字段提取
- 从XLS提取:从旧版Microsoft Excel文件中提取字段
- 从XLSX提取:从Microsoft Excel文件中提取字段
- 将文件转为Base64字符串:将二进制数据转换为文本友好的base64格式
工作流示例#
本示例使用Webhook节点触发工作流。当CSV文件发送至webhook地址时,文件数据将由"从文件中提取"节点接收并输出。
节点设置为"从CSV提取"操作模式后,会将数据输出为一系列JSON行对象:
{ "row": { "0": "apple", "1": "1", "2": "2", "3": "3" } ...
使用 Webhook 接收文件
点击 Webhook 节点的 添加选项 按钮并选择 原始主体,随后启用该设置以使节点输出后续节点所需的二进制文件。
节点参数#
输入二进制字段#
输入节点输入数据中包含二进制文件的字段名称。默认为 "data"。
目标输出字段#
输入节点输出中将包含提取数据的字段名称。
此参数仅适用于以下操作:
- 从 JSON 提取
- 从 ICS 提取
- 从文本文件提取
- 将文件移动为 Base64 字符串
模板与示例#
构建您的首个 WhatsApp 聊天机器人
作者:Jimleuk
查看模板详情
从 PDF 文件提取文本
作者:amudhan
查看模板详情
从多个网页抓取并存储数据
作者:Miquel Colomer
查看模板详情