Encuentra la respuesta que buscas

Nodo PDF Parse

El nodo PDF Parse se encuentra dentro de la categoría Nodos Parser. Este nodo se utiliza para extraer el texto de un archivo PDF.

▶En el siguiente video te contamos los parámetros para configurarlo: 


Debajo encuentra la descripción de los campos que utilizarás en el proceso, como te mostramos en el video👇

  1. Nombre (opcional): nombre del nodo, desde aquí puedes cambiar el valor predeterminado. 
  2. Base 64 string: deberás incorporar el archivo pdf en formato de texto plano base64.  
  3. Output path: nombre de la variable donde se almacenará el texto analizado.

▶Adicionalmente, en el resultado del nodo encontrarás los siguientes parámetros de salida:

  • numpages: la cantidad de hojas del PDF.
  • numrender: la cantidad de hojas renderizadas del PDF.
  • info: información complementaria del PDF (título, autor, fecha de creación, etc.).
  • metadata
  • version: versión de PDF.js (la librería que ejecuta el parseo).
  • text: el texto extraído del PDF.

➡Descarga el flujo con el ejemplo en este link 

Ten en cuenta: 

Si utilizas el ejemplo, incorpora un nodo Inject antes del nodo PDF Parse, que deberá contener el archivo codificado en base64.   

Este sitio web almacena cookies en tu computadora. Estas cookies se utilizan para recopilar información sobre cómo interactúas con nuestro sitio web y nos permite recordarte. Utilizamos esta información para mejorar y personalizar tu experiencia de navegación y para obtener estadísticas y métricas sobre nuestros visitantes tanto en este sitio web como en otros medios. Para obtener más información sobre las cookies que utilizamos, consulta nuestra Política de privacidad.

Si rechazas, tu información no será rastreada cuando visites este sitio web. Se usará una sola cookie en tu navegador para recordar tu preferencia de no ser rastreado.