Tenes que considerar que si el pdf es escaneado vas a necesitar un ocr, ya que el módulo funciona únicamente para los pdfs que no son escaneados, suerte.
Depende, si viene de google drive, podes utilizar el módulo que se encuentra en el marketplace de rocketbot y descargarlo de ahi. De lo contrario, al ser un link generico, podes usar un script de python para descargarlo.
Para extraer el contenido podes utilizar el módulo que lee el contenido (igual lo encontrás en el marketplace)
raulrickysosa
Usando este módulo por ejemplo Download – Rocketbot MARKET . Tenés que instalarlo antes.
JoseL
Depende, si el pdf viene de google drive, podes utilizar el módulo que existe para ello y descargarlo con el comando, el link del módulo es este:
https://market.rocketbot.com/module/gdrive
Ahora, si el link viene desde un lugar generico, podes utilizar un script de python. Podes basarte en este link. https://code.tutsplus.com/es/how-to-download-files-in-python–cms-30099t o si tenes el link, mandalo y acá te podemos ayudar.
Con respecto a la extracción del contenido, podes usar este módulo:
https://market.rocketbot.com/module/DocReader
Tenes que considerar que si el pdf es escaneado vas a necesitar un ocr, ya que el módulo funciona únicamente para los pdfs que no son escaneados, suerte.
lucia.lisdero@softtek.com
tambien me sirve guardar el contendio del pdf como txt
JoseL
Depende, si viene de google drive, podes utilizar el módulo que se encuentra en el marketplace de rocketbot y descargarlo de ahi. De lo contrario, al ser un link generico, podes usar un script de python para descargarlo.
Para extraer el contenido podes utilizar el módulo que lee el contenido (igual lo encontrás en el marketplace)