¿Existe algún módulo que tenga la función de leer un archivo PDF?
Algo parecido a:
Código: Seleccionar todo
from PyPDF2 import PdfFileReader
Saludos
Código: Seleccionar todo
from PyPDF2 import PdfFileReader
Código: Seleccionar todo
from PyPDF2 import PdfFileReader
from collections import defaultdict
import os, string, uno
oDoc = XSCRIPTCONTEXT.getDocument()
# Función que coloca el nombre de los archivos PDF en una columna
def main(a):
num = 1
oSheet = oDoc.CurrentController.ActiveSheet
for i in archivos():
oCell = oSheet.getCellRangeByName("A" + str(num))
oCell.setString(i)
num += 1
return None
# Función que devuelve los archivos .PDF de la carpeta del path
def archivos():
path = "C:/Python"
lstFiles = []
lstDir = os.walk(path)
for root, dirs, files in lstDir:
for fichero in files:
(nombreFichero, extension) = os.path.splitext(fichero)
if(extension == ".pdf"):
lstFiles.append(nombreFichero+extension)
return lstFiles