MyTetra Share
Делитесь знаниями!
Как в Python подсчитать количество страниц в PDF-файле
Время создания: 03.02.2015 11:02
Текстовые метки: python, PDF, количество страниц
Раздел: Компьютер - Программирование - Язык Python
Запись: xintrea/mytetra_syncro/master/base/1422950571nri19telg2/text.html на raw.github.com

Для подсчета количества страниц в файле формата PDF, можно воспользоваться таким скриптом:


# Подсчет количества страниц в PDF файле

fileName='file.pdf'

pdfText=''


with open(fileName, 'rb') as fileIn:

pdfText = fileIn.read()


rePages = re.compile(r'/Page/\w')

pagesCount=len( rePages.findall(pdfText) )

print 'Count: ' + str(pagesCount)


Здесь используется тот факт, что в формате PDF каждая страница предваряется заголовком, содержащим примерно следующий текст:


<</Type/Page/Contents 4 0 R/MediaBox[0 0 1188 842]/Resources 6 0 R/Parent 1 0 R>>


Так же в этом разделе:
 
MyTetra Share v.0.59
Яндекс индекс цитирования