파이썬에서 리샘플링하지 않고 PDF에서 이미지를 추출 하시겠습니까? 기본 해상도와 형식으로 pdf 문서에서 모든 이미지를 어떻게 추출 할 수 있습니까? (즉, tiff를 tiff, jpeg를 jpeg 등으로 추출하고 리샘플링하지 않음). 레이아웃은 중요하지 않습니다. 소스 이미지가 페이지에 있는지 상관 없습니다. 파이썬 2.7을 사용하고 있지만 필요한 경우 3.x를 사용할 수 있습니다. 종종 PDF에서 이미지는 그대로 저장됩니다. 예를 들어, jpg가 삽입 된 PDF는 추출 될 때 유효한 jpg 파일이되는 중간 어딘가에 바이트 범위가 있습니다. 이것을 사용하여 PDF에서 바이트 범위를 매우 간단하게 추출 할 수 있습니다. 얼마 전에 샘플 코드를 사용하여 이에 대해 썼습니다 . PDF에서 JPGs 추출 ...