2019/10/25

Extrair imagens de documentos Office via ZIP


Se já se viram na ingrata situação de ter que descarregar dezenas de imagens de um documento do Office, poderão gostar de saber que o processo pode ser imensamente simplificado através de um pequeno truque: aceder ao ficheiro como se fosse um ficheiro zip comprimido.

Os documentos docx, xlsx, odt, etc. de programas como o Microsoft Office, LibreOffice, e OpenOffice são na realidade ficheiros XML comprimidos em zip. E é precisamente isso que nos permite cumprir o objectivo pretendido. Em vez de abrir o documento normalmente e depois percorrê-lo fazendo "gravar imagem" uma a uma, vamos aceder-lhes directamente.

Para isso, bastará mudar a extensão do ficheiro do documento, de modo a que se torne num ficheiro "zip". (Se tiverem o Windows a esconder as extensões dos ficheiros, será necessário mudar as definições do Explorer -> View -> e seleccionar "file name extensions" de modo a tornarem-se visíveis.)

No ficheiro em causa, trocar a extensão para "zip". Exemplo: documento.docx passa a documento.zip
(Por via das dúvidas, não será pior primeiro fazerem uma cópia do documento, só por segurança.)

Agora poderão simplesmente extrair o ficheiro zip, ou entrar dentro dele. E no seu interior irão descobrir que existe uma pasta com todas as imagens contidas no documento, que poderão ser facilmente copiadas para onde quiserem.


[via Ghacks]

3 comentários:

[pub]