Andreas Unkelbach
Werbung


Montag, 3. Dezember 2012
06:50 Uhr

Medien (bspw. Bilder) aus DOCX extrahieren

Ausgangslage
Aus einer bestehenden umfangreichen Dokumentation (bspw. aus Word oder Powerpoint) sollen die eingebundenen Bilder entnommen werden (um diese bspw. in einer anderen Präsentation einzubinden). Dieses soll jedoch nicht mühsam über die Zwischenablage erfolgen (per Copy&Paste) erfolgen.

Lösung
Sofern es sich um ein aktuelles Office Format handelt (DOCX, XLSX pder PPTX) kann diese Dateiendung in ZIP umbenannt werden und dann innerhalb dieser Datei (entweder direkt, oder nachdem diese entpackt worden ist) die eingebundenen Medien direkt entnommen werden.

Hintergrund
Seit Office 2007 bietet Microsoft Office das Office Open XML als Standarddateiformat (Dateiendungen DOCX, XLSX, PPTX). Hierbei handelt es sich um Containerdateien die ein Dokument im XML Format abspeichert und alle eingebundene Medien ebenfalls als separate Bestandteile umfasst.
Innerhalb des Dokumentenverzeichnis werden alle Dokumentenbestandteile gespeichert.
Bei XLSX handelt es sich hierbei um XL, bei DOCX um word und bei PPTX um ppt.

Innerhalb dieser Ordner befindet sich ein Unterordner media und aus diesen können alle eingebundene Medien (bspw. Bilder) entnommen werden. Hierbei werden eingefügte Bilder als PNG Dateien hinterlegt.

Hierbei ist jedoch zu beachten, dass die eingebundenen Bilder je Medienformat durchgehend nummeriert worden sind.

Dieses kann jedoch von Vorteil sein, da die Reihenfolge der Nummerierung der Dateinamen auch entsprechend des Auftretens der eingebundenen Bilder innerhalb des Dokumentes entsprechen.

Neben den eingebundenen Medien sind auch alle anderen Bestandteile des Dokumentes in verschiedene Ordnern abgelegt.

Weitere Informationen zum Aufbau der Formate sind bspw. im Wikipedia Artikel Office Open XML erläutert.

Weitere Informationen zum Umgang mit Open XML Formaten in früheren Office Versionen bietet Microsoft unter office.microsoft.com an unter anderen kann hier das Microsoft Office Compatibility Pack für Word-, Excel- und PowerPoint 2007-Dateiformate heruntergeladen werden, welches ein Öffnen der Dokumente in älteren Office Versionen ermöglicht. Alternativ kann auch OpenOffice oder LibreOffice dafür verwendet werden.

Hinweis: Aktuelle Buchempfehlungen besonders SAP Fachbücher sind unter Buchempfehlungen inklusive ausführlicher Rezenssionen und Bestellmöglichkeit zu finden.
Espresso Tutorial - die digitale SAP Bibliothek

Tags: Winword

Ein Kommentar - - Office

Artikel datenschutzfreundlich teilen

🌎 Facebook 🌎 Twitter 🌎 Google
Diesen und weitere Texte von finden Sie auf http://www.andreas-unkelbach.de


Kommentare

Eberhard Schneider am 20.5.2013 um 23:46 Uhr


Auch kommentieren?


Beim Versenden eines Kommentars wird mir ihre IP mitgeteilt. Diese wird jedoch nicht dauerhaft gespeichert (siehe auch XII. Fremde Nutzung / Kommentarfunktion in der Datenschutzerklärung).

Eine Rückmeldung ist entweder per Schnellkommentar oder (weiter unten) als normalen Kommentar möglich. Eine persönliche Rückmeldung (gerne auch Fragen zum Thema) würde mich sehr freuen.

Schnellkommentar (Kurzes Feedback, ausführliche Kommentare bitte unten als normaler Kommentar)

Name (sofern kein Name angegeben wird erscheint Anonym):


Normaler Kommentar

Name:

E-Mail (wird nicht veröffentlicht):

Homepage:

Kommentar:


Hinauf




Werbung



Logo Andreas-Unkelbach.de
© 2004 - 2018 Andreas Unkelbach
Gießener Straße 75,35396 Gießen,Germany
andreas.unkelbach@posteo.de
Andreas Unkelbach

Stichwortverzeichnis
(Tagcloud)


Aktuelle Infos (Abo)

Facebook Twitter Google+

»Schnelleinstieg ins SAP Controlling (CO)« und »Berichtswesen im SAP ® ERP Controlling«
Privates

Kaffeekasse 📖 Wunschliste