Automatische Content-Generierung

Auf dem Weg zu Single-Source kommt man an Crawlern fast nicht vorbei. Es geht um massenweise Content auf den FileServer. Zu jedem Produkt gibt es Dokumente ohne Ende. Ich habe es satt, jede Datei einzeln anzusehen und weiterzuverarbeiten. Deswegen bediene ich mich Maschinen, die durch das Dateisystem rasen und rauspicken was ich gerne habe.

Ein Beispiel ist eine Webseite für ein mittelständisches Unternehmen. Er hat mich mit Fotos und Videos vollgemüllt. Ich habe den Überblick verloren. Dann ging ich her und kategorisierte alles anhand seiner Produktpalette in eine Dateihierarchie. Dort wusste ich zumindest welches Produkt mit welchen Informationen und Bildern ausgestattet ist.

Es ging weiter, es sollte eine Internetpräsenz erstellt werden. Ein Onlineshop für ausgewählte Artikel war ebenfalls im Gespräch, jedoch nur halblebig, weil gewisse Distributoren die Oberhand behalten sollten und sein Hauptvertriebweg bleiben sollten.

Mein Crawler indizierte zu erst den Dateibaum, danach suchte es nach Schlüsselinformation in XML-Form. Diese wurden zu einer hierarchischen Homepage weiterverarbeitet. Eine Preis Information konnte hinzugefügt werden, schon baute der Crawler die entsprechende Shop-Seite.

Auch heute noch ist diese Maschine in abgewandelter Form bei mir in Betrieb. Ich habe sie bisher zweimal kommerziell verkaufen können. Big Data in klein. Ich baue aus Informationen Homepages oder Übersichten. Ich verarbeite jegliche Textform von .TXT-Dateien über .DITA oder auch das verschmähte .DOC-Format. Bilder werden automatisch auf Format gebracht, es gibt automatische Farbanpassungen um dem Homepagestil gerecht zu looken. Und vieles mehr.

Bei Interesse gerne Kontakt und ich schicke Ihnen ein unverbindliches Angebot. Gerne sehe ich mir vorort die Problematiken an und berate unabhängig. Nach 5 Jahren Erfahrungen mit XSLT sollte kein Datenformat ein Problem sein. Single-Source-kommt oben drein, denn aus Zentralinformationen formen wir die benötigten Filialdokumente, die die Prozesse in Firmen repräsentieren. Nichts wird mehr zwei Mal getippt. So sieht Computeren im Jahre 2019 aus.