datenverdrahten.de

Webpräsenz von Dr. Thomas Meinike
<Autor_Entwickler_Lehrender/>

Startseite

Willkommen auf dieser Website!

Nachricht vom 16.11.2019

20 Jahre XSLT: Vor 20 Jahren erschien die initiale Spezifikation von XSLT 1.0 und damit wurden auch für mich die folgenden beiden Dekaden eingeleitet. Die Transformations-Syntax für die hauptsächliche Verarbeitung von XML-Dokumenten war in ihrer Akzeptanz von Anfang an ambivalent und polarisierend. Wer in Branchen wie der Technischen Kommunikation oder in den Digitalen Geisteswissenschaften unterwegs ist, weiß grundsätzlich, welche Relevanz dieser Technologie und der damit untrennbar verbundenen Abfragesprache XPath zukommt. Beide sind nicht unbedingt leicht vermittelbar, aber mit Interesse und Weitblick gerade für Studierende der genannten Disziplinen eine Chance für das künftige Berufsleben.

An dieser Stelle soll keine Bestandsaufnahme der Entwicklung von XSLT bzw. XPath bis zu den aktuell vorliegenden Versionen 3.0 / 3.1 erfolgen. Darüber kann man sich im Netz und einer Reihe von guten Büchern umfassend informieren. Wichtig ist mir allerdings all jenen zu danken, die an der Entwicklung mitgearbeitet haben, sehr speziell Michael Kay (Saxonica), Editor der XSLT-Spezifikationen, Buchautor und Produzent des populären und leistungsstarken XSLT-Prozessors »Saxon«, dem Team von SynRO Soft SRL für den hochproduktiven XML-Editor <oXygen/> und die hervorragende akademische Unterstützung sowie zahlreichen Kolleg*innen aus der Praxis einschließlich unseren Absolvent*innen, die das Thema und den Austausch darüber aktiv mitgestalten. Als Ausblick und Inspiration für eigene Anwendungen verweise ich noch auf das in dieser Woche auf der tekom-Jahrestagung 2019 gehaltene Tutorial »Rechnen, Runden, Rekursion – das numerische Potenzial von XSLT«. Darin werden in den abgesteckten Rahmen passende operative XSLT- und XPath-Techniken anhand von ausführlichen Beispielen demonstriert. Das Material steht auch zum Download bereit.

Nachricht vom 31.08.2019

WINFO meets XML: Im Sommersemester 2019 hatte ich an der Hochschule Merseburg die Möglichkeit, einen Wahlpflichtkurs »XML-Technologien« für den Master-Stundengang Wirtschaftsinformatik zu halten. Es war eine durchaus interessante Erfahrung, Studierenden mit viel IT-Vorerfahrung Themen zu vermitteln, die im Wesentlichen noch nicht in den zuvor belegten Bachelor-Studiengängen vorkamen. Im Grunde verlief die Lernkurve zunächst ebenso steil wie von Kursen im Bereich Technische Redaktion gewohnt, also XML-Aufbau, Datenmodellierung mit DTD und XML-Schema bis hin zu den produktiven Transformationen mit XSLT.

Für die bereits durch C, Java, Python und Co. gestählten Studierenden war XSLT zwar kein Angstgegner, aber erwartungsgemäß eine neue Herausforderung, was sich beim Umsetzen der Klausuraufgabe in Form einer praktischen Prüfung bestätigte. Zu meiner Überraschung führte die eingebaute kleine programmatische Klippe zum Dranbleiben bis zur 90. Minute, um keine Punkte zu verschenken. Das zahlte sich im Ergebnis entsprechend aus. Flankierende Aspekte wie DITA, DocBook, EPUB, MathML, RSS, SVG, XSL-FO und die Interna der Office-Formate, sollten die Teilnehmenden zumindest auf ein Teillevel gebracht haben, welches in der späteren Summe ihres Studiums etwa den Erwartungen der Firma DOCUFY entspricht. Danke an die Gruppe für dieses nicht alltägliche Lehrerlebnis!

Nachricht vom 01.03.2019

XML-Nerds in Halle: Es begann am 26.02. mit einem Zufallsfund auf Twitter, der mich auf die vom 25.02. bis 01.03.2019 in Halle veranstaltete »Winter School Digitale Editionen« aufmerksam machte. Die so genannten Digital Humanities (DH) sind mir durchaus bekannt, insbesondere durch die dort erfolgende Nutzung der XML-basierten Text Encoding Initiative (TEI) zur Erfassung und Auszeichnung von im weitesten Sinne geisteswissenschaftlichen Werken. Nach Rückfrage bei Prof. Patrick Sahle, einem der Veranstalter vom Institut für Dokumentologie und Editorik (IDE) – allein dieser Name ist schon großartig, habe ich mich am späten Nachmittag spontan zum letzten Vortrag des Tages in einen Tagungsraum der Leopoldina begeben. Dort befassten sich die Teilnehmenden die ganze Woche lang produktiv mit der Syntax von TEI sowie angrenzenden Technologien wie XSLT, XPath, Datenbanken usw.

Das zu sehen war schon sehr beeindruckend und noch erstaunlicher war zu erfahren, dass es in Halle eine kleine, aber feine DH-Szene mit regelmäßigen Stammtischen gibt. An diesem Abend fand direkt ein solcher statt und ich durfte am Fachsimpeln von u. a. Historikern teilhaben. Auch sehr erfreulich für mögliche wissenschaftliche Kooperation ist die relativ neue Arbeitsgruppe »eHumanities« im Bereich Informatik der Uni Halle. Am 28.02. gab es noch einen bemerkenswerten öffentlichen Abendvortrag zu »DER STURM« als digitale Edition. Die Referentin Marjam Trautmann berichtete über das im Rahmen ihrer Masterarbeit initiierte Projekt. Auch hier zeigte sich wieder der furchtlose Umgang mit XML & Co. in diesen Fachdisziplinen. Danach gab es nochmals einen geselligen Abend mit Heimvorteil. Danke an Dr. Torsten Roeder et al. für die mir als Zaungast gewährten Einblicke und die Vorfreude auf weitere #DHAL-Stammtische!

Nachricht vom 10.01.2019

Der Congress: Nach dem Verfolgen der Live-Streams etlicher Iterationen vom jährlich stattfindenden Chaos Communication Congress wurde Ende 2018 der längst überfällige Besuch einer solchen Veranstaltung in Form des 35C3 auf der Leipziger Messe (CCL) Realität. Das in jede Richtung interpretierbare Motto lautete »Refreshing Memories«. Die Struktur der Vortragsangebote zu Technologie, Security, Netzpolitik & Co. mit bestimmten Highlights vom Jahresrückblick des CCC bis zu den Security Nightmares brauchte keine besondere Eingewöhnung und zur allgemeinen Orientierung bot sich bereits am Tag 0 ein Rundgang an. Allerdings ist dieser Congress wirklich groß und dennoch hervorragend organisiert. Auch wenn dort bis zu 17000 Menschen unterwegs gewesen sein sollen, habe ich das nicht als Problem wahrgenommen. Es gab kein nerviges Gedrängel oder sonstige unschöne Nebeneffekte beim Besuchen von Talks oder der Hallen mit den vielfältigen Assemblies.

Zu sehen waren erwartungsgemäß viele kreative Projekte, blinkende oder tönende Installationen und auch besondere Orte wie das Sendezentrum zogen das Publikum an. Dort ergaben sich einige Gespräche mit Machern von bereits lange gehörten populären Podcasts wie Tim Pritlove, Holger Klein, Nicolas Wöhrl und Martin Rützler. Podcasterinnen waren natürlich ebenso vertreten, nur in den Momenten des Vorbeischauens gerade keine der mir bekannten. Vor Ort standen neben den genannten Klassikern weitere Talks zu Themen wie Deep Learning, Augmented Reality, Computerinterna des Mars-Rovers, Datenanalye und empirischer statistischer Forschung auf dem Programm. Etliche weitere wurden bereits oder werden noch via Video-Konserve nachgeholt. Auch das persönliche Treffen von Bekannten und Mitstreitern aus dem eigenen IT-Umfeld rundete dieses tolle Event ab.

Nachricht vom 17.11.2018

#tekom18: Auch die tekom-Jahrestagung 2018 ist nun Geschichte und es war wieder eine besondere Veranstaltung. Zum fünften Mal auf der Messe Stuttgart (ICS) ausgerichtet, bot sich die übliche Klassenfahrt-Atmosphäre im Umfeld von Technischer Redaktion und Informationsentwicklung. Ich hielt zunächst einen Kurzvortrag auf der Arena Lernmedien zum Einplatinencomputer »Calliope mini«, der im Sommersemester 2018 im Rahmen eines Kurses mit dem Fokus auf JavaScript-Programmierbarkeit ausprobiert werden konnte.

Etwas schwergewichtiger fiel mein Beitrag zur »Verarbeitung von JSON-Daten mit aktuellen XSLT-Techniken« aus. Nach dem Aufzeigen benötigter Grundlagen wurde eine praktische Anwendung demonstriert, welche den öffentlichen Datensatz der in München verfügbaren Parkhäuser verwendet. Darin sind neben allgemeinen Ortsdaten auch die jeweiligen Geokoordinaten enthalten, die sich mit dem freien Kartendienst OpenStreetMap besonders praktikabel visualisieren lassen. Die Resonanz der Teilnehmenden war sehr erfreulich. Besonders der Fachvortrag vor vollem Haus war Lohn genug für die über mehrere Monate verteilte Entwicklungsarbeit. Sämtliche Vortragsmaterialien wie Folien und Code stehen zum Download bereit. Gelegenheit fürs Networking u. a. mit vielen Alumnis unserer Studiengänge sowie Messeausstellern blieb natürlich ebenfalls. Siehe auch diesen Blog-Artikel. <👍/>

Nachricht vom 27.08.2018

Talks in progress: Die Ankündigung zu meinem für die tekom-Jahrestagung 2018 in Vorbereitung befindlichen Fachvortrag fasst dessen Intention zusammen: »XSLT gehört zu den klassischen Technologien zur Verarbeitung von XML-Inhalten. Mit den umfangreichen Erweiterungen von XSLT 3.0 und XPath 3.1 stehen jedoch auch Techniken für den Zugriff auf JSON-kodierte Daten zur Verfügung. Von Organisationen und Verwaltungen werden zunehmend solche Datensätze als Open Data publiziert. Der Vortrag beschreibt die wesentlichen Verarbeitungsansätze und demonstriert dynamische Abfragen ausgewählter Daten unter Verwendung des im Browser lauffähigen Prozessors Saxon-JS.« Eine passende Beispielanwendung wurde in den heißen Augustwochen entwickelt und der übliche Artikel für den Tagungsband liegt vor.

Zusätzlich steuere ich einen Beitrag zur neuen Arena Lernmedien bei, der sich dem Einsatz des Einplatinen-Computers »Calliope mini« widmet. Die verfügbaren technischen Möglichkeiten und sein Potenzial hinsichtlich der Programmierung mit JavaScript machen das Gerät auch im Bereich der studentischen Ausbildung interessant. Verschiedene Sensoren lassen sich ansprechen, u. a. kann die Raumtemperatur bestimmt werden. Die #tekom18 findet vom 13. bis 15. November wieder auf der Messe Stuttgart statt.

Nachricht vom 10.02.2018

20 Jahre XML ♥: Die wegweisende Entdeckung nach den ersten Versuchen mit HTML zur Erstellung von Websites (in den Jahren des Browserkrieges ;) war für mich XML. Direkt nach Einführung 1998 gab es nicht viel zu sehen, außer etwas Code in einfachen Editoren. Ja, in den ersten Kursen im Bereich Technische Redaktion (TR) mühten sich die Studierenden mit XML-, DTD- und XSLT-Code etwa in Notepad. Validierungen und Transformationen erfolgten an der Kommandozeile, was auch heute noch keine schlechte Idee ist. Allerdings haben sich sowohl die technologischen Möglichkeiten als auch die Werkzeuge stark erweitert bzw. verbessert.

Gerade die TR-Branche hat von XML & Co. sehr profitiert. Etablierte Standards wie DocBook und DITA bilden nur einen kleinen Ausschnitt aus dem mittlerweile riesigen XML-Universum ab, stellen jedoch auch weiterhin gute Konzepte für die Beschäftigung mit den Möglichkeiten strukturierter Dokumentation dar. Über fast zwei Jahrzehnte sind in Kooperation mit Praxispartnern zahlreiche überwiegend lösungsorientierte Abschlussarbeiten – häufig mit XML-Bezug – entstanden. Weitere interessante Projekte bahnen sich an. Die persönliche Entwicklung auf diesem Arbeitsgebiet lässt sich am besten an einer Reihe von Publikationen mit Schwerpunkten wie SVG und XSLT ablesen. In diesem Sinne: Happy 20th birthday, XML!

Nachricht vom 31.10.2017

#tekom17: Die vom 24. bis 26. Oktober im ICS Stuttgart veranstaltete tekom-Jahrestagung 2017 erwies sich erwartungsgemäß als Klassentreffen der Technischen Redakteure, Informationsentwickler und Übersetzer sowie angeschlossener Dienstleister. Ein Schwerpunktthema war der von der tekom im Kontext von Industrie 4.0 vorangetriebene iiRDS-Standard für die Anforderung und Auslieferung von strukturierten Inhalten. Dazu hat sehr gut die von der Firma doctima GmbH ausgestellte Anwendung eines programmierbaren Roboterarms gepasst, welche im Rahmen einer bei uns laufenden Masterthesis entwickelt wurde. Das Thema Content-Management durfte natürlich auch nicht fehlen. Dazu lauschte ich einer mit dem Publikum geführten Podiumsdiskussion. Diese lieferte interessante Rückmeldungen zu häufigen Abstimmungsproblemen in (großen) Firmen, während die eigentlichen technologischen Probleme eher als gelöst anzusehen sind. Der seit einigen Jahren angebotene »Showcase Mobile Dokumentation« zeigte gerade mal sieben Projekte und es lässt sich schlussfolgern, dass dieses Thema durchaus im Mainstream angekommen ist.

Für mich als Technologie-Praktiker war das Tutorial Generierung von PDF mit CSS besonders interessant. Obwohl es noch einige Haken und Ösen gegenüber der traditionellen PDF-Publikationstechnologie XSL-FO gibt, erweist sich Print-CSS je nach Anforderung bereits als produktives Werkzeug. Schließlich ist noch mein Fachvortrag zu erwähnen, der sich dem im Februar veröffentlichten Produkt Saxon-JS widmete. Damit ist es möglich, XML- oder JSON-Daten direkt im Webbrowser zu prozessieren (Folien). Die hohe Themendichte, viele Gespräche auf der Messe und das Drumherum wie die beliebten Standpartys machten auch diese Tagung zu einem echten Highlight.

Nachricht vom 11.10.2017

XSLT-Videotraining: Das unter der bisherigen Dachmarke video2brain bzw. neu bei LinkedIn Learning erhältliche Training »XSLT Grundkurs« ist bereits im Juli 2016 erschienen und wurde mir dankenswerterweise für einen Test zugänglich gemacht. Der Trainer Marc Oliver Thoma widmet sich der wichtig(st)en XML-Technologie zur Dokument- und Daten-Transformation – von Studierenden manchmal als Angstgegner angesehen ;). Zur Verfügung stehen 63 Videos im Gesamtumfang von sechs Stunden, die sich im Browser oder via Apps lokal abspielen lassen. Darin wird zunächst der Kernbereich von XSLT und XPath 1.0 behandelt, also das Erstellen von Templates mit entsprechendem Zugriff auf Elemente und Attribute des Quelldokuments. Neben den wesentlichen XSLT-Elementen werden auch einige XPath-Funktionen etwa substring() und translate() zur Stringbearbeitung vorgestellt.

Die anfängliche Fokussierung auf XSLT/XPath 1.0 ist gerechtfertigt, da XSLT/XPath 2.0 darauf aufbaut und je nach Softwareumgebung gelegentlich auch nur 1.0-Techniken verfügbar sind (etwa unter .NET). Immerhin zweieinhalb Stunden sind der 2.0-Vertiefung gewidmet. Speziell werden neue Techniken wie Gruppierung durch xsl:for-each-group, Datumsfunktionen wie format-date(), Einsatz von regulären Ausdrücken auf Zeichenketten u. a. mit replace() und benutzerdefinierte Funktionen über xsl:function sowie der Umgang mit CSV-Daten anhand konkreter Beispiele demonstriert. Überhaupt ist das durchgängige Arbeiten mit Quellcode, nur unterbrochen durch wenige in Unterthemen einleitende Folien, der Schlüssel zum Lernerfolg. Durch die Verwendung von <oXygen/> als Entwicklungsumgebung ist man nicht nur dabei sondern mittendrin. Insgesamt bietet das Training einen professionellen und durchaus angenehm rezipierbaren Überblick zu einem komplexen Thema. Es ist sowohl Einsteigern als auch Fortgeschrittenen zu empfehlen. Die verlinkte Website zum Training listet die einzelnen Themenfelder detailliert auf und bietet einige freie Videos zum Kennenlernen.

Nachricht vom 03.03.2017

Saxon-JS: Saxon-JS 1.0 ist das jüngste Produkt aus dem Hause Saxonica unter Federführung von Michael Kay. Es wurde mit dem Ziel entwickelt, die Möglichkeiten von XSLT 3.0 zur XML-Verarbeitung in Web-Browsern nutzen zu können. Dem kam der Vorgänger Saxon-CE mit 2.0-Techniken schon ziemlich nahe, konnte sich aber kaum etablieren. Saxon-JS baut programmiertechnisch auf dem CE-Modell auf, setzt z. B. für Ausgaben in vordefinierte Container weiterhin xsl:result-document ein und auch die wesentlichen API-Funktionen für Interaktionen sind verfügbar. Die Bibliothek selbst – SaxonJS.js bzw. SaxonJS.min.js – ist zwar frei erhältlich, jedoch nur mit kommerzieller Lizenz von Saxon-EE ab 9.7 einsatzfähig. Letzterer Prozessor ist nötig, um die eigentlichen zur Verarbeitung genutzten SEF-Vorlagen anzulegen. SEF steht für Stylesheet Export File, ein spezielles XML-Format für den Transformationsbaum. Die XML- und SEF-Dokumente werden schließlich der JavaScript-Methode SaxonJS.transform(…) übergeben und prozessiert.

Ein erster Test verlief insbesondere durch die Wiederverwendung und Weiterentwicklung eines früheren Projektes sehr positiv. Es mussten im Code nur an wenigen Stellen Anpassungen vorgenommen werden. Bemerkenswert ist auch die gegenüber Saxon-CE gestiegene Performance, allein schon durch die kürzere Ladezeit der nur noch 210 KB umfassenden Skriptdatei. Hervorzuheben sind natürlich ebenso die über CE hinaus gehenden technischen Möglichkeiten von XSLT 3.0, dessen Spezifikation kürzlich in den Status einer W3C Candidate Recommendation befördert wurde, sich somit auf der Zielgeraden zur finalen Empfehlung befindet. Fazit: Saxon-JS bereichert die Web-Entwicklung mit Fokus auf XML- oder auch JSON-Daten. Bei entsprechender Akzeptanz können interessante Anwendungen entstehen.

> Weitere Nachrichten: 18 | 17 | 16 | 15 | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1