# linguistics – maha’s blog

LaTeX in Word umwandeln

Wenn ich Bücher oder Artikel schreibe, benutze ich ja meistens das Schriftsatzsystem LaTeX. Hier ein paar Gründe:

  1. Ich bekomme ein schönes pdf (dank XeTeX kann ich auch bei den Schriftarten dabei alle Register ziehen, ich finde ja die TeX-Standard-Schriftart Computer Modern nicht so ansprechend).
  2. Die Literaturverwaltung mit bib(la)tex (und biber) funktioniert einwandfrei. Ich bekomme die richtigen bibliografischen Angaben direkt im Bibtex-Format aus den gängigen Datenbanken und natürlich aus Zotero, Google Scholar, BibSonomy usw. Außerdem habe ich für meine Interessengebiete schon größere Literaturdatenbanken in Bibtex.
  3. Querverweise funktionieren in Latex einwandfrei (ein großes Manko bei Pages).
  4. Ich benötige häufig komplizierte Sonderzeichen: Phonetische Zeichen sind dank UTF-8 zwar fast überall verfügbar, nur sehen sie meist typografisch merkwürdig aus. Außer in Latex ist es fast unmöglich, beliebige Zeichen zu kombinieren, was aber in linguistischen Arbeiten oft nötig ist, insbesondere wenn es um Dialekte geht.
  5. Die interlineare Übersetzung von exotischen Sprachen ist ohne Latex eine ziemliche Fummelei.
  6. Ich lasse mich vom Inhalt nicht durch Formatierungsfragen während der Texterstellung ablenken.

Das Problem ist aber, dass viele Herausgeber gern statt einer Latex-Datei eine Word-Datei haben möchten (manchmal „unformatiert“, häufig auf der Basis eines eigenen Stylesheets). Die Umwandlung von Latex zu Word ist eigentlich ganz einfach, wenn man weiß, wie es geht. Ich habe verschiedene Lösungen ausprobiert und nur eine scheint mir (trotz einer gewissen Komplexität) wirklich ohne Abstriche gangbar: Die Umwandlung vollzieht sich in drei Schritten:

tex4ht

Das Script htlatex kompliliert latex-Dateien mit dem Paket tex4ht. Auf der Kommandozeile gebe ich Folgendes ein:

htlatex Latexdatei.tex 'html,charset=utf-8,NoFonts'

Damit wird die Latexdatei in eine html-Datei umgewandelt. Mit der zweiten Option wird im Header dieser Datei vermerkt, dass es sich um eine UTF8-kodierte Datei handelt (was aber nicht stimmt, dazu gleich mehr). Die dritte Option unterdrückt die Angabe von Zeichensätzen in der html-Datei, denn die brauchen wir nicht, da die am Ende herausfallende Datei entweder „unformatiert“ sein oder einem Stylesheet entsprechen soll.

Korrekt in UTF8 umgewandelt würde die Datei mit folgenden Optionen (das Leerzeichen zu Beginn der zweiten Optionsgruppe ist wichtig):

htlatex Latexdatei.tex 'html,charset=utf-8,NoFonts' ' -cunihtf -utf8 -cvalidate'

Das führt aber dazu, dass die Datei auch Ligaturen enthält, was für die weitere Verarbeitung aber störend ist. Ohne die zweite Optionsgruppe ist die entstehende html-Datei (trotz anderer Information im Header) in ISO-8859-1 kodiert und enthält keine Ligaturen.

Kodierung korrigieren

Ich muss also die Kodierung korrigieren mit:

iconv -f ISO-8859-1 -t UTF-8 Latexdatei.html

Jetzt haben wir eine html-Datei in der richtigen Kodierung (entsprechend der Angabe im Header). Diese Datei kann ich natürlich als html-Seite veröffentlichen, was ich aber gar nicht möchte. Es ist vielmehr die Grundlage für die Weiterverarbeitung, die ich mir gar nicht anschaue.

pandoc

Die entstandene html-Datei kann ich jetzt in jedes beliebige Format umwandeln dank Pandoc. So ist es kein Problem, einfach ein schönes E-Book zu produzieren (epub oder gar epub3). Auch die Umwandlung in doc oder docx ist möglich. Ich gehe allerdings meist über einen Zwischenschritt und wähle odf, damit ich mir die Datei noch mal mit Open/LibreOffice ansehen und durchsehen kann, bevor ich sie als Word-Datei abspeichere und an den Herausgeber schicke.

Bevor jetzt jemand fragt: Die direkte Umwandlung von latex nach doc mit pandoc liefert keine auch nur im Ansatz zufriedenstellenden Ergebnisse. Insbesondere bekomme ich biblatex nicht richtig mit pandoc vermählt.

Vorlesung Syntax als Podcast

Ich bin ein kleines bisschen stolz auf mich: einerseits weil ich endlich wieder zum Bloggen gekommen bin, andererseits weil ich mir einen Traum erfüllt habe: Es gibt jetzt endlich eine aktuelle (noch laufende) Vorlesung von mir als Podcast. Der Titel ist: Grundlagen der Syntax. Zugegeben: nicht das leichteste Thema! Ich hoffe aber, dass es auch über den Kreis meiner Studierenden im Aufbaumodul (also Anfänger mit Vorkenntnissen) Interesse findet.

Ich nehme ja schon seit 2010 meine Vorlesungen als Screencast auf, bisher standen sie aber nur im universitätsinternen Moodle den Studierenden zur Verfügung, dabei wollte ich sie schon immer veröffentlichen. Aus einer Reihe von Gründen habe ich es nicht getan:

  1. Das wichtigste Problem war (und ist) das Urheberrecht: Für eine Vorlesung ist es nötig, auf anderer Leutes Material zurückzugreifen. Wenn das ein Zitat überschreitet (zum Beispiel im Fall von Dialektkarten), ist das problematisch, und ich habe mich nicht getraut.
  2. Jeder macht Fehler, auch ich. Da ich mir während eines Semesters gelegentlich bewusst wurde, dummes Zeug erzählt zu haben, sank meine Motivation, das im Nachhinein zu veröffentlichen.
  3. Die Qualität der Aufnahmen war mir einfach zu schlecht.

Da ich in jedem Semester eine anonyme Selbstevaluation durch die Vorlesungsteilnehmer durchführe, habe ich erfahren, dass die Studierenden meine internen Vorlesungsaufzeichnungen sehr schätzen. Nun bin ich als Professor ja nicht nur für den geschlossenen Kreis meiner Studierenden da, sondern sollte das, was ich tue eigentlich allen zur Verfügung stellen. Es ist letztlich eine Frage des Mutes und irgendwann musste ich ihn einfach aufbringen. Ich zitiere mal den Wikipedia-Artikel Professur: „Professur (von lateinisch profiteri in der Bedeutung ‚sich öffentlich als Lehrer zu erkennen geben‘)“. Jetzt habe ich es gleich zu Semesterbeginn gemacht. Dann muss ich da auch trotz möglicher Fehler durch!

Das mit dem Urheberrecht bekomme ich zumindest in diesem Semester ganz einfach in den Griff, denn ich greife einfach auf mein eigenes Material zurück. Das geht natürlich – abhängig vom Thema – nicht immer. An der technischen Qualität arbeite ich noch. Ich habe mir diverse Mikrofone zugelegt und werde sie nach und nach ausprobieren, in der Hoffnung, dass die Qualität immer besser wird. Zur Zeit bin ich jedenfalls noch nicht zufrieden.

Ein weiteres Problem ist, dass die Video-Dateien sehr groß sind. Eine reine Audio-Version ist auch nicht machbar, weil die gezeigten Folien wirklich wichtig für das Verständnis sind. Ich suche noch ein wenig nach einem alternativen Codec, dieser sollte aber auf allen üblichen Geräten vorhanden sein und die Optik der Vorlesungs-Folien nicht verschlechtern, weil die unbedingt lesbar sein sollten (ich gebe mir da große Mühe, sie nicht zu klein zu machen). Dateien, die zwischen 300 und 700 MB groß sind, lassen sich eben schlecht unterwegs im Mobilfunknetz streamen oder gar herunterladen – gerade wenn die nächste Volumen-Drosselung droht oder der Provider Geld für große Downloads berechnet. BitTorrent ist da jetzt auch nicht wirklich eine Lösung, denn die Uni-Server ertragen die Downloads durchaus und der Interessentenkreis ist zu gering.

Leider unterstützt meine Universität solche Aktionen gar nicht: Ich musste einen RSS-Feed in das Typo3-CMS hinein hacken, was sehr umständlich ist. Dafür kann ich jetzt Feed-XML-Dateien im Schlaf erstellen. Es gibt aber keine richtige Plattform, auf der ich auch Kommentare empfangen kann. Wir haben zwar ein Moodle, aber das funktioniert nur uni-intern. Die Idee, dass die Universität eigentlich für alle da ist und daher auch ihr Angebot der Öffentlichkeit zur Verfügung stellen muss, ist da leider noch nicht angekommen. Ich habe überhaupt das Gefühl, dass es kaum Leute gibt, die so ein öffentliches Angebot machen. Ja, es gibt iTunesU, an dem sich auch deutsche Unis beteiligen, aber das ist ja im Grunde eine geschlossene Plattform, auf der sich Apple das Material aneignet, das noch dazu nur mit einer Anmeldung zugänglich ist. Das widerspricht der Idee frei zugänglicher Bildung.

Die Vorlesung steht natürlich unter der Creative-Commons-Lizenz cc-by-sa 3.0 für Deutschland, schließlich bin ich ja schon für meine Arbeit bezahlt worden.

Leider kann ich – da es sich um eine Uni-Plattform handelt – nicht nachvollziehen, wie viele Leute sich die Vorlesung herunterladen (direkter Link auf den Feed), eine Kommentarfunktion fehlt ebenfalls, Flattr kann ich auf einer Uni-Seite auch nicht einsetzen (um wenigstens durch die flattr-Klicks ein Feedback zu haben). Daher bitte ich diejenigen, die ein Feedback geben wollen, dies hier oder per E-Mail zu tun. Obwohl die Syntax natürlich eine etwas esoterische Disziplin ist, hoffe ich auf etwas Interesse.

Tschüss

Ich bin auf den Artikel über das Tschüss-Verbot an einer bayerischen Schule aufmerksam gemacht und um einen Kommentar gebeten worden. Ich glaube, dass die Schulleiterin und ihre Unterstützer in ihrer sprachlichen Bewertung der Grußformeln irren. Es handelt sich nämlich, zumindest in Bayern (und somit anders als in anderen Teilen Deutschlands) bei tschüss! keineswegs um eine unhöfliche Variante von auf Wiedersehen!. Was nämlich gern übersehen wird, ist dass es in Bayern oft noch einen stärker dialektalen Verabschiedungsgruß gibt, der allerdings von Region zu Region variiert. In Oberfranken ist das, je nach Grad der Intimität ade! oder gar adela! (ade und Diminutiv). Damit ist klar, dass wir hier ein Dreier- oder Viereropposition haben:

  1. auf Wiedersehen!
  2. tschüss!
  3. ade!
  4. adela!

Hier wird schon klar, dass tschüss! eher in den höflichen Bereich gehört, und so habe ich es auch empfunden als ich nach Franken kam. Gerade in kleineren Läden ist es völlig üblich, dass sich einander unbekannte Menschen mit tschüss! verabschieden. Das mag eine Innovation sein, wird aber nicht als unhöflich empfunden. Selbstverständlich hat das tschüss! in Gegenden, wo es keine (dialektalen) familiären Varianten gibt, einen anderen Stellenwert als dort, wo es solche gibt. Gibt es familiärere Formen, avanciert tschüss! zur Normalform, der man mit schulischen Verordnungen nicht den Garaus machen kann.

Bei Begrüßungen ist es noch komplizierter, weil die Auswahlmöglichkeit noch größer ist. Die folgende Liste erhebt keinen Anspruch auf Vollständigkeit:

  1. grüß Gott!/guten Tag!
  2. hallo!
  3. servus!
  4. hi!
  5. sers!

Die Variante servus! hielt ich vor meiner Zeit in Oberfranken für österreichisch, das ist aber nicht so. Man hört sie nicht so häufig wie in Österreich, aber sie wird unter Freunden durchaus benutzt, wobei ich häufiger hi! höre (womöglich ist mein Freundeskreis nicht repräsentativ). Die Kurzform sers! für servus! war mir unbekannt, bis ich sie vor einiger Zeit gehört und dann auch deutlich wiedergehört und in einer E-Mail sogar gelesen habe. Auch hier zeigt sich deutlich, dass hallo! zur Normalform geworden ist. In Läden, aber insbesondere auf den Fluren der Universität oder in Kneipen ist das der normale Gruß. Möglicherweise trägt dazu auch bei, dass es einen Konflikt zwischen grüß Gott! und guten Tag! gibt. Ersteres kommt vielen Reingeschmeckten schwer über die Lippen, letzteres wirkt norddeutsch und fremd in Bayern. Da ist hallo! ein guter Kompromiss.

Anmerkung zur Schreibung von tschüss

Im zitierten Artikel wird tschüss mit nur einem s geschrieben. Das ist zwar nach Duden und Co. eine mögliche Standardorthografie, aber sie ist trotzdem schlecht, da sie eine falsche zugrundeliegende Form suggiert. Manche Sprecher können nämlich Ableitungen aus tschüss bilden, z.B. tschüssi, tschüssing oder gar tschüssikowski. Ich habe alle drei Varianten gehört (nicht in Bayern!), selbst nutzen würde ich höchstens tschüssi – ungern zwar, aber es ist für mich eine korrekte Ableitung. Das bedeutet, dass ein stimmloses s zugrundeliegt, demnach ist die Schreibung mit ss vorzuziehen.

12 Konsonanten

Angstschweiß gilt bekanntlich unter Deutschlernenden als sehr schwieriges Wort, das so manchem tatsächlich den Angstschweiß auf die Stirn treibt, denn es enthält acht Konsonantenbuchstaben in Folge. Rein phonetisch betrachtet sind es natürlich nur fünf, denn <ng> ist ein Digraph  und <sch> ein Trigraph, also ein Laut, dessen graphische Darstellung sich aus mehreren Buchstaben zusammensetzt. So ergeben sich lediglich 5 aufeinander folgende Phoneme in /ˈaŋstʃvaɪs/, was  natürlich schon eine  Herausforderung darstellt.

Im Label 205 hatte ich heute ausführlichGelegenheit über Konsonantenhäufungen zu diskutieren, als mir plötzlich durch eine zufällige Gedankenassoziation ein Wort durch den Kopf ging, das immerhin zwölf Konsonantenzeichen enthält, nämlich: Borschtschschlürfer, und das noch dazu ein Doppel-sch aufweist. Allerdings handelt es sich bei <rschtschschl> auch nur um fünf Konsonantenphoneme, nämlich /rʃʧʃl/; wahrscheinlich ist das die Obergrenze. Dennoch ist Borschtschschlürfer zumindest für heute mein Wort des Tages.

„Neusprech“ in Dresden

Am Freitag bin ich nach Dresden gefahren, um dort beim c3d2 einen Vortrag über Neusprech im Schnüffelstaat zu halten. Dresden ist ja quasi ein Vorort von Berlin, denn mit dem Eurocity nach Prag ist man in zwei Stunden dort und kann dabei noch Velkopopovický Kozel und Palatschinken genießen. Am Bahnhof hat mich dann Leon abgeholt und mir noch einen Schnellrundgang durch Dresden geboten. (Leon hat auch über meinen Besuch ausführlich berichtet.) Dann sind wir zum Dresdner Hackerspace, ein kleines, aber feines Zweiraumbüro am Rande der Innenstadt (Plattenbau).

Später ging es dann zur Berufsakademie Dresden, wo ich meinen Vortrag hielt. Es waren relativ viele Leute gekommen (vielleicht auch wegen der guten Werbung, unter anderem dank Chaosradio Express 81), die Technik funktionierte erwartungsgemäß wie am Schnürchen und das Publikum diskutierte interessiert mit. Insgesamt hat es mir großen Spaß gemacht. Gegen Mitternacht brachte dann Sven meinen Gastgeber und mich in die Neustadt, wo wir noch was essen wollten. Aufgrund der vorgerückten Stunde gingen wir dann aber zum Bahnhof und fuhren in die Friedrichstadt, wo mein Gastgeber wohnte. Da er mich davor gewarnt hatte, dass es hier viele Neonazis gebe, fühlte ich mich schon etwas verunsichert, zumals einschlägige Graffiti zu sehen waren. In der Küche meines Gastgebers wurde es dann noch sehr spät, was aber wohl mehr an mir als an ihm lag, denn ich war eindeutig wacher, und anregende Gespräche über den Zusammenhang von Mathematik und Religion haben keinerlei ermüdende Wirkung auf mich. Am nächsten Mittag reiste ich dann wieder ab.

Wenn man mal von der rechten Gefahr absieht, ist Dresden eine sehr lebendige Stadt, wo man massenweise kreative und interessierte Leute treffen kann. Da komme ich doch gern wieder hin!

Sprachenpodcast, Wii

Vor ein paar Tagen habe ich mit Tim Pritlove zusammen einen Chaosradio-Express-Podcast über Sprachen aufgenommen. Das war eine interessante Erfahrung, und ich denke, das Ergebnis kann sich sehen bzw. hören lassen. Insgesamt war das Gespräch mit Tim sehr interessant, und ich kann nur hoffen, dass meine Ähs und Nees nicht zu sehr stören. Das muss ich mir noch abgewöhnen, bevor ich selbst auf Sendung gehe. Leider fehlt auf der Chaosradio-Website noch ein Weblog mit Kommentarfunktion, so dass es wohl leider nicht viel Feedback geben wird. Wer will, kann ja hier was schreiben – oder in Tims Blog – oder in beide.

Nach dem Podcast konnte ich dann bei Tim und Verena noch eine Neuheit ausprobieren: die neue Nintendo-Spielkonsole namens Wii (sprich: [wiː]). Bisher hatten mich ja Spielkonsolen gelangweilt, aber diese hat etwas Besonderes: Die Steuergeräte (Controller, auch Wii-Remote genannt) haben einen Beschleunigungssensor, was besonders lustig ist, wenn man Tennis spielen will: Man kann wie mit Schlägern schlagen. Zum ersten Mal kann man sich also beim Videospiel wirklich bewegen! Das ist großartig! Wenn ich einen Fernseher hätte, würde ich das sofort kaufen…

Linguistics blogs

Thanks to Christopher and some “private investigations” I have come across some interesting blogs about linguistics:

And speaking about linguistics, don’t miss the IPA eyechart: You can find out how shortsighted you are with the help of IPA-signs.

Rice Linguistics Colloquium

Today I am at the Linguistics Department of Rice University in Houston. It’s a very agreable place, esp. when the weather is nice, as it is now (people say it’s 75 degrees which doesn’t mean much to a centigrader like me). At noon I went to the university restaurant with some colleagues and had some Mexican food which tasted quite exotic to me.

This afternoon I will give a talk at the Rice Linguistics Colloquium about Complex verb constructions in Romance languages and Basque. I’m getting excited already…

I just read the blog of the last week’s invited speaker who had some very special experiences in Houston, albeit under different circumstances and in another century. Compared to that, my visit will certainly be quite uneventful. Actually what happened in 1992 in Houston seems to happen now in Berlin during Lech Kaczynski’s lecture at Humboldt University; so my remark about different circumstances and another century seem to be a bit out of place here.