-*- coding: utf-8;-*- ## Title Converting a website to Gopher by Manu Raster Bitreichcon 3 Callenberg, 4 August 2019 ## Monuments * latin monēre to remember > german mahnen * a monument remembers us about something * monument appreciation * monument preservation * what is worth remembering? * my website is older than most (1998) * it has grown ever since * what remains constant? * the url is https://www.mediensprache.net/ * free of third party funding ## document workers * text producers that care about their own texts (sometimes mess with layout, too) * regular authors * can work with any text processing tool * secretaries use Word but could do better, because ed is the standard editor and Donald Knuth taught his secretaries TeX * document workers that care about both * typesetters, technical editors, typographists * take full advantage of Unix text processing tools * can fully dicriminate between text and layout ## care both: Unix and linguistics * 1970s, linguistics was the coolest subject * related to ai (1st and 2nd waves – and winters) * Example for Unix news * libc https://www.mediensprache.net/de/news/20190802119880.aspx * critical * ai * systemd 'how to get rid of it in mainstream Linux installs' https://www.mediensprache.net/de/news/20190501113785.aspx * facebook '' https://www.mediensprache.net/de/news/20190505113790.aspx * buzzword analysis e.g. cyber, digital * deep learning * e-sport https://www.mediensprache.net/de/news/20190730119875.aspx * medialinguistics ## market * Gopher and Http-based text retrieval popularly known as search engines * specialized indexes for news, songs and scientific articles * Shimbun * beware of buzzwords: harvesting, spidering, ## bad guys * the whole trade of web design sucks * it's all broken unless you write HTML by hand * memory consumption (examples) * ulimit * dillo, w3m * html-pagers, simplistic html-parsing ## good guys * handwritten HTML * Write HTML like LaTeX (like in the beginning when hypertext™ was a buzzword) * static on the rise (irony: is static™ becoming a new buzzword?) ## file system * literally, makes CMS obsolete * everything is a file * examples * the Aminet directory (bottom-up) * library classification schemes * Unix file system hierarchy ## least common denominator * ms-fs.tar.gz Mediensprache/ Mediensprache/Literatur/ Mediensprache/Literatur/Lexika/ Mediensprache/Literatur/Korpora/ Mediensprache/Literatur/Essays/ Mediensprache/Literatur/Networx/ Mediensprache/News/ * user management: useradd participation of interested readers ## licensing * alternatives to CC-BY * GFDL? * US, EU, German laws * Open Access * pronunciation * fuss * libraries and tax payers get shafted anyway * OA journals tend to lower quality, check the typographical quality * good typesetting and multi-column layout is not automatized * neither is proofreading ## Basic * Ecma55 Basic http://www.mdpi.com/2073-431X/3/3/69 * Appendix of stories ## Standardbibliothek GNU veröffentlicht libc 2.30 C ist die von Dennis Ritchie 1972 entwickelte Sprache zum Programmieren portabler Betriebssysteme und Werkzeuge mit praktischen Textschnittstellen. Vorgänger von C ist B von Kenneth Thompson (1970). Der Sprachumfang ist schlank: Ein- und Ausgabefunktionen, Speicherverwaltung und Zeichenketten (Strings) sind nicht in der Sprache selber, sondern in einer Standardbibliothek definiert. C wird als problemorientierte, imperative Programmiersprache der 3. Generation klassifiziert. Das Handbuch widmet Zeichen (87), Strings (97) und Mustern (239) jeweils ausführliche Kapitel. editieren [02.08.2019, 10:46 Uhr, Quelle: The GNU C Library Reference Manual] https://www.mediensprache.net/de/news/20190802119880.aspx ## Programmieren ohne Programmiersprache Neue pädagogische Angebote für Manager Nur mit der Maus und graphischen Bauklötzen Computerprogramme zusammenstellen ohne eine Zeile Code zu schreiben? – Über 200 solcher Low-Code-Baukästen soll es schon auf dem Markt geben. Klassische pädagogische Einführungen in die Kunst des Programmierens sind zum Beispiel Logo und Turtle-Grafik. Logo ist von Lisp beeinflusst und bringt wichtige Konzepte wie Rekursion und Listenverarbeitung mit. (Die Ausprägung dieser Fähigkeiten unterscheidet den Menschen von intelligenten Affen, Chomsky et al. 2002: The evolution of the language faculty.) Bildungsziele scheinen die aktuellen Low-Code-Werkzeuge jedoch keine zu verfolgen. Sie richten sich auch nicht an Kinder, sondern an Manager. Kritisch fragt ein Leser in der Diskussion: »Warum Programmierer ersetzen? Low Management wäre einfacher und günstiger, denn dazu braucht man keine extra Tools.« Ein anderer bringt eine programmiersprachliche Parallele zur FLN (faculty of language in the narrow sense) ins Spiel: »Bei dem mistigen Bloat, den man manchmal präsentiert bekommt, … reicht wohl auch eine Horde dressierter Affen.« [01.08.2019, 12:24 Uhr, Quelle: Low Code: Brauchen wir bald keine Programmierer mehr?] Chomsky/Fitch/Hauser 2002: The Faculty of Language: What Is It, Who Has It, and How Did It Evolve? (PDF) https://www.mediensprache.net/de/news/20190801119877.aspx ## Sie nennen es Sport Sportphilosophische Betrachtungen zum Begriff E-Sport Seit der Verfügbarkeit schneller DSL-Anschlüsse müssen Computerfans nicht mehr LAN-Partys organisieren, sondern können sich vernetzen, ohne das Haus zu verlassen. Zum Schutz vor den negativen Folgen des einsamen Stubenzockens wie zum Beispiel Bewegungsarmut, motorische Defizite, Schlafmangel, Fehlernährung, soziale Exklusion und Spielsucht hat Südkorea 2011 das Cinderella-Gesetz verabschiedet: Kindern unter 16 Jahren ist zwischen Mitternacht und 6 Uhr früh das Spielen verboten. Sportvereinen, die an neuen jungen Mitgliedern interessiert sind, und Firmen, die von »E-Sport« reden und Computerspiele meinen, hält Sportphilosoph Volker Schürmann entgegen, dass der Begriff »E-Sport« ein Marketingbegriff und »E-Games« proprietäre Handelsgüter seien. Sport dagegen ist Gemeineigentum. [30.07.2019, 11:50 Uhr, Quelle: APuZ, Robin Streppelhoff. Second Screen ;)] https://www.mediensprache.net/de/news/20190730119875.aspx ## Der Teufel ist ein Eichhörnchen Grundsätzliche Probleme automatischer Objekterkennung Der Schlüssel zur Analyse von Text ist die Grammatik. Zusammen mit einem Lexikon können wir so jeden Text verstehen. Bilder und Töne hingegen verstehen wir ästhetisch und verordnen sie im Bereich der Kunst. Grammatiken und Wörterbüchern vergleichbare Regelwerke, die Bilder und Musik aufschlüsseln, gibt es nicht. Vielleicht hat sich bisher niemand dieser Arbeit angenommen, da Kunstbanausen oder Maschinen keine attraktive Zielgruppe scheinen. Die KI-Szene hofft indes auf eine crowdgesourcete™ Weltbeschreibung durch den bei Wikipedianern (diejenigen, die die tollen Artikel schreiben – eine schwindende Spezies, während die Gruppe der Konsumenten und Bürokraten stetig wächst) wenig beliebten Aktenschrank Wikidata. Denn Objekte nur mit statistischen Methoden zu klassifizieren, führt wie bei maschineller Übersetzung auffällig regelmäßig zu Fehlern... [24.07.2019, 08:12 Uhr, Quelle: "Ist es ein Eichhörnchen oder doch ein Seelöwe?" – Diskussion zu einer Sammlung regelmäßig falsch identifizierter Tiere] Hearst 1999. Untangling Text Data Mining – Überblick von Text- und Nichttextverarbeitungsmethoden https://www.mediensprache.net/de/news/20190724119867.aspx ## Facegruft Facebook im Jahre 2070 Als die CSU bei der letzten bayrischen Landtagswahl 160.000 Wähler an die AfD und 170.000 an die Grünen verlor, stand sie vor der Vexierfrage ihren Kurs in zwei gegensätzliche Richtungen zu ändern, um die verlorenen Wähler wiederzugewinnen. Noch gefährlicher ist aber ein Konkurrent, der ihr sogar 240.000 Wähler abnahm, der kein Demokrat ist und gegen den alle PR-Manöver wirkungslos sind. Der Tod. Es liegt in der Menschennatur den Sensenmann zu unterschätzen und so überraschen uns manchmal Prognosen, die dies nicht tun, wie zum Beispiel die des Oxforder Internet Instituts, wonach im Jahre 2070 mehr tote als lebende Facebook-User registriert sein werden. [05.05.2019, 13:08 Uhr, Quelle: Öhmann / Watson "Death online"] https://www.mediensprache.net/de/news/20190505113790.aspx ## Systemdfrei Alternative Init-Systeme Beim Starten eines Betriebssystems gibt es ein Programm mit der Prozess-ID 1, das alle grundlegenden Geräte, Dienste und Dämonen startet, bis sich der User einloggen kann, und während der gesamten Zeit bis zum Ausschalten läuft. Es ist das Init-Programm, welches in zahlreichen Varianten vorliegt. Auf kleinen Rechnern, Fritzboxen u.ä. arbeiten zwangsläufig effiziente Inits, aber auf Lap- und Desktops ist oft das bei Hackern als grotesk angesehene Systemd aus dem Hause Red Hat vorinstalliert, so dass mittlerweile zahlreiche Anleitungen über diesen Bruch mit der Unix-Tradition aufklären und Alternativen vorschlagen. Schon zwei kleine Befehle befreien etwa einen Ubuntu-PC von System: »apt-get install upstart-sysv sysvinit-utils -y. update-initramfs -u. Reboot your system so that systemd is no more the init system. Enjoy this and the next moments with a good drink of your choice.« [01.05.2019, 10:45 Uhr, Quelle: How to remove systemd] https://www.mediensprache.net/de/news/20190501113785.aspx ## Ärgerlicher Webrelaunch Der Preis für fragwürdige Features Autoverleiher Hertz hat beim Outsourcing-Dienstleister Accenture eine Webseite bestellt, die mit Corporate Design™ (Uniformierung), Responsive Design™ (unverzüglichen Rückmeldungen), einem schönen Frontend™ (Benutzerschnittstelle) und einer mobilen App aufwarten sollte. Bestellt, geliefert, doch das an Featureitis erkrankte Produkt gefiel dann auch den Hertz-Managern nicht, so daß sie nun ihr Geld zurück fordern: 32.000.000 $. Eine große deutsche Behörde, das Arbeitsamt, hatte vor einigen Jahren sogar 165.000.000 € in einer ähnlichen Projektkonstellation für einen featurevollen Online-Auftritt ausgeben müssen. [27.04.2019, 08:00 Uhr, Quelle: t3n] https://www.mediensprache.net/de/news/20190427113781.aspx ## Der kluge Hans und seine Schulmeister Wärmebilder bringen Licht ins Dunkel Ähnlich wie der Besitzer des rechnenden Pferdes Kluger Hans wissen auch heutige Schulmeister höherer und höchster Lehranstalten oft nicht, wie ihre Intelligenzsimulationen eigentlich funktionieren. Sie haben die Kontrolle über ihre Daten verloren. Der Umstand, daß die Heuhaufen zu groß seien, um sich im Detail damit zu beschäftigen, ist Entschuldigung und Werbung zugleich: Big Data. In den Geisteswissenschaften ist es schwieriger, Aussagen über Texte zu machen, die man nicht gelesen, sondern nur ihre Wörter gezählt und kombinatorisch verglichen hat. Eine solche Vorgehensweise wäre unphilologisch, eine nicht ernst zu nehmende Spielerei. Um wenigstens im Nachhinein etwas Licht in die dunklen Modelle des Deep Learnings zu bringen, wurde nun eine Methode vorgestellt, die mit Wärmebildern zeigt, welche Details die Statistik stärker beschäftigten als andere. Zum Beispiel fand ein aktuelles KI-Bilderkennungsmodell bei der Erkennung eines Zuges vor allem gerade verlaufende Gleise relevant, aber nicht den Zug selber oder die Oberleitungen. [13.03.2019, 10:46 Uhr, Quelle: TU Berlin] https://www.mediensprache.net/de/news/20190313111735.aspx ## KI im Herbst Holzwege der statistischen Mustererkennung Die aktuelle Ausgabe 24/2018 der Computerzeitschrift c't wartet mit drei kritischen Artikeln zum Thema KI auf: (1) Neuronale Denkfehler – Künstliche Intelligenz: zu naiv, um schlau zu sein. (2) Irren ist künstlich – Wo künstliche Intelligenz noch schwächelt. (3) Statistik ist nicht Denken – Wie sich künstliche Intelligenz von menschlicher unterscheidet. In allen drei Artikeln geht es um nicht-linguistische Anwendungen wie z.B. Bilderkennung. Zu den vermeintlichen Fortschritten automatischer Übersetzungssysteme seien noch einmal die aktuellen Aufsätze und Vorträge von Douglas Hofstadter, zwar nicht in deutscher Sprache, aber mit deutschen Übersetzungsaufgaben, empfohlen, deren Fazit lautet: auch die populären App- und Web-Übersetzer sind immer noch auf dem Stand von 1960 als Bar-Hillel »The Present Status of Automatic Translation of Languages« mit den Anhängen (1) »Some Linguistic Obstacles to Machine Translation« und (2) »A Demonstration of the Nonfeasibility of Fully Automatic, High Quality Translation« verfasste. [13.11.2018, 09:50 Uhr, Quelle: heise.de [A. Trinkwalder] https://www.mediensprache.net/de/news/20181113103625.aspx ## Die Schachtel war in der Feder Trāns-fero, trānstulī, trānslātum, trānsferre, von einem Orte zum anderen tragen, hinüber-, hintragen, -bringen, -setzen, -schaffen. Dies ist die Etymologie von Translation, wie sie auch in den »Machine Translation«-Diensten von Google Translate™ und Deepl™ steckt, wenn sie Wörter, Sätze und ganze Texte von einer Sprache in eine andere übertragen. Wie diese Programme das tun ist wegen ihrer proprietären Natur nur mittelbar durch Ausprobieren herauszufinden. Aber schon einfache Tests geben ein ernüchterndes Bild über die linguistische Qualität, die nach wie vor nicht der klassischen Kritik (Bar-Hillel 1959) genügt. Neben grundsätzlichen Mängeln (»MT-ness of MT«) dürften menschliche Übersetzer vor allem über die Verwendung von Brückensprachen und Plagiaten in den populären Diensten staunen. editieren [18.08.2018, 16:14 Uhr, Quelle: Hofstadter 2018 "Reflections on Machine Translation"] https://www.mediensprache.net/de/news/20180818100532.aspx