"Web 2.0: Werkzeuge fur die Wissenschaft ¨
J¨rg Kantel o Max-Planck-Institut fur Wissenschaftsgeschichte ¨ EDV-Abteilung 15. Februar 2007
Gebt uns Tools! (J¨rgen Renn)1 u
Zusammenfassung Um den Begriff Web 2.0 ist ein gigantischer Buzz entstanden. Dabei existieren viele der Methoden, die sich hinter dem Begriff verbergen, schon seit geraumer Zeit. In diesem Artikel, der eine Ausarbeitung des am 23. DV-Treffen der MPG am 15. November 2006 gehaltenen Workshops ist, m¨chte ich die wichtigsten dieser Methoden vorstellen, o um einmal einen Blick hinter den Hype zu werfen. Dabei werde ich auf Begriff wie RSS, AJAX, Mashup, Social Software etc. eingehen und die zugrunde liegenden Werkzeuge vorstellen. Darauf aufbauend wird ein Entwurf einer Peer-2-Peer-Web-2.0-Anwendung vorgestellt, die als Modell f¨r wissenschaftliche, kollaborative Arbeitsumgebungen dienen u kann.
1
Web 2.0: Buzzword oder Hype oder doch etwas Vernunftiges? ¨
Web 2.0 ist die Summe der Bem¨hungen, das Web kommunikations- und beu nutzerfreundlicher als bisher zu gestalten. Es gibt eigentlich nichts wirklich Neues, die Bausteine des Web 2.0 sind seit Jahren bekannt2 . Allerdings erlauIm Wortlaut: Software-instruments for the management of research information as ” they are needed by the institutes such as project-servers, digital archives, tool-boxes, data-mining tools and the like are not being developed other than in exceptional cases.“ [Renn 2000, Seite 6] 2 Web 2.0 ist eigentlich nur ein Buzzword, das versucht, zwei unterschiedliche Dinge unter einen Hut zu bringen, der sich dann gut verkaufen“ l¨ßt. Aber die Techniken sind a ” da und sie werden auch genutzt.
1
1
ben erst die derzeit m¨glichen Bandbreiten, diese Techniken fl¨chendeckend o a zu kombinieren und einzusetzen. Es gibt keine echte Definition des Web 2.0. In der Regel wird darunter eine Kombination verschiedener Webservice-Anbieter wie z.B. den PhotoDienstleister Flickr aber auch die Business-Community openBC mit Techniken wie AJAX3 und CSS 2.0 verstanden, die einmal • verschiedene Dienste und Anwendungen zur Community-Bildung bieten, zum Beispiel auf spezialisierten Servern gemeinsamen Interessen nachzugehen oder uber gleiche Tags sich zu verst¨ndigen, wer ¨hnliche a a ¨ Interessen besitzt und • die Anwendungen im Browser Desktop“-¨hnlicher machen, zum Beia ” ¨ spiel Anderungen auf der Seite anzeigen, ohne daß die Seite — wie sonst ublich — im Browser neu geladen werden muß. ¨ Ich werde im Folgenden erst einmal versuchen, diese Elemente vorzu¨ stellen, um einen Uberblick zu geben, was unter Web 2.0 eigentlich alles verstanden wird oder verstanden werden kann, um sp¨ter daraus eine Peera 2-Peer-Arbeitsumgebung f¨r kollaboratives Arbeiten im und mit dem Web u zu entwickeln.
2
2.1
Personal Publishing: Weblogs und Wikis
Weblogs
Weblogs haben in den letzten zwei, drei Jahren eine enorme Popularit¨t era reicht. Zwar hinkt Deutschland gegen¨ber den USA, was die Zahl der aktiven u Nutzer betrifft, noch weit hinterher, doch sp¨testens seit der Jamba-Aff¨re“4 a a ”
AJAX ist eine Abk¨rzung f¨r Asynchronous Javascript and XML. Es bezeichnet u u ein Konzept der Daten¨bertragung zwischen einem Server und dem Browser, welches es u erm¨glicht, daß die HTML-Seite nicht mit jeder HTTP-Protokoll-Anfrage komplett neu o geladen werden muß. Das eigentliche Novum besteht in der Tatsache, daß nur gewisse Teile einer HTML-Seite sukzessiv bei Bedarf nachgeladen werden. 4 Johnny H¨usler hatte in einem Bericht in seinem Blog die fragw¨rdige Praxis von Jama u ba ironisch glossiert, den K¨ufern statt eines Klingeltons gleich ein ganzes Klingelton-Abo a anzudrehen. Kurz darauf gab es zu diesem Beitrag in seinem Blog viele Kommentare, die diese Praxis von Jamaba verteidigten. Ein Blick in die IP-Adressen der Kommentatoren zeigte, daß diese Verteidiger alle von einer einzigen Adresse kamen, der Netzwerkadresse von Jamba selber. Hier versuchten also Jamba-Mitarbeiter anonym die Meinung f¨r sich u zu beeinflussen. Nachdem dies ruchbar wurde, gab es ein enormes Rauschen in der Blogosph¨re und bald darauf auch im normalen“ Bl¨tterwald. Diese Geschichte wird heute a a ” immer wieder als Beispiel f¨r den PR-GAU benutzt, der einem in der Blogosph¨re wideru a fahren kann.
3
2
um den Spreeblick-Blogger Johnny H¨usler sind sie auch in das Blickfeld der a Medien ger¨ckt. u 2.1.1 Was sind eigentlich Weblogs?
Weblogs sind erst einmal Webseiten, die regelm¨ßig aktualisiert werden. Daa bei sind sie in der Regel in umgekehrt chronologischer Reihenfolge sortiert, das heißt, das Neueste steht immer oben, ¨ltere Beitr¨ge landen nach einer a a Schonfrist im ebenfalls zug¨nglichen Archiv. In der Regel werden Weblogs a mit Hilfe einer speziellen Weblogsoftware erstellt, die es erm¨glicht, die Seio ten zu pflegen, ohne große Kenntnisse von der darunterliegenden Technik und den Beschreibungs- und Programmiersprachen des Web (HTML, XHTML, CSS, JavaScript etc.) zu haben. Urspr¨nglich entstanden Weblogs als kommentierte Linksammlung, die u die t¨glichen Streifz¨ge durch das Internet dokumentierte. Daher die hohe a u Bedeutung, die in Weblogs den Links beigemessen wird. Daneben bem¨chtiga te sich aber schnell auch eine Gruppe der Weblogsoftware, die schon l¨nger, a aber eher unbeachtet, ein Leben im Web f¨hrte: die der Tagebuchschreiber. u Denn auch sie profitierten von der neuen Weblogsoftware. Hatten sie bisher ihre Homepages mit den Tageb¨chern liebevoll aber aufwendig selber u ¨ gestaltet, verlangte jede Anderung m¨hevolles Herumfummeln und Beherru schen des darunterliegenden HTML, erlaubten diese neuen Mini-CMS5 nun ein schnelles und unmittelbares Publizieren, genau das Richtige f¨r spontane u Tagebuchschreiber. Heute sind Weblogs, respektive die darunterliegende Weblogsoftware, eher eine H¨lle denn ein Genre: Sie erlauben eine Vielzahl von Publikationsformen, u vom klassischen Weblog uber das Tagebuch bis hin zum Online-Journal oder ¨ einer Firmen-Website, die weblogartig uber Produktneuerungen berichtet. ¨ Aber auch Labortageb¨cher und Berichte von Forschungsgruppen sind damit u leicht und schnell zu realisieren6 . 2.1.2 Weblogs und Webloghosting
F¨r die sp¨tere Diskussion ist es wichtig, die unterschiedlichen Methoden, u a wie Weblogs publiziert werden k¨nnen, einmal kurz vorzustellen. o Da sind zuerst einmal die gehosteten Blogs (Weblog-Dienste). Das ist ¨ die einfachste und schnellste Form, mit einem eigenen Weblog an die OffentCMS: Content Management System Dar¨berhinaus kann man die Software sogar zu Zwecke aufbohren“, an die man u ” eigentlich spontan nicht denkt: Wir nutzen in der EDV-Abteilung des MPIWG eine Weblogsoftware als Trouble Ticket“ f¨r den Support. u ”
6 5
3
Abbildung 1: Screenshot des Schockwellenreiters, (m)eines klassischen“ ” Weblogs (www.schockwellenreiter.de). Es sind kurze Beitr¨ge, die um einzela ne oder auch mehrere Links kreisen, erg¨nzt durch Bilder, Filme, MP3-Links. a Es besitzt das klassische, dreispaltige Layout. Unter den einzelnen Beitr¨gen a stehen bei Bedarf Tags, darunter sieht man Permalink, Kommentare, Trackbacks (wird weiter unten erkl¨rt) und — falls notwendig — auch Links zu a entsprechenden Kategorien (Schlagworten). Die linke Spalte enth¨lt in der a Hauptsache Werbung und Gimmicks, in der rechten Spalte finden sich Links zu den Archiven, Kategorienseiten und anderen Webseiten. Hier findet man typischerweise auch die Blogroll, Links zu den Weblogs, die der Weblogbetreiber selber liest und/oder empfiehlt.
4
lichkeit zu gehen. Man meldet sich (f¨r ein geringes Entgelt oder gar kou stenlos) bei einem Webloghoster an, w¨hlt ein Template aus, gibt seinem a Blog einen Namen und kann sofort loslegen. Bekannte Webloghoster sind z.B. Blogger7 (geh¨rt heute zu Google), Yahoo! 360◦8 oder Twoday.net9 o Die zweite und meines Wissens h¨ufigste Form ist das Blog auf gemiea tetem Webspace (Weblog-Software). Hier installiert man eine Weblogsoftware bei einem Internet Service Provider (ISP) der Wahl. Da die Software in der Regel PHP und MySQL verlangt, muß der ISP dieses unterst¨tzen. Die u bekanntesten Weblog-Tools f¨r diese Methode sind zum Beispiel Wordpress u (Open Source) oder MovableType (kommerziell). Aber es gibt sehr viele andere und die Grenzen zur ersten Version sind auch fließend10 . Im Idealfall hat man bei dieser Form die volle Kontrolle uber sein Blog. ¨ Die ressourcenschonendste Methode ist es, sein Weblog auf einem Desktop, also auf seinem pers¨nlichen Computer zu f¨hren und dann statische Seio u ten per FTP oder rsnyc oder ¨hnlichen Mechanismen auf einen Webserver a hochzuladen. Da dieser Server nur noch statisches HTML liefern muß, werden an ihn keine großen Anforderungen gestellt, selbst eine preiswerte (und von manchen Providern sogar kostenlos angebotene) Web-Visitenkarte reicht daf¨r aus. u Die Nachteil der letzten Methode ist nat¨rlich, daß etliche der liebgeu wonnenen Spielereien, die mit dynamischen Seiten m¨glich sind, erst einmal o nicht funktionieren. Aber wof¨r gibt es eigentlich die vielen Webservices, die u man auch in statische Seiten einbinden kann? So ist meinem Weblog kaum anzumerken, daß es aus statischen Seiten besteht. Kommentare, Trackbacks etc. werdem via Webservices realisert.
2.2
Wikis
Ein Wiki ist eine Website, deren Seiten von den Benutzern nicht nur gelesen, sondern auch einfach geschrieben werden k¨nnen. Der Name stammt von o wikiwiki, dem hawaiischen Wort f¨r schnell“. Die einzelnen Seiten und Aru ” tikel eines Wikis k¨nnen auf einfache Weise untereinander verlinkt werden. o Im Gegensatz zu Weblogs, die — zumindest in ihrer urspr¨nglichen Form u als Logbuch der Datenreisen — extern ausgerichtet sind, also nach außen verlinken, verlinken Wikis aufgrund ihrer Struktur vornehmlich nach innen.
www.blogger.com 360.yahoo.de 9 www.twoday.net 10 So wird zum Beispiel MovableType von der Firma TypePad dazu benutzt, Weblogs zu hosten.
8 7
5
Abbildung 2: Zettelkasten des historischen Seminars der Universit¨t Heidela berg.
Das bekannteste Wiki ist sicherlich die Wikipedia11 . Wikis sind ¨lter als Weblogs und fristeten lange ein Schattendasein im a Web. Sie waren eigentlich nur in akademischen Zirkeln und im Bereich der Softwaredokumentation zu finden. Erst mit dem Aufkommen der Wikipedia und dem Hype um den Begriff Social Software wurden Wikis auch in weiten Kreisen innerhalb des Netzes popul¨r. Und mittlerweile ist die Polularit¨t a a soweit gewachsen, daß viele Journalisten die Wikipedia meinen, wenn sie Wiki“ schreiben. ” Auch wenn es sie nat¨rlich gibt, sind Wikihoster eher die Ausnahme — u im Gegensatz zu Webloghostern. Der Standard ist eigentlich ein Wiki auf gemietetem Webspace. F¨r diesen Zweck gibt es viele Wiki-Tools, vom eher u einfachen DokuWiki12 bis hin zum MediaWiki13 , dem Tanker unter den Wikis, mit dem auch die Wikipedia betrieben wird. Aber Wikis sind nicht nur f¨r das kollaborative Arbeiten geeignet, sie u k¨nnen auch den Zettelkasten ersetzen und mutieren dann zu einem Persoo nal Information Management-Werkzeug (PIM). Neben reinen Desktop-Wikis kann man aber auch jedes andere Wiki auf dem Desktop installieren und un11 12
de.wikipedia.org www.splitbrain.org/projects/dokuwiki 13 www.mediawiki.org
6
ter localhost betreiben14 . Den oben schon erw¨hnten Zustand, daß Wikis ihrer Struktur nach eher a nach innen verlinken, versucht man durch sogenannte Interwiki-Links zu ver¨ndern. Das sind Links, die automatisch zwischen verschiedenen Wikis a (auch auf verschiedenen Servern) gesetzt werden. Dazu m¨ssen diese Server u nat¨rlich einmal dem Wiki bekannt sein und zweitens – zur Vermeidung von u Doppeldeutigkeiten – jedes Wiki mit einer eigenen Namensraumerweiterung versehen werden. Eine besondere Form der Wikis sind Blikis, eine Kombination aus Weblog und Wiki. Blikis versuchen, die Weblog-Funktionalit¨t in ein Wiki zu integriea ren. Die bekanntesten Vertreter dieser Klasse sind Vanilla 15 und SnipSnap 16 , ein in Java am Fraunhofer-Institut f¨r Rechnerarchitektur und Softwaretechu nik (FIRST) entwickelter Vanilla-Klon.
3
Werkzeuge (1): Community-Server, Ping, Trackback, RSS
Dave Winer ist einer der Pioniere des Webloggens. Er bot unter anderem auch kostenlose Weblog-Services an. Aber da seine Server von Suchmaschinen und Spidern uberlaufen waren, suchte er nach einer M¨glichkeit, diesen Verkehr o ¨ zu minimieren. So war die Idee des Ping geboren: Bei jedem Neueintrag setzt die Weblogsoftware einen Ping17 an einen sogenannten Community-Server ab. Dieser Community-Server weiß nun, daß es etwas Neues auf der Website gibt und schickt einen Spider los, diese neuen Informationen zu sammeln. Gleichzeitig informiert eine Webseite die Community, daß es Neues in diesem Weblog gibt. Doch wo soll der Community-Server eigentlich suchen? Das Spidern von Webseiten ist ein m¨hseliges Gesch¨ft, da Layout- und Content-Informationen u a wild gemischt vorliegen. Hier nutzte Winer eine andere Technik, die er schon fr¨her in einem anderen Zusammenhang f¨r Netscape entwickelt hatte: RSS18 . u u
Eine sehr komfortables Desktop-Wiki f¨r MacOS X ist MoinX (moinx.antbear.org), u ein One-Click-Installer f¨r das in der Scriptsprache Python geschriebene Wiki Moin Moin. u Da man es nicht nur als privates sondern auch als ¨ffentliches Wiki betreiben kann, bieo tet es sich auch als kollaboratives Werkzeug (gemeinsamer Zettelkasten) f¨r (kleinere) u Projektgruppen an. 15 www.vanillasite.at Vanilla ist in REBOL, einer ziemlich propriet¨ren Scriptsprache a programmiert. 16 snipsnap.org 17 Der Ping ist ein simples XML-Paket, das den Community-Server informiert, das in einem Weblog oder auf einer Website ein neuer Beitrag erstellt wurde. 18 RSS steht meist f¨r Rich Side Summary oder Really Simple Syndication, doch dar¨ber u u
14
7
¨ Dies ist eine spezielle XML-Datei, die urspr¨nlich nur die Uberschriften der u Beitr¨ge einer Website enthielt, heute aber entweder auch Zusammenfassuna gen der Beitr¨ge oder gar den Volltext der Beitr¨ge selber. RSS ist Inhalt a a pur, jede Layout-Information der Webseiten ist eleminiert. Das macht RSS speziell f¨r Spider und andere Bots gut lesbar und zur Weiterverarbeitung u geeignet. Winers Idee war es nun, Weblogs neben den HTML-Seiten auch RSSSeiten (automatisch) publizieren zu lassen und nur die RSS-Seiten von seinem Spider abzufragen. Dies — und die Idee des RSS selber — erwies sich als ungemein erfolgreich. RSS hat heute die begrenzte Welt der Weblgos l¨ngst verlassen und dient uberall dort im Web als Syndication-Format, wo a ¨ regelm¨ßige Updates stattfinden und man die Welt uber diese Updates ina ¨ formieren m¨chte19 . o Ben und Mena Trott, die Entwickler der popul¨ren Weblogsoftware Moa vableType haben die Idee des Pings konsequent weiterentwickelt. Schon fr¨h u boten Weblogs die M¨glichkeit zu kommentieren, doch einige — wie zum o Beispiel Winer — stehen dieser M¨glichkeit skeptisch gegen¨ber: Wenn ich o u einen Weblogbeitrag kommentiere, sollte ich dies nicht konsequenterweise in meinem Weblog tun? Die Idee der Trotts war es nun, wenn ich einen Beitrag eines fremden Weblogs in meinem Weblog kommentiere, an dieses Weblog ebenfalls einen Ping abzusetzen, der es darauf hinweist, daß sein Beitrag kommentiert wurde. Der Trackbackping oder kurz Trackback 20 war geboren. War es noch Winers Idee, daß der Community-Server die Updates aller Weblogs auflisten sollte, entstanden schnell spezialisierte Community-Server, die nur noch die Updates einer speziellen Community (meist eines einzelnen Weblog-Hosters) listeten. Im deutschsprachigen Raum sammelten sich die ersten in der Antville-Community21 , eines der ersten europ¨ischen Webloga Dienste, der dazu auch noch nichtkommerziell ausgerichtet war22 . Dabei wurde die Community-Bildung zus¨tzlich dadurch angeregt, daß nur Mitglieder a der Antville-Community in Antville-Blogs kommentieren durften. Dies bildet zwar einerseits einen relativ zuverl¨ssigen Schutz gegen Kommentarspam, ist a aber auf der anderen Seite eine Ausgrenzung anderer Webteilnehmer und
streiten sich die Experten noch. Uns soll es egal sein, Hauptsache, wir wissen, wie und das es funktioniert. 19 Vgl. [Kantel 2007]. 20 Das Trackback-Protokoll ist ein wenig schlampig formuliert und meistens auch implementiert. Daher ist es etwas in Verruf geraten. Dies ist schade, denn es bietet auch die M¨glichkeit, z.B. in wissenschaftlichen (Online-) Arbeiten einen Feedback uber das o ¨ Zitiert-werden zu geben. Eine verbesserte“ Form das Trackbacks, das Pingback, hat ” sich nicht durchgesetzt. 21 www.antville.org 22 Antville ist eigentlich bis heute das Hobby“-Projekt einiger Wiener Freaks. ”
8
daher wird diese Form der Community bis heute kontrovers diskutiert. Hier verl¨uft dann auch irgendwo die Grenze zwischen Weblog und (Diskussions-) a Forum. Speziell in diesen geschlossenen Communities gibt es oft Beitr¨ge mit a Dutzenden oder gar hunderten Kommentaren. Hier steht nicht mehr der Bei¨ trag und sein Autor im Vordergrund, sondern die Diskussion23 . Der Ubergang zu Foren ist hier fließend. Aber auch den umgekehrten Fall habe ich schon gesehen: Eine Forensoftware, die zu einem Weblog aufgebohrt wurde.
4
Ajax ist (k)ein Scheuerpulver
Herk¨mmliche Webanwendungen sind stateless, das heißt, der Server, der eio ne Seite an einen Client ausliefert hat kein Ged¨chtnis, er weiß nichts von a vorhergegangenen Anfragen des gleichen Clients. Dar¨berhinaus verlangt jeu de neue Anfrage an einen Server, daß eine Seite komplett neu geladen werden muß, auch wenn zum Beispiel nur ein Satz ver¨ndert wurde. Hier setzt a AJAX ein: AJAX-Anwendungen ver¨ndern mit Hilfe des Document Object a Models (DOM) und JavaScript den Inhalt einer bestehenden Webseite ohne einen vollst¨ndigen Reload der Seite zu erzwingen. Dar¨berhinaus sind a u AJAX-Anwendungen asynchron, das heißt, w¨hrend eine Anfrage an einen a Server l¨uft, kann im gleichen Browserfenster weitergearbeitet werden. Das a ist das, wof¨r AJAX steht: Asynchronous Javascript And XML. u Damit wird versucht, Applikationen im Web dem Verhalten von Applikationen auf dem Desktop anzupassen, denken wir zum Beispiel an eine Textverarbeitung, die ein fett markiertes Wort auch sofort als fett markiert anzeigt und nicht erst, nachdem man einen Submit Button gedr¨ckt hat. Man u kann mittlerweile mit Hilfe von AJAX faszinierende Dinge im Browser erledigen, aber es gibt auch einige Nachteile dieser Technik. Die wichtigsten sind: AJAX ben¨tigt zwingend JavaScript. Menschen, die aus Sicherheitso gr¨nden JavaScript in ihrem Browser ausgeschaltet haben oder die aus iru gendwelchen Gr¨nden auf alternative Clients, die kein JavaScript beherru schen ausweichen (m¨ssen) – man denke an Braille-Ger¨te oder Browser f¨r u a u Sehbehinderte, die den Inhalt des Browserfenster vorlesen – sind von AJAXAnwendungen ausgeschlossen. Das Document Object Model ist in unterschiedlichen Implementierungen
Dieses Ph¨nomen ist aber nicht ausschließlich an Communities wie die Antvillea Community gebunden. Auch der Spreeblick, das popul¨re Weblog von Johnny H¨usler a a a ¨hnelt mehr und mehr einem Forum, was sicher auch an der Diskussionsfreudigkeit von Johnny selber liegt. Und einige Blawgs, Weblogs von Rechtsanw¨lten, sind von spezialia sierten Jura-Foren ebenfalls kaum noch zu unterscheiden.
23
9
je nach Browser vorhanden. Das heißt, die nach dem (verdienten!) Ende von DHTML schon totgeglaubten Browserweichen feiern fr¨hliche Urst¨nd. o a Und es gibt wieder Webseiten, die z.B. im Safari, Apples hauseigenem Browser nicht laufen oder die schlicht und einfach nur in Browsern der MozillaFamilie funktionieren. Die Navigation mit Hilfe des Back Buttons l¨uft nicht mehr, wie der a Nutzer es gewohnt ist. In der Regel l¨scht ein zur¨ck nicht mehr den letzten o u Eintrag, son..."
|
You need to upgrade your Flash Player , or try to enable javascript in order see this document properly.
|
|