Schattenblick →INFOPOOL →COMPUTER → FAKTEN

FORSCHUNG/088: Der Semantik-Trick (lookit - KIT)


lookit - Ausgabe 1/2009
Das Magazin für Forschung, Lehre und Innovation
KIT - Karlsruher Institut für Technologie

Der Semantik-Trick

Semantic Web: Professor Rudi Studer erforscht Verfahren, die Informationen im Netz mit Kontext versehen - ein Gespräch über die Möglichkeit, vom Computer perfekte Antworten zu bekommen

Von Sophie Kolb


Wer ist bei einer Recherche im Internet nicht schon in Verzweiflung geraten? Mit dem Semantic Web muss das nicht mehr passieren, versichert Professor Rudi Studer vom Institut für Angewandte Informatik und Formale Beschreibungsverfahren (AIFB), der im KIT-Schwerpunkt COMMputation mitwirkt (siehe auch Seite Vorschau).


lookit: Im Zeitalter des Web 2.0 wandelte sich das Internet von einer weltweiten Datensammlung in eine Austausch-Plattform um. Stößt es mit dem Semantic Web nun wieder in eine neue Dimension vor?

Rudi Studer: Semantik bildet in Kombination mit Web 2.0 das Web 3.0. Computer können dort die Bedeutung von Daten erkennen und ihre Zusammenhänge verstehen. Wenn ich heute Bilder zum Stichwort "Golf" suche, bekomme ich Fotos von Autos, Golfplätzen und wunderbaren Stränden an der Karibik. Das geschieht, weil Maschinen nicht in der Lage sind, die Bedeutung eines Begriffs zu interpretieren. Im Semantic Web hingegen wird der Kontext der Information miterfasst.

lookit: Wie funktioniert dann eine Suche im Semantic Web?

Studer: Im semantischen Web sucht man nicht mehr nach Stichworten in ganzen Dokumenten, sondern stellt den Maschinen direkte Fragen. Zum Beispiel: "Wer hat am KIT den Landesforschungspreis bekommen?" Um die passende Antwort zu finden, führt der Computer Informationen aus unterschiedlichen Quellen zusammen. Hier würden es die Liste der Professoren des KIT aus den KIT-Webseiten und die der Forschungspreisträger aus den Seiten des Landes Baden-Württemberg sein. Das geschieht automatisch, weil die Daten im Semantischen Web logisch miteinander verknüpft sind.

lookit: Wie werden solche Verknüpfungen erstellt?

Studer: Dies lässt sich an Hand von Systemen wie MediaWiki, der Software von Wikipedia erklären. Der Artikel über Karlsruhe ist dort zum Beispiel mit dem über Deutschland verlinkt. Der Leser erkennt dabei: Aha, Karlsruhe liegt in Deutschland. Für den Rechner aber hat dies keine Bedeutung. Die Informationen müssen erst strukturiert und mit Metadaten versehen werden, damit der Computer weiß, worum es geht. In der am AIFB entwickelten semantischen Erweiterung von MediaWiki wird der Maschine gesagt, dass Karlsruhe eine Stadt ist und Deutschland ein Land. Diese Informationen werden dann über eine so genannte "Triple Struktur" vernetzt: "Karlsruhe" und "Deutschland" werden mit der Relation "liegt in" verknüpft. So weiß der Rechner: Es geht um eine Stadt, die in einem Land liegt. Nach diesem Prinzip kann man alle möglichen Informationen unterschiedlich verknüpfen.

lookit: Und welche Vorteile hat ein semantisches Wiki?

Studer: Semantik gewährleistet Aktualität und Konsistenz der Informationen. Will man eine Liste aller deutschen Städte kreieren, muss man sie im herkömmlichen Wikipedia von Hand erstellen und aktualisieren. Das ist eine Menge Arbeit und führt des Öfteren zu falschen Angaben. Mit Semantik ist es einfach, automatisch hochaktuelle Listen beliebiger Daten zu erhalten. Zudem ist die Qualität der Daten besser, weil der Computer inkohärente Information automatisch erkennt. Korrekturen werden dann wie in herkömmlichen Wikis durch eine soziale Kontrolle der Angaben vorgenommen.

lookit: Bedeutet dies zusätzliche Arbeit beim Verfassen von Texten?

Studer: Wir arbeiten an Benutzeroberflächen, die das Verknüpfen erleichtern. Keiner muss erstmals alles neu lernen, bevor er etwas in das Semantic Web stellen kann. Es ist kein Zwang - jeder macht nur soviel, wie er möchte. So entsteht ein nahtloser Übergang vom aktuellen Internet in das Semantic Web.

lookit: Wie lässt sich ein semantisches System auf das komplette Internet anwenden?

Studer: Wenn man Semantik in der offenen Umgebung des kompletten Internet anwendet, öffnet dies breite, neue Möglichkeiten. Informationen aus Datenbanken und aus einzelnen Dokumenten können verknüpft werden. Um sie zugänglich zu machen, müssen die textlichen Informationen, wie in unserem Wikipedia-Beispiel, durch eine formale Struktur angereichert werden. Dann kann man Daten flexibel zusammenstellen, die ursprünglich nichts miteinander zu tun haben. So ist es möglich, Hoteladressen mit Google Maps zu verbinden, um ihren Standort direkt auf der Karte anzeigen zu können. Weltweit kann man so riesige Datenbestände unterschiedlich verknüpfen, um Informationen je nach Kontext der Anwendung in verschiedene Zusammenhänge zu bringen.

lookit: Ist das System nicht anfällig gegen Missbrauch? Könnte nicht jemand versuchen, falsche Informationen im ganzen Web automatisch zu verteilen?

Studer: Diese Gefahr besteht grundsätzlich und kann auch nicht ausgeschlossen werden. Mit automatischen Systemen breiten sich Fehler wahrscheinlich schneller aus. Aber durch die inhaltliche Verknüpfung ist es dann auch eher möglich, sie wieder zu beseitigen. Zum anderen funktioniert die Community basierte Kontrolle eigentlich sehr gut. Im schlimmsten Fall gäbe es immer noch die Möglichkeit - wie in Wikipedia - gewisse Seiten zu sperren, so dass sie von externen Benutzern nicht abgeändert werden können.

lookit: Gibt es schon semantische Anwendungen?

Studer: Im Web gibt es schon viele Community-Seiten und Suchmaschinen, die auf semantischer Technik basieren. Auch verschiedene Firmen benutzen zum Beispiel semantische Datenintegration, semantische Ratgebersysteme oder semantische Wikis. Das KIT bietet im Gebiet Semantik zusammen mit dem FZI Forschungszentrum Informatik und dem Spin-off Unternehmen ontoprise GmbH eine einzigartige Kombination aus Grundlagenforschung, Technologietransfer und Verkauf kommerzieller Lösungen. Aber Web 3.0 hat noch mehr Potenzial: Man könnte es mit der realen Welt verknüpfen.

lookit: Um eine weitere, neue Web-Dimension zu eröffnen?

Studer: Das Semantic Web tendiert jetzt schon in eine weitere Dimension: dem "Web der Dinge", eine Verknüpfung zwischen realer Welt und IT-Welt. In der Logistik könnten zum Beispiel einzelne Produkt-Paletten mit Sensoren versehen und mit der Produktionsplanung verbunden werden. So könnten Firmen Prozesse optimieren, indem sie aktuelle Informationen verwenden.


*


Quelle:
lookit - Ausgabe 1/2009, S. 28-29
Das Magazin für Forschung, Lehre und Innovation
Herausgegeben vom Karlsruher Institut für Technologie (KIT)
KIT - Universität des Landes Baden-Württemberg und
nationales Forschungsinstitut in der Helmholtz-Gemeinschaft
Redaktion: lookit, Vincenz-Prießnitz-Straße 1, 76131 Karlsruhe
Klaus Rümmele (verantwortlich)
Telefon: 0721 / 608 - 8153, Fax 0721 / 608 - 5681
E-Mail: klaus.ruemmele@kit.edu
Internet: www.pmk.kit.edu


veröffentlicht im Schattenblick zum 22. April 2010