contents previous up next
Previous: Abgrenzung zu ähnlichen Systemen Up: Seminar 1903 Hybride Systeme (Cyc) Next: Die Umgebung für Cyc

Die Wissensbasis

Folie 2

Cycs Wissensbasis beinhaltet den Großteil des Faktenwissens und des heuristischen Wissens, die zusammen das Grundwissen ergeben, von dem angenommen werden kann, daß es ein durchschnittlicher Erwachsener weiß.

Die Entwickler von Cyc entschlossen sich, das Wissen, das man zum Verständnis eines kleinen Lexikons und einer Zeitung (inklusive Anzeigen etc.) benötigt, in Cycs Datenbank aufzunehmen. Zum Überprüfen der Wissensbasis bekommt Cyc Texte ,, erklärt'', und anschließend werden ihm Fragen gestellt, die auch ein Mensch, der den Text gelesen hat, beantworten können sollte. Cyc wird dann so lange erweitert, bis auch er diese Fragen beantworten kann.

Eine weitere Testmethode ist die Präsentation von unglaubwürdigen Texten. Hierbei sollte auch Cyc Verständnisprobleme zeigen. Ein Beispiel ist ein Artikel über einen indischen Guru, der sieben Tage und sieben Nächte lang unter Wasser saß. Ein Auszug aus dem Text: ,,Skeptiker glauben, daß er nachts zum Luftholen auftauchte.''
Der Großteil des in Cyc gespeicherten Wissens ist nichtwissenschaftlicher Art, und die Repräsentation dieser Bereiche ist noch nicht sehr intensiv erforscht worden. Daher war das Finden geeigneter Darstellungsmethoden eine Hauptaufgabe bei Cycs Gestaltung.

Zwischen 1984 und 1989 hat eine kleine Gruppe von KI-Forschern des Cyc-Teams sich bemüht, diverse problematische Wissensbereiche wie Zeit, Raum, Glauben, Materie, Kausalzusammenhänge, Möglichkeit, intelligentes Verhalten usw. adäquat zu repräsentieren. Diese Bereiche machen jedoch nur ein Prozent von Cycs Wissensbasis aus. Seit 1989 ist eine wachsende Anzahl von Knowledge Editors damit beschäftigt, die restlichen 99 Prozent der grundlegenden Wissensbasis mit Hilfe von computerunterstützten Kopier- und Editierprozeduren einzugeben. Gleichzeitig wurde ein System entwickelt, das mit Cyc interagiert und zur semantischen Eindeutigmachung, Auflösung von Referenzen, Interpretation von Ellipsen etc. dient. Dieses System wird von Cyc als Wissenserwerbsmechanismus benutzt.

Die in Cyc gespeicherten Aussagen sind in sogenannten Kontexten oder Mikrotheorien zusammengefaßt. Eine Mikrotheorie besteht aus Axiomen, die als Ausgangspunkt für die Inferenzmechanismen dienen, und beschreibt einen bestimmten Wissens- oder Themenbereich. Dies können abstrakte Bereiche wie die bereits angesprochenen (Zeit, Raum, Glauben etc.) oder auch alltägliche Dinge wie das Wetter, das Herstellen eines bestimmten Gegenstandes oder das Gehen sein. Auch verschiedene Sichtweisen auf ein und denselben Themenbereich werden in Mikrotheorien repräsentiert, wie zum Beispiel die Sichtweise eines Arztes im Vergleich mit der eines Patienten.

Zu Anfang der Entwicklung wurde Cyc als rein frame-basiertes System mit Vererbung als dem fast ausschließlich verwendeten Inferenzschema angelegt, doch dies führte im Laufe der Zeit zu Schwierigkeiten, als beispielsweise Prädikate mit höherer Stelligkeit eingeführt wurden, die sich nicht geradlinig in Frames umsetzen ließen. Mittlerweile betrachtet das Cyc-Team die Wissensbasis als ``sea of assertions'', in dem jede Aussage für alle in ihr beteiligten Elemente der Wissensbasis gleichermaßen Bedeutung hat. Die Aussage beispielsweise, daß Fred Sallys Vater ist, sagt genauso etwas über Sally aus wie über Fred. Die Inferenzmechanismen haben sich ebenfalls gewandelt und bestehen jetzt hauptsächlich aus Deduktionsverfahren. Außerhalb dieses ,,Sees'' befinden sich die Konstanten, die mit jeder sie betreffenden Aussage wie durch einen Faden verbunden sind. Auch die Aussagen im ,,See'' können als Konstanten betrachtet werden und mit anderen Aussagen verbunden werden. Jedesmal, wenn eine neue Aussage zugefügt wird, wird sie automatisch mit allen involvierten Konstanten und Aussagen verbunden, was wiederum die Bildung neuer Aussagen verursachen kann. Dies breitet sich wellenförmig über den ganzen ,,See'' aus. Manchmal entsteht dabei eine gesuchte Antwort, manchmal werden Widersprüche geschaffen, die dann aufgelöst werden müssen.

Auch die Größe von Cycs Datenbank hat sich im Laufe der Jahre verändert, da die gespeicherten Axiome und Fakten sich verändert haben. Viele Axiome konnten im Laufe der Jahre generalisiert werden, was ihre Zahl und damit die Größe der Datenbank verringert hat. Wurden neue Kontexte oder Mikrotheorien hinzugefügt, hat sich die Datenbank vergrößert, obwohl man mehr und mehr auf bereits vorhandene Informationen zurückgreifen konnte.

Die Datenbank enthält mehr als 400.000 signifikante logische Aussagen, von denen weniger als 30.000 Regeln sind. Es gibt zur Zeit über 500 Mikrotheorien.

Ca. 30.000 Einträge der Wissensbasis bestehen aus konstanten Termen wie z. B. Kategorien von anfaßbaren Objekten, Aktionen von Personen, binäre Prädikate, Gesprächsteile, bestimmte Personen und Attribute.

Allmählich nähert sich der Umfang von Cyc dem Punkt, an dem er selbständig Texte lesen und sich damit neues Wissen aneignen kann. Die Rolle des Menschen beim Wissenserwerb wandelt sich damit mehr in die eines Lehrers.

Die Mitglieder des Cyc-Teams behaupten nicht, daß die Organisation von Cycs Datenbank die ,,korrekte'' ist, sondern sie hat sich als mehr oder weniger geeignet herausgestellt, oder besser: sie kann durch Korrekturen und Erweiterungen in eine geeignete Darstellung gebracht werden.


contents previous up next
Previous: Abgrenzung zu ähnlichen Systemen Up: Seminar 1903 Hybride Systeme (Cyc) Next: Die Umgebung für Cyc