contents previous up next
Previous: Agenden und Suchstrategien Up: Kontrollmechanismen Next: Erweiterungsmöglichkeiten der Chart-Analyse

 

Analyse- oder Parsingstrategien

Die soeben vorgestellten Suchstrategien legen die Abarbeitungsreihenfolge der auf die Bearbeitung wartenden Tasks fest. Jetzt betrachten wir eine weitere Gruppe von Strategien, die Parsing- oder Analysestrategien. Sie legen fest, in welcher Reihenfolge die Regeln der Grammatik angewendet und damit neue leere Kanten generiert werden. Damit wird die globale Vorgehensweise der Analyse gesteuert. Hierbei gibt es zwei prinzipielle Methoden: die zielgesteuerte oder ``Top-Down''-Vorgehensweise und die datengesteuerte oder ``Bottom-Up''-Vorgehensweise.

Beim ``Top-Down''-Verfahren beginnt man mit der Angabe eines oder mehrerer Ziele (z. B. Konstituentenhypothesen wie S oder NG) und sucht eine Ableitung dieses Ziels für den gegebenen Satz. Beim ``Bottom-Up''-Prinzip wird eine Zustandsraumsuche durchgeführt, indem von den Daten (den bewerteten Worthypothesen) ausgehend versucht wird, eine Reduktion für sie zu finden.

Diese beiden Parsingstrategien werden bei der aktiven Chart-Analyse folgendermaßen angewendet:

Top-Down-Analysestrategie: Wird eine aktive Kante zur Chart hinzugefügt und ist das erste Symbol ihrer Fortsetzung nicht-terminal, wird für jede Regel der Grammatik, die dieses Symbol expandiert, eine leere aktive Kante an ihrem rechten Ende generiert.

Bottom-Up-Analysestrategie: Wird eine inaktive Kante zur Chart hinzugefügt, wird für jede Regel der Grammatik, deren rechte Seite mit der Kategorie dieser Kante beginnt, eine leere aktive Kante an ihrem linken Ende generiert.

Eine Top-Down-Analyse wird durch das Einfügen einer leeren aktiven Kante für das Startsymbol der Grammatik am ersten Knoten der Chart angestoßen. Eine Bottom-Up-Analyse kann nach der Initialisierung der Chart beginnen und generiert leere aktive Kanten an den linken Enden der inaktiven Kanten. Zur Beschleunigung dieses Verfahrens kann eine Lookup-Tabelle erstellt werden. In dieser Tabelle wird bei der Top-Down-Analyse jede Regel der Grammatik mit dem an erster Stelle ihrer rechten Seite auftretenden Symbol verknüpft. Bei der Bottom-Up-Analyse wird jedes Symbol mit den Regeln, auf deren rechter Seite es an erster Stelle auftritt, verknüpft.

Verwendet man die Bottom-Up-Strategie in Verbindung mit einer komplexen Grammatik, besteht die Gefahr, daß sehr schnell sehr viele leere aktive Kanten in die Chart eingefügt werden. Dies tritt besonders bei der Analyse einer Menge zeitlich konkurrierender Worthypothesen auf, was bei der Verarbeitung gesprochener Sprache der Fall ist.   Es liegt dann nahe, eine selektive Variante der Bottom-Up-Strategie einzusetzen. Dabei werden als Selektionskriterien nicht nur die Wortkategorien verwendet, sondern z. B. auch die Erkennungsqualität des gesprochenen Wortes. Auch die Auszeichnung bestimmter syntaktischer Kategorien, der sogenannten Nukleus-Kategorien, für die Wahl von Startpunkten hat sich als sinnvoll erwiesen. Wörter dieser Kategorien sind für eine nachgeschaltete semantisch-pragmatische Analyse von besonderer Bedeutung (z. B. Verb, Nomen und Präposition), so daß mit den von der Bottom-Up-Analyse gelieferten Konstituentenhypothesen möglichst frühzeitig weitergearbeitet werden kann. Des weiteren müssen für dieses Verfahren die Grammatikregeln so modifiziert werden, daß die Nukleus-Kategorien jeweils als erste Elemente der rechten Seiten auftreten. Damit ist die selektive Bottom-Up-Analyse aber nichts anderes als der von links nach rechts gerichtete Teil der Inselanalyse (siehe Kapitel 3.3).

Zur Analyse gesprochener Sprache ist die Bottom-Up-Strategie vorzuziehen, da nicht davon ausgegangen werden kann, daß alle tatsächlich gesprochenen Wörter mit ausreichender Qualität erkannt werden. Die Technik der aktiven Chart-Analyse garantiert, daß alle grammatischen Fragmente, die sich in der Menge der Worthypothesen mit hinreichend guter Bewertung befinden, auch tatsächlich gefunden werden, da jedes Fragment mit der ,,höchstmöglichen'' Kategorie markiert wird. Damit zeichnen sich Bottom-Up-Strategien durch einen höheren Grad an Robustheit aus.

Auch hier gilt aber, daß die Unterschiede zwischen den beiden Methoden durch die Verwendung der Chart und damit durch die Wiederverwendung bereits analysierter Teilsätze geringer werden. Einige Parsingalgorithmen kann man sogar so implementieren, daß sie den Anschein erwecken, als würden sie die jeweils andere Methode verwenden. Effiziente Parser verwenden meist sogar eine Kombination beider Verfahren. Daher ist es auch hier sinnvoller, sich auf den Suchraum selbst zu konzentrieren als auf verschiedene Methoden seiner Numerierung. [MCP87]


contents previous up next
Previous: Agenden und Suchstrategien Up: Kontrollmechanismen Next: Erweiterungsmöglichkeiten der Chart-Analyse