Diese Arbeit untersucht vollständige Zeichenkettenfrequenzverteilungen natürlichsprachiger Texte auf ihren linguistischen und anwendungsbezogenen Gehalt. Im ersten Teil wird auf dieser Datengrundlage ein unüberwachtes Lernverfahren entwickelt, das Texte in Morpheme zerlegt. Die Zerlegung geht von der Satzebene aus und verwendet jegliche vorhandene Kontextinformation. Es ergibt sich ein sprachunabhängiger Algorithmus, der die gefundenen Morpheme teilweise zu Baumstrukturen zusammenordnet. Die Evaluation der Ergebnisse mit Hilfe statistischer Modelle ermöglicht die Identifizierung auch kleiner Performanzunterschiede. Diese sind einer linguistischen Interpretation zugänglich. Der zweite Teil der Arbeit besteht aus stilometrischen Unters...
Die vorliegende Diplomarbeit beschäftigt sich mit der Frage, wie die Schwierigkeit von kroatischen T...
In this paper we attempt to determine the criteria speakers apply in morphologically or syntacticall...
Das Ziel dieser Arbeit ist die Formulierung eines Ansatzes zum maschinellen Lernen von Sprachmorphol...
Diese Arbeit untersucht vollständige Zeichenkettenfrequenzverteilungen natürlichsprachiger Texte auf...
Wortfolgen wie vor allem, Mit freundlichen Grüssen oder von Fall zu Fall sind Beispiele für Mehrwort...
In this paper, we present a segmentation system for German texts. We apply conditional random fields...
International audienceDer breite Einsatz von CAT-Tools in der Fachübersetzung - wie z. B. Translatio...
Dieser Artikel beschäftigt sich mit der morphologischen Variation der deutschen or-Substantive, die ...
The present paper offers a comparative presentation of the possibilities and limits of five of the m...
In the past years a large number of electronic text corpora for German have been created due to the ...
It is well known that linguistic variants play a key role in the acquisition of language skills in t...
This thesis discusses ways to employ a certain mathematical characterization of similarity, kernel f...
CONTRIBUTIONS TO THE STUDY OF GERMAN USAGE A CORPUS-BASED APPROACH This paper outlines some basic a...
It is well known that linguistic variants play a key role in the acquisition of language skills in t...
Kombinationen aus Präposition und artikelloser Nominalprojektion, deren syntaktischer Kopf ein zählb...
Die vorliegende Diplomarbeit beschäftigt sich mit der Frage, wie die Schwierigkeit von kroatischen T...
In this paper we attempt to determine the criteria speakers apply in morphologically or syntacticall...
Das Ziel dieser Arbeit ist die Formulierung eines Ansatzes zum maschinellen Lernen von Sprachmorphol...
Diese Arbeit untersucht vollständige Zeichenkettenfrequenzverteilungen natürlichsprachiger Texte auf...
Wortfolgen wie vor allem, Mit freundlichen Grüssen oder von Fall zu Fall sind Beispiele für Mehrwort...
In this paper, we present a segmentation system for German texts. We apply conditional random fields...
International audienceDer breite Einsatz von CAT-Tools in der Fachübersetzung - wie z. B. Translatio...
Dieser Artikel beschäftigt sich mit der morphologischen Variation der deutschen or-Substantive, die ...
The present paper offers a comparative presentation of the possibilities and limits of five of the m...
In the past years a large number of electronic text corpora for German have been created due to the ...
It is well known that linguistic variants play a key role in the acquisition of language skills in t...
This thesis discusses ways to employ a certain mathematical characterization of similarity, kernel f...
CONTRIBUTIONS TO THE STUDY OF GERMAN USAGE A CORPUS-BASED APPROACH This paper outlines some basic a...
It is well known that linguistic variants play a key role in the acquisition of language skills in t...
Kombinationen aus Präposition und artikelloser Nominalprojektion, deren syntaktischer Kopf ein zählb...
Die vorliegende Diplomarbeit beschäftigt sich mit der Frage, wie die Schwierigkeit von kroatischen T...
In this paper we attempt to determine the criteria speakers apply in morphologically or syntacticall...
Das Ziel dieser Arbeit ist die Formulierung eines Ansatzes zum maschinellen Lernen von Sprachmorphol...