Filtern nach
Letzte Suchanfragen

Ergebnisse für *

Es wurden 3 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 3 von 3.

Sortieren

  1. Finite-state canonicalization techniques for historical German
    Autor*in: Jurish, Bryan
    Erschienen: 2011

    This work addresses issues in the automatic preprocessing of historical German input text for use by conventional natural language processing techniques. Conventional techniques cannot adequately account for historical input text due to conventional... mehr

    Universität Potsdam, Universitätsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe

     

    This work addresses issues in the automatic preprocessing of historical German input text for use by conventional natural language processing techniques. Conventional techniques cannot adequately account for historical input text due to conventional tools' reliance on a fixed application-specific lexicon keyed by contemporary orthographic surface form on the one hand, and the lack of consistent orthographic conventions in historical input text on the other. Historical spelling variation is treated here as an error-correction problem or "canonicalization" task: an attempt to automatically assign each (historical) input word a unique extant canonical cognate, thus allowing direct application-specific processing (tagging, parsing, etc.) of the returned canonical forms without need for any additional application-specific modifications. In the course of the work, various methods for automatic canonicalization are investigated and empirically evaluated, including conflation by phonetic identity, conflation by lemma instantiation heuristics, canonicalization by weighted finite-state rewrite cascade, and token-wise disambiguation by a dynamic Hidden Markov Model.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Englisch
    Medientyp: Dissertation
    Format: Druck
    Umfang: IX, 141 S., graph. Darst.
    Bemerkung(en):

    Potsdam, Univ., Diss., 2011

  2. Finite-state canonicalization techniques for historical German
    Autor*in: Jurish, Bryan
    Erschienen: 2011

    Diese Arbeit behandelt Themen der automatischen Vorverarbeitung historischen deutschen Textes für die Weiterverarbeitung durch konventionelle computerlinguistische Techniken. Konventionelle Techniken können historischen Text wegen des hohen Grads an... mehr

    Universitätsbibliothek Augsburg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Bayerische Staatsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe

     

    Diese Arbeit behandelt Themen der automatischen Vorverarbeitung historischen deutschen Textes für die Weiterverarbeitung durch konventionelle computerlinguistische Techniken. Konventionelle Techniken können historischen Text wegen des hohen Grads an graphematischer Variation in solchem Text ohne eine solche Vorverarbeitung nicht zufriedenstellend behandeln. Variation in der historischen Rechtschreibung wird hier als Fehlerkorrekturproblem oder "Kanonikalisierungsaufgabe" behandelt: ein Versuch, jedem (historischen) Eingabewort eine eindeutige extante Äquivalente zuzuordnen; so können konventionelle Techniken ohne weitere Modifikation direkt auf den gelieferten kanonischen Formen arbeiten. Verschiedene Methoden zur automatischen Kanonikalisierung werden im Rahmen dieser Arbeit untersucht, unter anderem Konflation durch phonetische Identität, Konflation durch Lemma-Instanziierungsheuristiken, Kanonikalisierung durch eine Kaskade gewichteter endlicher Transduktoren, und Disambiguiierung von Konflationskandidaten durch ein dynamisches Hidden Markov Modell.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Deutsch
    Medientyp: Dissertation
    RVK Klassifikation: ES 935 ; GC 1168
    DDC Klassifikation: Datenverarbeitung; Informatik (004); Sprache (400); Germanische Sprachen; Deutsch (430)
    Schlagworte: Korrektur; Computerlinguistik; Rechtschreibung; Deutsch
    Umfang: 141 S., graph. Darst., 30 cm
    Bemerkung(en):

    Potsdam, Univ., Diss., 2011 (Nicht für den Austausch)

  3. Finite-state canonicalization techniques for historical German
    Autor*in: Jurish, Bryan
    Erschienen: 2011

    This work addresses issues in the automatic preprocessing of historical German input text for use by conventional natural language processing techniques. Conventional techniques cannot adequately account for historical input text due to conventional... mehr

    Universität Potsdam, Universitätsbibliothek
    02 B .001069
    keine Ausleihe von Bänden, nur Papierkopien werden versandt
    Universität Potsdam, Universitätsbibliothek
    ES 935 JUR
    uneingeschränkte Fernleihe, Kopie und Ausleihe

     

    This work addresses issues in the automatic preprocessing of historical German input text for use by conventional natural language processing techniques. Conventional techniques cannot adequately account for historical input text due to conventional tools' reliance on a fixed application-specific lexicon keyed by contemporary orthographic surface form on the one hand, and the lack of consistent orthographic conventions in historical input text on the other. Historical spelling variation is treated here as an error-correction problem or "canonicalization" task: an attempt to automatically assign each (historical) input word a unique extant canonical cognate, thus allowing direct application-specific processing (tagging, parsing, etc.) of the returned canonical forms without need for any additional application-specific modifications. In the course of the work, various methods for automatic canonicalization are investigated and empirically evaluated, including conflation by phonetic identity, conflation by lemma instantiation heuristics, canonicalization by weighted finite-state rewrite cascade, and token-wise disambiguation by a dynamic Hidden Markov Model.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Englisch
    Medientyp: Dissertation
    Format: Druck
    Umfang: IX, 141 S., graph. Darst.
    Bemerkung(en):

    Potsdam, Univ., Diss., 2011