Ergebnisse für *

Es wurden 13 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 13 von 13.

Sortieren

  1. Canonicalizing the Deutsches Textarchiv
    Autor*in: Jurish, Bryan
    Erschienen: 2013
    Verlag:  Berlin-Brandenburgische Akademie der Wissenschaften, Berlin

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Korpus <Linguistik>; Deutsch
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Hafemann, Ingelore (Hrsg.): Perspektiven einer corpusbasierten historischen Linguistik und Philologie : Internationale Tagung des Akademienvorhabens „Altägyptisches Wörterbuch“ an der BBAW, 12.-13. Dezember 2011 (Thesaurus Linguae Aegyptiae ; 4). Berlin, S. 235-244

  2. Canonicalizing the Deutsches Textarchiv
    Autor*in: Jurish, Bryan
    Erschienen: 2013

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Lizenz:

    kostenfrei

  3. Finite-state canonicalization techniques for historical German
    Autor*in: Jurish, Bryan
    Erschienen: 2012
    Verlag:  Universitätsbibliothek der Universität Potsdam, Potsdam

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Staudacher, Peter (Akademischer Betreuer)
    Sprache: Englisch
    Medientyp: Dissertation
    Format: Online
    Weitere Identifier:
    Weitere Schlagworte: Array
    Umfang: Online-Ressource
    Bemerkung(en):

    Potsdam, Universität Potsdam, Diss., 2011

  4. Finite-state canonicalization techniques for historical German
    Autor*in: Jurish, Bryan

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Deutsch
    Medientyp: Dissertation
    Format: Druck
    Weitere Schlagworte: Array
    Umfang: 141 S., graph. Darst., 30 cm
    Bemerkung(en):

    Potsdam, Univ., Diss., 2011 (Nicht für den Austausch)

  5. Canonicalizing the Deutsches Textarchiv
    Autor*in: Jurish, Bryan
    Erschienen: 2013
    Verlag:  Berlin-Brandenburgische Akademie der Wissenschaften, Berlin

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Schlagworte: Korpus <Linguistik>; Deutsch
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Hafemann, Ingelore (Hrsg.): Perspektiven einer corpusbasierten historischen Linguistik und Philologie : Internationale Tagung des Akademienvorhabens „Altägyptisches Wörterbuch“ an der BBAW, 12.-13. Dezember 2011 (Thesaurus Linguae Aegyptiae ; 4). Berlin, S. 235-244

  6. Canonicalizing the Deutsches Textarchiv
    Autor*in: Jurish, Bryan
    Erschienen: 2013
    Verlag:  Berlin-Brandenburgische Akademie der Wissenschaften, Berlin

    Zugang:
    Verlag (kostenfrei)
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Umfang: 1 Online-Ressource
    Bemerkung(en):

    In: Hafemann, Ingelore (Hrsg.): Perspektiven einer corpusbasierten historischen Linguistik und Philologie : Internationale Tagung des Akademienvorhabens „Altägyptisches Wörterbuch“ an der BBAW, 12.-13. Dezember 2011 (Thesaurus Linguae Aegyptiae ; 4). Berlin, S. 235-244

  7. Finite-state canonicalization techniques for historical German
    Autor*in: Jurish, Bryan
    Erschienen: 2011

    This work addresses issues in the automatic preprocessing of historical German input text for use by conventional natural language processing techniques. Conventional techniques cannot adequately account for historical input text due to conventional... mehr

    Universität Potsdam, Universitätsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe

     

    This work addresses issues in the automatic preprocessing of historical German input text for use by conventional natural language processing techniques. Conventional techniques cannot adequately account for historical input text due to conventional tools' reliance on a fixed application-specific lexicon keyed by contemporary orthographic surface form on the one hand, and the lack of consistent orthographic conventions in historical input text on the other. Historical spelling variation is treated here as an error-correction problem or "canonicalization" task: an attempt to automatically assign each (historical) input word a unique extant canonical cognate, thus allowing direct application-specific processing (tagging, parsing, etc.) of the returned canonical forms without need for any additional application-specific modifications. In the course of the work, various methods for automatic canonicalization are investigated and empirically evaluated, including conflation by phonetic identity, conflation by lemma instantiation heuristics, canonicalization by weighted finite-state rewrite cascade, and token-wise disambiguation by a dynamic Hidden Markov Model.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Englisch
    Medientyp: Dissertation
    Format: Druck
    Umfang: IX, 141 S., graph. Darst.
    Bemerkung(en):

    Potsdam, Univ., Diss., 2011

  8. Finite-state canonicalization techniques for historical German
    Autor*in: Jurish, Bryan
    Erschienen: 2011

    Diese Arbeit behandelt Themen der automatischen Vorverarbeitung historischen deutschen Textes für die Weiterverarbeitung durch konventionelle computerlinguistische Techniken. Konventionelle Techniken können historischen Text wegen des hohen Grads an... mehr

    Universitätsbibliothek Augsburg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Bayerische Staatsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe

     

    Diese Arbeit behandelt Themen der automatischen Vorverarbeitung historischen deutschen Textes für die Weiterverarbeitung durch konventionelle computerlinguistische Techniken. Konventionelle Techniken können historischen Text wegen des hohen Grads an graphematischer Variation in solchem Text ohne eine solche Vorverarbeitung nicht zufriedenstellend behandeln. Variation in der historischen Rechtschreibung wird hier als Fehlerkorrekturproblem oder "Kanonikalisierungsaufgabe" behandelt: ein Versuch, jedem (historischen) Eingabewort eine eindeutige extante Äquivalente zuzuordnen; so können konventionelle Techniken ohne weitere Modifikation direkt auf den gelieferten kanonischen Formen arbeiten. Verschiedene Methoden zur automatischen Kanonikalisierung werden im Rahmen dieser Arbeit untersucht, unter anderem Konflation durch phonetische Identität, Konflation durch Lemma-Instanziierungsheuristiken, Kanonikalisierung durch eine Kaskade gewichteter endlicher Transduktoren, und Disambiguiierung von Konflationskandidaten durch ein dynamisches Hidden Markov Modell.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Deutsch
    Medientyp: Dissertation
    RVK Klassifikation: ES 935 ; GC 1168
    DDC Klassifikation: Datenverarbeitung; Informatik (004); Sprache (400); Germanische Sprachen; Deutsch (430)
    Schlagworte: Korrektur; Computerlinguistik; Rechtschreibung; Deutsch
    Umfang: 141 S., graph. Darst., 30 cm
    Bemerkung(en):

    Potsdam, Univ., Diss., 2011 (Nicht für den Austausch)

  9. Finite-state canonicalization techniques for historical German
    Autor*in: Jurish, Bryan
    Erschienen: 2011

    This work addresses issues in the automatic preprocessing of historical German input text for use by conventional natural language processing techniques. Conventional techniques cannot adequately account for historical input text due to conventional... mehr

    Universität Potsdam, Universitätsbibliothek
    02 B .001069
    keine Ausleihe von Bänden, nur Papierkopien werden versandt
    Universität Potsdam, Universitätsbibliothek
    ES 935 JUR
    uneingeschränkte Fernleihe, Kopie und Ausleihe

     

    This work addresses issues in the automatic preprocessing of historical German input text for use by conventional natural language processing techniques. Conventional techniques cannot adequately account for historical input text due to conventional tools' reliance on a fixed application-specific lexicon keyed by contemporary orthographic surface form on the one hand, and the lack of consistent orthographic conventions in historical input text on the other. Historical spelling variation is treated here as an error-correction problem or "canonicalization" task: an attempt to automatically assign each (historical) input word a unique extant canonical cognate, thus allowing direct application-specific processing (tagging, parsing, etc.) of the returned canonical forms without need for any additional application-specific modifications. In the course of the work, various methods for automatic canonicalization are investigated and empirically evaluated, including conflation by phonetic identity, conflation by lemma instantiation heuristics, canonicalization by weighted finite-state rewrite cascade, and token-wise disambiguation by a dynamic Hidden Markov Model.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Englisch
    Medientyp: Dissertation
    Format: Druck
    Umfang: IX, 141 S., graph. Darst.
    Bemerkung(en):

    Potsdam, Univ., Diss., 2011

  10. Finite-state canonicalization techniques for historical German
    Autor*in: Jurish, Bryan
    Erschienen: 2012
    Verlag:  Universitätsbibliothek der Universität Potsdam, Potsdam

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Staudacher, Peter (Akademischer Betreuer)
    Sprache: Englisch
    Medientyp: Dissertation
    Format: Online
    Weitere Identifier:
    Weitere Schlagworte: Array
    Umfang: Online-Ressource
    Bemerkung(en):

    Potsdam, Universität Potsdam, Diss., 2011

  11. Finite-state canonicalization techniques for historical German
    Autor*in: Jurish, Bryan

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Sprache: Deutsch
    Medientyp: Dissertation
    Format: Druck
    Weitere Schlagworte: Array
    Umfang: 141 S., graph. Darst., 30 cm
    Bemerkung(en):

    Potsdam, Univ., Diss., 2011 (Nicht für den Austausch)

  12. Canonicalizing the Deutsches Textarchiv
    Autor*in: Jurish, Bryan
    Erschienen: 2013

    Virtually all conventional text-based natural language processing techniques - from traditional information retrieval systems to full-fledged parsers - require reference to a fixed lexicon accessed by surface form, typically trained from or... mehr

     

    Virtually all conventional text-based natural language processing techniques - from traditional information retrieval systems to full-fledged parsers - require reference to a fixed lexicon accessed by surface form, typically trained from or constructed for synchronic input text adhering strictly to contemporary orthographic conventions. Unconventional input such as historical text which violates these conventions therefore presents difficulties for any such system due to lexical variants present in the input but missing from the application lexicon. To facilitate the extension of synchronically-oriented natural language processing techniques to historical text while minimizing the need for specialized lexical resources, one may first attempt an automatic canonicalization of the input text. This paper provides an informal overview of the various canonicalization techniques currently employed by the Deutsches Textarchiv project at the Berlin-Brandenburg Academy of Sciences and Humanities to prepare a corpus of historical German text for part-of-speech tagging, lemmatization, and integration into a robust online information retrieval system.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus; Deutsch
    Lizenz:

    info:eu-repo/semantics/openAccess

  13. Finite-state canonicalization techniques for historical German