Letzte Suchanfragen

Ergebnisse für *

Es wurden 40 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 25 von 40.

Sortieren

  1. Das Dortmunder Chat-Korpus in CLARIN-D: Modellierung und Mehrwerte
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Herold, Axel (Verfasser); Lüngen, Harald (Verfasser); Storrer, Angelika (Verfasser)
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Korpus <Linguistik>; Chatten <Kommunikation>; Mehrwert; Computerlinguistik; Modellierung; Annotation; Sprachgebrauch; Deutsch; Chatten <Kommunikation>; Korpus <Linguistik>
    Weitere Schlagworte: CLARIN-D
    Umfang: Online-Ressource
    Bemerkung(en):

    In: DHd 2016. Modellierung - Vernetzung - Visualisierung. Die Digital Humanities als fächerübergreifendes Forschungsparadigma. Konferenzabstracts. - Duisburg : nisaba, 2016., S. 274-277, ISBN 978-3-941379-05-3

  2. Tagset und Richtlinie für das PoSTagging von Sprachdaten aus Genres internetbasierter Kommunikation
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Bartz, Thomas (Verfasser); Storrer, Angelika (Verfasser); Westpfahl, Swantje (Verfasser)
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Semantik; Korpus <Linguistik>; Internet; Automatische Spracherkennung; Annotation
    Umfang: Online-Ressource
  3. IGGSA-STEPS: Shared Task on Source and Target Extraction from Political Speeches
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Struß, Julia Maria (Verfasser); Wiegand, Michael (Herausgeber); Remus, Robert (Herausgeber); Gindl, Stefan (Herausgeber)
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Übergeordneter Titel: In: Journal for Language Technology and Computational Linguistics . 29, 2014., 1., S. 33-46
    Schlagworte: Korpus <Linguistik>; Annotation; Parlamentsdebatte; Data Mining; Politische Sprache; Automatische Sprachanalyse
    Weitere Schlagworte: selection of textual sources; annotation guidelines; gold standard corpus
    Umfang: Online-Ressource
  4. Linguistische Annotationen für die Analyse von Gliederungsstrukturen wissenschaftlicher Texte
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Hebborn, Mariana (Verfasser); Klawitter, Jana (Herausgeber); Lobin, Henning (Herausgeber); Schmidt, Torben (Herausgeber)
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Annotation; Ontologie <Wissensverarbeitung>; Korpus <Linguistik>; Überschrift; Gliederung; Codierung; Kopfzeile; Korpus <Linguistik>; Annotation; Ontologie <Wissensverarbeitung>
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Kulturwissenschaften Digital. Neue Forschungsfragen und Methoden. - Frankfurt am Main : Campus, 2012., S. 155-176, ISBN 978-3-593-41287-0

  5. Datenbank für Gesprochenes Deutsch (DGD)
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Gesprochene Sprache; Korpus <Linguistik>; Datenbank; Annotation; Metadaten; Mundart; Transkription; Korpus <Linguistik>; Datenbank; Gesprochene Sprache
    Umfang: Online-Ressource
    Bemerkung(en):

    In: DHd 2016. Modellierung - Vernetzung - Visualisierung. Die Digital Humanities als fächerübergreifendes Forschungsparadigma. Konferenzabstracts. Universität Leipzig 7. bis 12. März 2016. - Duisburg : Nisaba, 2016., S. 364-365, ISBN 978-3-941379-05-3

  6. Tagset und Richtlinie für das PoSTagging von Sprachdaten aus Genres internetbasierter Kommunikation
  7. Extending effect annotation with lexical decomposition
    Erschienen: 2016

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: opinion inference; Annotation; German data
    Lizenz:

    kostenfrei

  8. Linguistische Annotationen für die Analyse von Gliederungsstrukturen wissenschaftlicher Texte
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Hebborn, Mariana (Verfasser); Klawitter, Jana (Herausgeber); Lobin, Henning (Herausgeber); Schmidt, Torben (Herausgeber)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Annotation; Ontologie <Wissensverarbeitung>; Korpus <Linguistik>; Überschrift; Gliederung; Codierung; Kopfzeile; Korpus <Linguistik>; Annotation; Ontologie <Wissensverarbeitung>
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Kulturwissenschaften Digital. Neue Forschungsfragen und Methoden. - Frankfurt am Main : Campus, 2012., S. 155-176, ISBN 978-3-593-41287-0

  9. IGGSA-STEPS: Shared Task on Source and Target Extraction from Political Speeches
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Struß, Julia Maria (Verfasser); Wiegand, Michael (Herausgeber); Remus, Robert (Herausgeber); Gindl, Stefan (Herausgeber)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus <Linguistik>; Annotation; Parlamentsdebatte; Data Mining; Politische Sprache; Automatische Sprachanalyse
    Weitere Schlagworte: selection of textual sources; annotation guidelines; gold standard corpus
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Journal for Language Technology and Computational Linguistics . 29, 2014., 1., S. 33-46

  10. Tagset und Richtlinie für das PoSTagging von Sprachdaten aus Genres internetbasierter Kommunikation
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Bartz, Thomas (Verfasser); Storrer, Angelika (Verfasser); Westpfahl, Swantje (Verfasser)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Semantik; Korpus <Linguistik>; Internet; Automatische Spracherkennung; Annotation
    Umfang: Online-Ressource
  11. Datenbank für Gesprochenes Deutsch (DGD)
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Gesprochene Sprache; Korpus <Linguistik>; Datenbank; Annotation; Metadaten; Mundart; Transkription; Korpus <Linguistik>; Datenbank; Gesprochene Sprache
    Umfang: Online-Ressource
    Bemerkung(en):

    In: DHd 2016. Modellierung - Vernetzung - Visualisierung. Die Digital Humanities als fächerübergreifendes Forschungsparadigma. Konferenzabstracts. Universität Leipzig 7. bis 12. März 2016. - Duisburg : Nisaba, 2016., S. 364-365, ISBN 978-3-941379-05-3

  12. Das Dortmunder Chat-Korpus in CLARIN-D: Modellierung und Mehrwerte
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Herold, Axel (Verfasser); Lüngen, Harald (Verfasser); Storrer, Angelika (Verfasser)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus <Linguistik>; Chatten <Kommunikation>; Mehrwert; Computerlinguistik; Modellierung; Annotation; Sprachgebrauch; Deutsch; Chatten <Kommunikation>; Korpus <Linguistik>
    Weitere Schlagworte: CLARIN-D
    Umfang: Online-Ressource
    Bemerkung(en):

    In: DHd 2016. Modellierung - Vernetzung - Visualisierung. Die Digital Humanities als fächerübergreifendes Forschungsparadigma. Konferenzabstracts. - Duisburg : nisaba, 2016., S. 274-277, ISBN 978-3-941379-05-3

  13. Handbuch Textannotation
    Potsdamer Kommentarkorpus 2.0
    Autor*in:
    Erschienen: 2016
    Verlag:  Universitätsverlag Potsdam, Potsdam

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Stede, Manfred (Herausgeber)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 9783869563435
    Schriftenreihe: Potsdam cognitive science series ; 8
    Schlagworte: Deutsch; Korpus <Linguistik>; Annotation
    Weitere Schlagworte: linguistische Annotation; linguistisches Korpus; Textstruktur; Zeitungskommentare; linguistic annotation; linguistic corpus; text structure; newspaper commentary
    Umfang: xvii, 211 Seiten, Illustrationen, 21 cm
    Bemerkung(en):

    Das Potsdamer Kommentarkorpus ist eine Sammlung von Zeitungstexten, die dem Genre ‘Kommentar' zuzuordnen sind. Der öffentlich verfügbare Teil besteht aus 175 Texten aus der Märkischen Allgemeinen Zeitung, die hinsichtlich Syntax, Koreferenz, Konnektoren und Rhetorische Struktur manuell annotiert wurden. Weitere Ebenen werden bei zukünftigen Korpusversionen hinzukommen. Dieses Buch enthält die Annotationsrichtlinien, die der Bearbeitung des öffentlichen Teils des Korpus zugrunde lagen, sowie auch anderer Teile, bei denen mit weiteren Annotationsebenen experimentiert wurde. Die meisten der Richtlinien werden auch für ähnliche Text-Genres und für andere Sprachen verwendbar sein.

  14. Auf der Suche nach dem "goldnen Baum"
    Digitale Annotation des Metaphernbegriffs in Poetiken : Erkenntnisprozess, diskursive Praktik und "tertium comparationis"
    Autor*in:
    Erschienen: 2016

    Der Begriff der Metapher wird in Poetiken auf der theoretischen Ebene und anhand von literarischen Beispielen kritisch verhandelt. Im Zuge der Entwicklung eines Annotationsschemas differenziert das Projekt ePoetics die wesentlichen Komponenten der... mehr

    Herzog August Bibliothek Wolfenbüttel
    keine Fernleihe

     

    Der Begriff der Metapher wird in Poetiken auf der theoretischen Ebene und anhand von literarischen Beispielen kritisch verhandelt. Im Zuge der Entwicklung eines Annotationsschemas differenziert das Projekt ePoetics die wesentlichen Komponenten der Explikation des Metaphernbegriffs aus und erschließt darüber hinaus die damit verbundenen Diskurs- und Referenzstrukturen. Dabei wird deutlich, welche Erkenntnismöglichkeiten und ‑grenzen sich im kollaborativ-diskursiven Auszeichnungsprozess schon vor der informationstechnischen Auswertung bieten – mit dem digitalen, algorithmischen Paradigma als Folie – und wie Hermeneutik und Algorithmen in Wechselwirkung treten können – im Sinne des ›Algorithmic Criticism‹ nach Stephen Ramsay.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (OpenAccess Lizenz (Creative Commons License))
    Quelle: Herzog August Bibliothek Wolfenbüttel
    Beteiligt: Alscher, Stefan (VerfasserIn); Bender, Michael (VerfasserIn)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Übergeordneter Titel: Enthalten in: 2016; 1(2016), 1; Online-Ressource (HTML, XML, PDF)

    Schlagworte: Annotation; Diskurs; Taxonomie; ; Elektronische Publikation;
    Umfang: Online-Ressource (HTML, XML, PDF)
  15. Handbuch Textannotation
    Potsdamer Kommentarkorpus 2.0
    Autor*in:
    Erschienen: 2016
    Verlag:  Univ.-Verl., Potsdam

    Universität Potsdam, Universitätsbibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Stede, Manfred (HerausgeberIn)
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783869563435
    Weitere Identifier:
    Schriftenreihe: Potsdam Cognitive Science Series ; 8
    Schlagworte: Deutsch; Korpus <Linguistik>; Annotation;
    Umfang: Online-Ressource (PDF-Datei: xvii, 211 S., 4162 KB), Diagramme
    Bemerkung(en):

    Das Potsdamer Kommentarkorpus ist eine Sammlung von Zeitungstexten, die dem Genre ‘Kommentar' zuzuordnen sind. Der öffentlich verfügbare Teil besteht aus 175 Texten aus der Märkischen Allgemeinen Zeitung, die hinsichtlich Syntax, Koreferenz, Konnektoren und Rhetorische Struktur manuell annotiert wurden. Weitere Ebenen werden bei zukünftigen Korpusversionen hinzukommen. Dieses Buch enthält die Annotationsrichtlinien, die der Bearbeitung des öffentlichen Teils des Korpus zugrunde lagen, sowie auch anderer Teile, bei denen mit weiteren Annotationsebenen experimentiert wurde. Die meisten der Richtlinien werden auch für ähnliche Text-Genres und für andere Sprachen verwendbar sein.The Potsdam Commentary Corpus is a collection of newspaper texts belonging to the ‘commentary’ genre. The public part consists of 175 texts from Märkische Allgemeine Zeitung that have been manually annotated for syntax, coreference, connectives, and rhetorical structure. Further layers will be added to future releases of the corpus. This book assembles the annotation guidelines that have been used for that public part, as well as for other portions, where other layers of annotation have been experimented with. Most of the guidelines will be applicable to similar genres, and also to other languages

  16. Annotating and editing with Canonical Text Services (CTS)
    project funded by the Andrew W. Mellon Foundation: 2016-2017 ; project announcement
    Erschienen: 2016

    Universitätsbibliothek Heidelberg
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (Kostenfrei)
    Quelle: Verbundkataloge
    Beteiligt: Schubert, Charlotte (VerfasserIn)
    Sprache: Englisch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    Weitere Identifier:
    Übergeordneter Titel: Enthalten in: Digital classics online; Leipzig : Univ., Historisches Seminar, 2015; 2(2016), 1, Seite 94-99; Online-Ressource

    Schlagworte: Klassische Philologie; Programm; Edition; Annotation; Andrew W. Mellon Foundation;
    Umfang: Illustrationen
  17. Handbuch Textannotation
    Potsdamer Kommentarkorpus 2.0
    Autor*in:
    Erschienen: 2016
    Verlag:  Univ.-Verl., Potsdam

    Universität Potsdam, Universitätsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Stede, Manfred (HerausgeberIn)
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783869563435
    Weitere Identifier:
    Schriftenreihe: Potsdam Cognitive Science Series ; 8
    Schlagworte: Deutsch; Korpus <Linguistik>; Annotation;
    Umfang: Online-Ressource (PDF-Datei: xvii, 211 S., 4162 KB), Diagramme
    Bemerkung(en):

    Das Potsdamer Kommentarkorpus ist eine Sammlung von Zeitungstexten, die dem Genre ‘Kommentar' zuzuordnen sind. Der öffentlich verfügbare Teil besteht aus 175 Texten aus der Märkischen Allgemeinen Zeitung, die hinsichtlich Syntax, Koreferenz, Konnektoren und Rhetorische Struktur manuell annotiert wurden. Weitere Ebenen werden bei zukünftigen Korpusversionen hinzukommen. Dieses Buch enthält die Annotationsrichtlinien, die der Bearbeitung des öffentlichen Teils des Korpus zugrunde lagen, sowie auch anderer Teile, bei denen mit weiteren Annotationsebenen experimentiert wurde. Die meisten der Richtlinien werden auch für ähnliche Text-Genres und für andere Sprachen verwendbar sein.The Potsdam Commentary Corpus is a collection of newspaper texts belonging to the ‘commentary’ genre. The public part consists of 175 texts from Märkische Allgemeine Zeitung that have been manually annotated for syntax, coreference, connectives, and rhetorical structure. Further layers will be added to future releases of the corpus. This book assembles the annotation guidelines that have been used for that public part, as well as for other portions, where other layers of annotation have been experimented with. Most of the guidelines will be applicable to similar genres, and also to other languages

  18. Handbuch Textannotation
    Potsdamer Kommentarkorpus 2.0
    Autor*in:
    Erschienen: 2016
    Verlag:  Universitätsverlag Potsdam, Potsdam

    Bayerische Staatsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (kostenfrei)
    Quelle: Verbundkataloge
    Beteiligt: Stede, Manfred (Herausgeber)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    ISBN: 9783869563435
    DDC Klassifikation: Englisch, Altenglisch (420)
    Schriftenreihe: Potsdam Cognitive Science Series ; 8
    Schlagworte: Annotation; Deutsch; Korpus <Linguistik>
    Weitere Schlagworte: Arbeitsgedächtnis; Computermodell; Psycholinguistik; Syntax
    Umfang: XVII, 211 Seiten, Illustrationen, 210 mm x 148 mm
  19. Handbuch Textannotation
    Potsdamer Kommentarkorpus 2.0
    Autor*in:
    Erschienen: 2016
    Verlag:  Universitätsverlag Potsdam, Potsdam

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Stede, Manfred (Herausgeber)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 9783869563435
    Schriftenreihe: Potsdam cognitive science series ; 8
    Schlagworte: Deutsch; Korpus <Linguistik>; Annotation
    Weitere Schlagworte: linguistische Annotation; linguistisches Korpus; Textstruktur; Zeitungskommentare; linguistic annotation; linguistic corpus; text structure; newspaper commentary
    Umfang: xvii, 211 Seiten, Illustrationen, 21 cm
    Bemerkung(en):

    Das Potsdamer Kommentarkorpus ist eine Sammlung von Zeitungstexten, die dem Genre ‘Kommentar' zuzuordnen sind. Der öffentlich verfügbare Teil besteht aus 175 Texten aus der Märkischen Allgemeinen Zeitung, die hinsichtlich Syntax, Koreferenz, Konnektoren und Rhetorische Struktur manuell annotiert wurden. Weitere Ebenen werden bei zukünftigen Korpusversionen hinzukommen. Dieses Buch enthält die Annotationsrichtlinien, die der Bearbeitung des öffentlichen Teils des Korpus zugrunde lagen, sowie auch anderer Teile, bei denen mit weiteren Annotationsebenen experimentiert wurde. Die meisten der Richtlinien werden auch für ähnliche Text-Genres und für andere Sprachen verwendbar sein.

  20. STTS goes Kiez – Experiments on Annotating and Tagging Urban Youth Language
  21. Towards a new level of annotation detail of multilingual speech corpora
    Autor*in: Geumann, Anja
    Erschienen: 2016

    The aim of this paper is to highlight the actual need for corpora that have been annotated based on acoustic information. The acoustic information should be coded in features or properties and is needed to inform further processing systems, i.e. to... mehr

     

    The aim of this paper is to highlight the actual need for corpora that have been annotated based on acoustic information. The acoustic information should be coded in features or properties and is needed to inform further processing systems, i.e. to present a basis for a speech recognition system using linguistic information. Feature annotation of existing corpora in combination with segmental annotation can provide a powerful training material for speech recognition systems, but will as well challenge the further processing of features to segments and syllables. We present here the theoretical preliminaries for our multilingual feature extraction system, that we are currently working on.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Automatische Spracherkennung; Phonetik; Annotation; Korpus; Gesprochene Sprache
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  22. Towards a syntactically motivated analysis of modifiers in German
    Erschienen: 2016
    Verlag:  Hildesheim : Universitätsverlag Hildesheim

    The Stuttgart-Tübingen Tagset (STTS) is a widely used POS annotation scheme for German which provides 54 different tags for the analysis on the part of speech level. The tagset, however, does not distinguish between adverbs and different types of... mehr

     

    The Stuttgart-Tübingen Tagset (STTS) is a widely used POS annotation scheme for German which provides 54 different tags for the analysis on the part of speech level. The tagset, however, does not distinguish between adverbs and different types of particles used for expressing modality, intensity, graduation, or to mark the focus of the sentence. In the paper, we present an extension to the STTS which provides tags for a more fine-grained analysis of modification, based on a syntactic perspective on parts of speech. We argue that the new classification not only enables us to do corpus-based linguistic studies on modification, but also improves statistical parsing. We give proof of concept by training a data-driven dependency parser on data from the TiGer treebank, providing the parser a) with the original STTS tags and b) with the new tags. Results show an improved labelled accuracy for the new, syntactically motivated classification.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Annotation; Automatische Sprachanalyse; Korpus
    Lizenz:

    creativecommons.org/licenses/by/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  23. POS error detection in automatically annotated corpora
    Autor*in: Rehbein, Ines
    Erschienen: 2016
    Verlag:  Stroudsburg, PA : ACL

    Recent work on error detection has shown that the quality of manually annotated corpora can be substantially improved by applying consistency checks to the data and automatically identifying incorrectly labelled instances. These methods, however, can... mehr

     

    Recent work on error detection has shown that the quality of manually annotated corpora can be substantially improved by applying consistency checks to the data and automatically identifying incorrectly labelled instances. These methods, however, can not be used for automatically annotated corpora where errors are systematic and cannot easily be identified by looking at the variance in the data. This paper targets the detection of POS errors in automatically annotated corpora, so-called silver standards, showing that by combining different measures sensitive to annotation quality we can identify a large part of the errors and obtain a substantial increase in accuracy.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Automatische Sprachanalyse; Annotation
    Lizenz:

    creativecommons.org/licenses/by/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  24. Discussing best practices for the annotation of Twitter microtext
    Erschienen: 2016
    Verlag:  Sofia : Bulgarian Academy of Sciences

    This paper contributes to the discussion on best practices for the syntactic analysis of non-canonical language, focusing on Twitter microtext. We present an annotation experiment where we test an existing POS tagset, the Stuttgart-Tübingen Tagset... mehr

     

    This paper contributes to the discussion on best practices for the syntactic analysis of non-canonical language, focusing on Twitter microtext. We present an annotation experiment where we test an existing POS tagset, the Stuttgart-Tübingen Tagset (STTS), with respect to its applicability for annotating new text from the social media, in particular from Twitter microblogs. We discuss different tagset extensions proposed in the literature and test our extended tagset on a set of 506 tweets (7.418 tokens) where we achieve an inter-annotator agreement for two human annotators in the range of 92.7 to 94.4 (k). Our error analysis shows that especially the annotation of Twitterspecific phenomena such as hashtags and at-mentions causes disagreements between the human annotators. Following up on this, we provide a discussion of the different uses of the @- and #-marker in Twitter and argue against analysing both on the POS level by means of an at-mention or hashtag label. Instead, we sketch a syntactic analysis which describes these phenomena by means of syntactic categories and grammatical functions.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Syntaktische Analyse; Annotation; Twitter <Softwareplattform>
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  25. Extending the STTS for the Annotation of Spoken Language
    Erschienen: 2016
    Verlag:  Wien : Eigenverlag ÖGAI

    This paper presents an extension to the Stuttgart-Tübingen TagSet, the standard part-of-speech tag set for German, for the annotation of spoken language. The additional tags deal with hesitations, backchannel signals, interruptions, onomatopoeia and... mehr

     

    This paper presents an extension to the Stuttgart-Tübingen TagSet, the standard part-of-speech tag set for German, for the annotation of spoken language. The additional tags deal with hesitations, backchannel signals, interruptions, onomatopoeia and uninterpretable material. They allow one to capture phenomena specific to spoken language while, at the same time, preserving inter-operability with already existing corpora of written language.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Gesprochene Sprache; Annotation; Automatische Sprachanalyse; Interoperabilität
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess