Filtern nach
Letzte Suchanfragen

Ergebnisse für *

Es wurden 41 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 25 von 41.

Sortieren

  1. Legal canvas for a patchwork of multilingual quotations: the case of CoMParS
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Kamocki, Paweł (Verfasser); Trawiński, Beata (Verfasser)
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Kontrastive Grammatik; Deutsch; Sprachtypologie; Englisch; Französisch; Ungarisch; Polnisch; Korpus <Linguistik>
    Weitere Schlagworte: GDE-V; CoMParS; Eigentumsrecht
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Corpus Linguistics International Conference 2017, University of Birmingham, Tuesday 25–Friday 28 July 2017. - Birmingham : University of Birmingham, 2017., S. 78-81

  2. Lightweight grammatical annotation in the TEI: new perspectives
    Erschienen: 2018
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Haaf, Susanne (Verfasser); Mueller, Martin (Verfasser); Calzolari, Nicoletta (Herausgeber); Choukri, Khalid (Herausgeber); Cieri, Christopher (Herausgeber); Declerck, Thierry (Herausgeber); Goggi, Sara (Herausgeber); Hasida, Koiti (Herausgeber); Isahara, Hitoshi (Herausgeber); Maegaard, Bente (Herausgeber); Mariani, Joseph (Herausgeber); Mazo, Hélène (Herausgeber); Moreno, Asuncion (Herausgeber); Odijk, Jan (Herausgeber); Piperidis, Stelios (Herausgeber); Tokunaga, Takenobu (Herausgeber)
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Text Encoding Initiative; Annotation
    Weitere Schlagworte: linguistic annotation; lightweight annotation; TEI; TEI LingSIG
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the eleventh international conference on language resources and evaluation (LREC 2018), 7-12 May 2018, Miyazaki, Japan. - Paris, France : European language resources association (ELRA), 2018., S. 1795-1802, ISBN 979-10-95546-00-9

  3. KorAP architecture – diving in the deep sea of corpus data
    Autor*in: Diewald, Nils
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Hanl, Michael (Verfasser); Margaretha, Eliza (Verfasser); Bingel, Joachim (Verfasser); Kupietz, Marc (Verfasser); Bański, Piotr (Verfasser); Witt, Andreas (Verfasser); Calzolari, Nicoletta (Herausgeber); Choukri, Khalid (Herausgeber); Declerck, Thierry (Herausgeber); Goggi, Sara (Herausgeber); Grobelnik, Marko (Herausgeber); Maegaard, Bente (Herausgeber); Mariani, Joseph (Herausgeber); Mazo, Helene (Herausgeber); Moreno, Asunción (Herausgeber); Odijk, Jan (Herausgeber); Piperidis, Stelios (Herausgeber)
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Korpus <Linguistik>
    Weitere Schlagworte: Korpusanalyseplattform (KorAP); Institut für Deutsche Sprache <Mannheim>; Textlinguistik; microservices; large corpus data
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), Portorož, Slovenia. - Paris : European Language Resources Association (ELRA), 2016., S. 3586-3591, ISBN 978-2-9517408-9-1

  4. The Syntax of “Complex Prepositions” in German: An HPSG Approach
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Bański, Piotr (Herausgeber); Przepiórkowski, Adam (Herausgeber)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Head-driven phrase structure grammar; Präposition; Deutsch
    Weitere Schlagworte: HPSG
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the GLiP-5 Conference. Generative Linguistics in Poland: Morphosyntactic Investigations. Warsaw, Poland. 30 November - 1 December 2002. - Warsaw : Instytut Podstaw Informatyki Polskiej Akademii Nauk, 2003., S. 155-166

  5. Intra-connecting an exemplary literary corpus with semantic web technologies for exploratory literary studies
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Bański, Piotr (Herausgeber); Kupietz, Marc (Herausgeber); Lüngen, Harald (Herausgeber); Rayson, Paul (Herausgeber); Biber, Hanno (Herausgeber); Breiteneder, Evelyn (Herausgeber); Clematide, Simon (Herausgeber); Mariani, John (Herausgeber); Stevenson, Mark (Herausgeber); Sick, Theresa (Herausgeber)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Schlagworte: Korpus <Linguistik>; Literatur; Österreich; Aichinger, Ilse; Text Encoding Initiative (TEI); Intertextualität; Semantic Web; Digital Humanities
    Weitere Schlagworte: Word associations; Corpus linguistics; Intertextuality; Literary corpus
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the Workshop on Challenges in the Management of Large Corpora and Big Data and Natural Language Processing (CMLC-5+BigNLP) 2017 including the papers from the Web-as-Corpus (WAC-XI) guest section. Birmingham, 24 July 2017. - Mannheim : Institut für Deutsche Sprache, 2017., S. 1-6

  6. Proceedings of the workshop on challenges in the management of large corpora (CMLC-7) 2019
    Cardiff, 22. July 2019
    Erschienen: [2019]; © 2019
    Verlag:  Leibniz-Institut für Deutsche Sprache, Mannheim

    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (Kostenfrei)
    Volltext (Kostenfrei)
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Barbaresi, Adrien (VerfasserIn); Biber, Hanno (VerfasserIn); Breiteneder, Evelyn (VerfasserIn); Clematide, Simon (VerfasserIn); Kupietz, Marc (VerfasserIn); Lüngen, Harald (VerfasserIn); Iliadi, Caroline (VerfasserIn)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Schlagworte: Datenmanagement; Information Retrieval; Natürliche Sprache; Korpus <Linguistik>
    Umfang: 1 Online-Ressource
  7. Modeling and annotating complex data structures
    Erschienen: 2019

    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Witt, Andreas (VerfasserIn)
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Druck
    Übergeordneter Titel: Enthalten in: The shape of data in the digital humanities; London : Routledge, Taylor & Francis Group, 2019; (2019'), Seite [217]-235; xviii, 341 Seiten

  8. CoMParS: Eine Sammlung von multilingualen Parallelsequenzen des Deutschen und anderer europäischer Sprachen
    Erschienen: [2021]; © 2021

    Staats- und Universitätsbibliothek Bremen
    keine Fernleihe
    Niedersächsische Staats- und Universitätsbibliothek Göttingen
    keine Fernleihe
    Universitätsbibliothek Kiel, Zentralbibliothek
    keine Fernleihe
    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Schlotthauer, Susan (VerfasserIn); Bański, Piotr (VerfasserIn)
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Druck
    Übergeordneter Titel: Enthalten in: Jahrestagung des Instituts für Deutsche Sprache (56. : 2020 : Mannheim); Deutsch in Europa; Berlin : de Gruyter, 2021; (2021), Seite 301-309; XVII, 332 Seiten

  9. The Syntax of “Complex Prepositions” in German: An HPSG Approach
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Bański, Piotr (Herausgeber); Przepiórkowski, Adam (Herausgeber)
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Head-driven phrase structure grammar; Präposition; Deutsch
    Weitere Schlagworte: HPSG
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the GLiP-5 Conference. Generative Linguistics in Poland: Morphosyntactic Investigations. Warsaw, Poland. 30 November - 1 December 2002. - Warsaw : Instytut Podstaw Informatyki Polskiej Akademii Nauk, 2003., S. 155-166

  10. The Syntax of “Complex Prepositions” in German: An HPSG Approach

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: HPSG
    Lizenz:

    kostenfrei

  11. Legal canvas for a patchwork of multilingual quotations: the case of CoMParS
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Kamocki, Paweł (Verfasser); Trawiński, Beata (Verfasser)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Kontrastive Grammatik; Deutsch; Sprachtypologie; Englisch; Französisch; Ungarisch; Polnisch; Korpus <Linguistik>
    Weitere Schlagworte: GDE-V; CoMParS; Eigentumsrecht
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Corpus Linguistics International Conference 2017, University of Birmingham, Tuesday 25–Friday 28 July 2017. - Birmingham : University of Birmingham, 2017., S. 78-81

  12. Deutsch in Europa
    Sprachpolitisch, grammatisch, methodisch
    Autor*in:
    Erschienen: [2021]; ©2021
    Verlag:  De Gruyter, Berlin ; Walter de Gruyter GmbH

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen... mehr

    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe

     

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen methodischen Zugängen und Sprachressourcen das zu untersuchen ist. Der ständige Austausch zwischen diesen Sprachen und die politischen Rahmenbedingungen in der Europäischen Union werfen darüber hinaus konkrete sprach- und bildungspolitische Fragen auf. German has developed as part of a European language community. This volume asks interesting questions about how these languages influence each other and change, and which methodological approaches and linguistic resources can be used to analyse this. The constant interaction between these languages and the political framework of the EU also raise specific questions regarding language and educational policy.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
  13. Deutsch in Europa
    Sprachpolitisch, grammatisch, methodisch
    Autor*in:
    Erschienen: [2021]; ©2021
    Verlag:  De Gruyter, Berlin ; Boston

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen... mehr

    Zugang:
    Hochschulbibliothek der Fachhochschule Aachen
    Universitätsbibliothek der RWTH Aachen
    Fachhochschule Bielefeld, Hochschulbibliothek
    Hochschule Bochum, Hochschulbibliothek
    Ruhr-Universität Bochum, Universitätsbibliothek
    Universitäts- und Landesbibliothek Bonn
    Fachhochschule Dortmund, Hochschulbibliothek
    Universitätsbibliothek Duisburg-Essen, Campus Essen
    Westfälische Hochschule Gelsenkirchen Bocholt Recklinghausen, Hochschulbibliothek
    Universitätsbibliothek der Fernuniversität
    Katholische Hochschule Nordrhein-Westfalen (katho), Hochschulbibliothek
    Technische Hochschule Köln, Hochschulbibliothek
    Zentralbibliothek der Sportwissenschaften der Deutschen Sporthochschule Köln
    Hochschule Ruhr West, Hochschulbibliothek, Zweigbibliothek Bottrop
    Hochschule Ruhr West, Hochschulbibliothek
    Universitäts- und Landesbibliothek Münster

     

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen methodischen Zugängen und Sprachressourcen das zu untersuchen ist. Der ständige Austausch zwischen diesen Sprachen und die politischen Rahmenbedingungen in der Europäischen Union werfen darüber hinaus konkrete sprach- und bildungspolitische Fragen auf German has developed as part of a European language community. This volume asks interesting questions about how these languages influence each other and change, and which methodological approaches and linguistic resources can be used to analyse this. The constant interaction between these languages and the political framework of the EU also raise specific questions regarding language and educational policy

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Albert, Marina Foschi (Sonstige); Auer, Peter (Sonstige); Barbaresi, Adrien (Sonstige); Bański, Piotr (Sonstige); Beyer, Rahel (Sonstige); Bodmer, Franck (Sonstige); Bopp, Jutta (Sonstige); Czapka, Sophia (Sonstige); Diewald, Nils (Sonstige); Dovalil, Vít (Sonstige); Ebert, Johannes (Sonstige); Falke, Stefan (Sonstige); Fischer, Patricia (Sonstige); Fuhrhop, Nanna (Sonstige); Gagarina, Natalia (Sonstige); Geyken, Alexander (Sonstige); Gunkel, Lutz (Sonstige); Harders, Peter (Sonstige); Hartmann, Jutta M. (Sonstige); Hinrichs, Erhard (Sonstige); Hirschmann, Hagen (Sonstige); Irimia, Elena (Sonstige); Krifka, Manfred (Sonstige); Kupietz, Marc (Sonstige); Káňa, Tomáš (Sonstige)
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783110731514
    Weitere Identifier:
    Schriftenreihe: Jahrbuch des Instituts für Deutsche Sprache ; 2020
    Weitere Schlagworte: Deutsch/Sprache; Europa/Sprache; Kontrastive Linguistik; Sprachpolitik; FOREIGN LANGUAGE STUDY / German
    Umfang: 1 online resource (XVIII, 332 p.)
  14. Corpus Query Lingua Franca part II: Ontology
    Erschienen: 2020
    Verlag:  Paris : European Language Resources Association

    The present paper outlines the projected second part of the Corpus Query Lingua Franca (CQLF) family of standards: CQLF Ontology, which is currently in the process of standardization at the International Standards Organization (ISO), in its Technical... mehr

     

    The present paper outlines the projected second part of the Corpus Query Lingua Franca (CQLF) family of standards: CQLF Ontology, which is currently in the process of standardization at the International Standards Organization (ISO), in its Technical Committee 37, Subcommittee 4 (TC37SC4) and its national mirrors. The first part of the family, ISO 24623-1 (henceforth CQLF Metamodel), was successfully adopted as an international standard at the beginning of 2018. The present paper reflects the state of the CQLF Ontology at the moment of submission for the Committee Draft ballot. We provide a brief overview of the CQLF Metamodel, present the assumptions and aims of the CQLF Ontology, its basic structure, and its potential extended applications. The full ontology is expected to emerge from a community process, starting from an initial version created by the authors of the present paper.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Abfragesprache; ISO-Norm; Standardisierung; Korpus
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  15. CoMParS: Eine Sammlung von multilingualen Parallelsequenzen des Deutschen und anderer europäischer Sprachen
    Erschienen: 2021
    Verlag:  Berlin [u.a.] : de Gruyter

    Dieser Beitrag präsentiert die neue multilinguale Ressource CoMParS (Collection of Multilingual Parallel Sequences). CoMParS versteht sich als eine funktional-semantisch orientierte Datenbank von Parallelsequenzen des Deutschen und anderer... mehr

     

    Dieser Beitrag präsentiert die neue multilinguale Ressource CoMParS (Collection of Multilingual Parallel Sequences). CoMParS versteht sich als eine funktional-semantisch orientierte Datenbank von Parallelsequenzen des Deutschen und anderer europäischer Sprachen, in der alle Daten neben den sprachspezifischen und universellen (im Sinne von Universal Dependencies) morphosyntaktischen Annotationen auch nach sprachübergreifenden funktional-semantischen Informationen auf der neudefinierten Annotationsebene Functional Domains annotiert und auf mehreren Ebenen (auch ebenenübergreifend) miteinander verlinkt sind. CoMParS wird in TEI P5 XML kodiert und sowohl als monolinguale wie auch als multilinguale Sprachressource modelliert.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Datenbank; Korpus; Kontrastive Grammatik
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  16. Proceedings of the LREC 2022 Workshop on Challenges in the Management of Large Corpora (CMLC-10 2022). Marseille, 20 June 2022
    Erschienen: 2022
    Verlag:  Paris : European Language Resources Association (ELRA) ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    Contents: 1. Vasile Pais, Maria Mitrofan, Verginica Barbu Mititelu, Elena Irimia, Roxana Micu and Carol Luca Gasan: Challenges in Creating a Representative Corpus of Romanian Micro-Blogging Text. Pp. 1-7 2. Modest von Korff: Exhaustive Indexing of... mehr

     

    Contents: 1. Vasile Pais, Maria Mitrofan, Verginica Barbu Mititelu, Elena Irimia, Roxana Micu and Carol Luca Gasan: Challenges in Creating a Representative Corpus of Romanian Micro-Blogging Text. Pp. 1-7 2. Modest von Korff: Exhaustive Indexing of PubMed Records with Medical Subject Headings. Pp. 8-15 3. Luca Brigada Villa: UDeasy: a Tool for Querying Treebanks in CoNLL-U Format. Pp. 16-19 4. Nils Diewald: Matrix and Double-Array Representations for Efficient Finite State Tokenization. Pp. 20-26 5. Peter Fankhauser and Marc Kupietz: Count-Based and Predictive Language Models for Exploring DeReKo. Pp. 27-31 6. Hanno Biber: “The word expired when that world awoke.” New Challenges for Research with Large Text Corpora and Corpus-Based Discourse Studies in Totalitarian Times. Pp. 32-35

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Daten; Datenmanagement; Datensammlung; Datenanalyse; Datensatz; Datenqualität
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  17. Standards in CLARIN
    Erschienen: 2022
    Verlag:  Berlin/Boston : de Gruyter ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    This chapter looks at a fragment of the ongoing work of the CLARIN Standards Committee (CSC) on producing a shared set of recommendations on standards, formats, and related best practices supported by the CLARIN infrastructure and its participating... mehr

     

    This chapter looks at a fragment of the ongoing work of the CLARIN Standards Committee (CSC) on producing a shared set of recommendations on standards, formats, and related best practices supported by the CLARIN infrastructure and its participating centres. What might at first glance seem to be a straightforward goal has over the years proven to be rather complex, reflecting the robustness and heterogeneity of the emerging distributed digital research infrastructure and the various disciplines and research traditions of the language-based humanities that it serves and represents, and therefore part of the chapter reviews the various initiatives and proposals that strove to produce helpful standards-related guidance. The focus turns next to a subtask initiated in late 2019, its scope narrowed to one of the core activities and responsibilities of CLARIN backbone centres, namely the provision of data deposition services. Centres are obligated to publish their recom-mendations concerning the repertoire of data formats that are best suited for their research profiles. We look at how this requirement has been met by the particular centres and suggest that having centres maintain their information in the Standards Information System (SIS) is the way to improve on the current state of affairs.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Datenerfassung; Standardisierung; Forschungsinfrastruktur; Datenformat; Empfehlungssystem
    Lizenz:

    creativecommons.org/licenses/by/4.0/ ; info:eu-repo/semantics/openAccess

  18. Applying the newly extended European reference corpus EuReCo. Pilot studies of light-verb constructions in German, Romanian, Hungarian and Polish
    Erschienen: 2023
    Verlag:  Mannheim : IDS-Verlag

    It is well known that the distribution of lexical and grammatical patterns is size- and register-sensitive (Biber 1986, and later publications). This fact alone presents a challenge to many corpus-oriented linguistic studies focusing on a single... mehr

     

    It is well known that the distribution of lexical and grammatical patterns is size- and register-sensitive (Biber 1986, and later publications). This fact alone presents a challenge to many corpus-oriented linguistic studies focusing on a single language. When it comes to cross-linguistic studies using corpora, the challenge becomes even greater due to the lack of high-quality multilingual corpora (Kupietz et al. 2020; Kupietz/Trawiński 2022), which are comparable with respect to the size and the register. That was the motivation for the creation of the European Reference Corpus EuReCo, an initiative started in 2013 at the Leibniz Institute for the German Language (IDS) together with several European partners (Kupietz et al. 2020). EuReCo is an emerging federated corpus, with large virtual comparable corpora across various languages and with an infrastructure supporting contrastive research. The core of the infrastructure is KorAP (Diewald et al. 2016), a scalable open-source platform supporting the analysis and visualisation of properties of texts annotated by multiple and potentially conflicting information layers, and supporting several corpus query languages. Until recently, EuReCo consisted of three monolingual subparts: the German Reference Corpus DeReKo (Kupietz et al. 2018), the Reference Corpus of Contemporary Romanian Language (Barbu Mititelu/Tufiş/Irimia 2018), and the Hungarian National Corpus (Váradi 2002). The goal of the present submission is twofold. On the one hand, it reports about the new component of EuReCo: a sample of the National Corpus of Polish (Przepiórkowski et al. 2010). On the other hand, it presents the results of a new pilot study using the newly extended EuReCo. This pilot study investigates selected Polish collocations involving light verbs and their prepositional / nominal complements (Fig. 1) and extends the collocation analyses of German, Romanian and Hungarian (Fig. 2) discussed in Kupietz/Trawiński (2022).

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Kontrastive Linguistik
    Lizenz:

    creativecommons.org/licenses/by-sa/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  19. Bridging standards development and infrastructure usage by means of concept graphs: the liaison of CLARIN and ISO TC37SC4 in practice
    Erschienen: 2018
    Verlag:  Paris, France : European language resources association (ELRA)

    The present submission reports on a pilot project conducted at the Institute for the German Language (IDS), aiming at strengthening the connection between ISO TC37SC4 “Language Resource Management” and the CLARIN infrastructure. In terminology... mehr

     

    The present submission reports on a pilot project conducted at the Institute for the German Language (IDS), aiming at strengthening the connection between ISO TC37SC4 “Language Resource Management” and the CLARIN infrastructure. In terminology management, attempts have recently been made to use graph-theoretical analyses to get a better understanding of the structure of terminology resources. The project described here aims at applying some of these methods to potentially incomplete concept fields produced over years by numerous researchers serving as experts and editors of ISO standards. The main results of the project are twofold. On the one hand, they comprise concept networks dynamically generated from a relational database and browsable by the user. On the other, the project has yielded significant qualitative feedback that will be offered to ISO. We provide the institutional context of this endeavour, its theoretical background, and an overview of data preparation and tools used. Finally, we discuss the results and illustrate some of them.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Terminologie; Linguistik; Visualisierung; Standardisierung; Informationsmanagement
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  20. Proceedings of the LREC 2018 Workshop “Challenges in the Management of Large Corpora (CMLC-6)” 07 May 2018 – Miyazaki, Japan
    Erschienen: 2018
    Verlag:  Paris : European language resources association (ELRA)

    Contents: 1. Christoph Kuras, Thomas Eckart, Uwe Quasthoff and Dirk Goldhahn: Automation, management and improvement of text corpus production, S. 1 2. Thomas Krause, Ulf Leser, Anke Lüdeling and Stephan Druskat: Designing a re-usable and embeddable... mehr

     

    Contents: 1. Christoph Kuras, Thomas Eckart, Uwe Quasthoff and Dirk Goldhahn: Automation, management and improvement of text corpus production, S. 1 2. Thomas Krause, Ulf Leser, Anke Lüdeling and Stephan Druskat: Designing a re-usable and embeddable corpus search library, S. 6 3. Radoslav Rábara, Pavel Rychlý and Ondřej Herman: Distributed corpus search, S. 10 4. Adrien Barbaresi and Antonio Ruiz Tinoco: Using elasticsearch for linguistic analysis of tweets in time and space, S. 14 5. Marc Kupietz, Nils Diewald and Peter Fankhauser: How to Get the Computation Near the Data: Improving data accessibility to, and reusability of analysis functions in corpus query platforms, S. 20 6. Roman Schneider: Example-based querying for specialist corpora, S. 26 7. Paul Rayson: Increasing interoperability for embedding corpus annotation pipelines in Wmatrix and other corpus retrieval tools, S. 33

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Automatische Sprachanalyse; Technologie
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  21. Modeling and annotating complex data structures
    Erschienen: 2018
    Verlag:  London u.a. : Routledge, Taylor & Francis Group

  22. Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-7) 2019. Cardiff, 22 July 2019
    Erschienen: 2019
    Verlag:  Mannheim : Leibniz-Institut für Deutsche Sprache

    Contents: 1. Johannes Graën, Tannon Kew, Anastassia Shaitarova and Martin Volk, "Modelling Large Parallel Corpora", S. 1-8 2. Pedro Javier Ortiz Suárez, Benoît Sagot and Laurent Romary, "Asynchronous Pipelines for Processing Huge Corpora on Medium to... mehr

     

    Contents: 1. Johannes Graën, Tannon Kew, Anastassia Shaitarova and Martin Volk, "Modelling Large Parallel Corpora", S. 1-8 2. Pedro Javier Ortiz Suárez, Benoît Sagot and Laurent Romary, "Asynchronous Pipelines for Processing Huge Corpora on Medium to Low Resource Infrastructures", S. 9-16 3. Vladimír Benko, "Deduplication in Large Web Corpora", S. 17-22 4. Mark Davies, "The best of both worlds: Multi-billion word “dynamic” corpora", S. 23-28 5. Adrien Barbaresi, "On the need for domain-focused web corpora", S. 29-32 6. Marc Kupietz, Eliza Margaretha, Nils Diewald, Harald Lüngen and Peter Fankhauser, "What's New in EuReCo? Interoperability, Comparable Corpora, Licensing", S. 33-39

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Datenmanagement; Information Retrieval; Natürliche Sprache
    Lizenz:

    creativecommons.org/licenses/by/4.0/deed.de ; info:eu-repo/semantics/openAccess

  23. Proceedings of the LREC 2020 Workshop, Language Resources and Evaluation Conference, 11–16 May 2020, 8th Workshop on Challenges in the Management of Large Corpora (CMLC-8)
    Erschienen: 2020
    Verlag:  Paris : European Language Resources Association (ELRA)

    In order to satisfy the information needs of a wide range of researchers across a number of disciplines, large textual datasets require careful design, collection, cleaning, encoding, annotation, storage, retrieval, and curation. This daunting set of... mehr

     

    In order to satisfy the information needs of a wide range of researchers across a number of disciplines, large textual datasets require careful design, collection, cleaning, encoding, annotation, storage, retrieval, and curation. This daunting set of tasks has coalesced into a number of key themes and questions that are of interest to the contributing research communities: (a) what sampling techniques can we apply? (b) what quality issues should we be aware of? (c) what infrastructures and frameworks are being developed for the efficient storage, annotation, analysis and retrieval of large datasets? (d) what affordances do visualisation techniques offer for the exploratory analysis approaches of corpora? (e) what legal paths can be followed in dealing with IPR and data protection issues governing both the data sources and the query results? (f) how to guarantee that corpus data remain available and usable in a sustainable way?

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Computerlinguistik; Forschungsdaten; Datenmanagement
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  24. Editorial Introduction to the Third Issue
  25. Building and Maintaining the TEI LingSIG Bibliography

    The present contribution addresses an infrastructural issue of universal relevance, addressed in the specific context of the TEI. We describe a combination of open-source tools and an open-access approach to creating knowledge repositories that have... mehr

     

    The present contribution addresses an infrastructural issue of universal relevance, addressed in the specific context of the TEI. We describe a combination of open-source tools and an open-access approach to creating knowledge repositories that have been employed in building a bibliographic reference library for the “TEI for Linguists” special interest group (LingSIG). The authors argue that, for an initiative such as the TEI, it is important to choose open, freely available solutions. If these solutions have the advantage of attracting new users and promoting the initiative itself, so much the better, especially if it is done in a non-committal way: no one using the LingSIG bibliographic repository has to be a member of the LingSIG or a “TEI-er” in general.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Lizenz:

    creativecommons.org/licenses/by-nd/3.0/de/ ; info:eu-repo/semantics/openAccess