Zur Lexikon-Grammatik-Schnittstelle in einem hypermedialen Informationssystem
Der Beitrag beschreibt Konzeption und Umsetzung der Anbindung von lexikalischen Datenbanken an das grammatische Informationssystem grammis, das seit Mitte 1993 am Institut für deutsche Sprache (IDS) entwickelt wird. Im Rahmen dieses Projekts wird...
mehr
Volltext:
|
|
Zitierfähiger Link:
|
|
Der Beitrag beschreibt Konzeption und Umsetzung der Anbindung von lexikalischen Datenbanken an das grammatische Informationssystem grammis, das seit Mitte 1993 am Institut für deutsche Sprache (IDS) entwickelt wird. Im Rahmen dieses Projekts wird erforscht, wie grammatisches Wissen mit moderner Computertechnik anschaulich dargestellt und verständlich vermittelt werden kann.
|
A Functional Database Framework for Querying Very Large Multi-Layer Corpora
Linguistic query systems are special purpose IR applications. We present a novel state-of-the-art approach for the efficient exploitation of very large linguistic corpora, combining the advantages of relational database management systems (RDBMS)...
mehr
Volltext:
|
|
Zitierfähiger Link:
|
|
Linguistic query systems are special purpose IR applications. We present a novel state-of-the-art approach for the efficient exploitation of very large linguistic corpora, combining the advantages of relational database management systems (RDBMS) with the functional MapReduce programming model. Our implementation uses the German DEREKO reference corpus with multi-layer linguistic annotations and several types of text-specific metadata, but the proposed strategy is language-independent and adaptable to large-scale multilingual corpora.
|
Export in Literaturverwaltung |
|
Webkorpora in Computerlinguistik und Sprachforschung
"Webkorpora in Computerlinguistik und Sprachforschung" war das Thema eines Workshops,der von den beiden GSCL-Arbeitskreisen „Hypermedia“ und „Korpuslinguistik“ am Institut für Deutsche Sprache (IDS) in Mannheim veranstaltet wurde, und zu dem sich am...
mehr
Volltext:
|
|
Zitierfähiger Link:
|
|
"Webkorpora in Computerlinguistik und Sprachforschung" war das Thema eines Workshops,der von den beiden GSCL-Arbeitskreisen „Hypermedia“ und „Korpuslinguistik“ am Institut für Deutsche Sprache (IDS) in Mannheim veranstaltet wurde, und zu dem sich am 27.09. und 28.09.2012 Experten aus universitären und außeruniversitären Forschungseinrichtungen zu Vorträgen und Diskussionen zusammenfanden. Der facettenreiche Workshop thematisierte Fragen der Gewinnung, der Aufbereitung und der Analyse von Webkorpora für computerlinguistische Anwendungen und sprachwissenschaftliche Forschung. Einen Schwerpunkt bildeten dabei die speziellen Anforderungen, die sich gerade im Hinblick auf deutschsprachige Ressourcen ergeben. Im Fokus stand weiterhin die Nutzung von Webkorpora für die empirisch gestützte Sprachforschung, beispielsweise als Basis für sprachstatistische Analysen, für Untersuchungen zur Sprachlichkeit in der internetbasierten Kommunikation oder für die korpusgestützte Lexikographie. Zusätzlich gab es eine Poster/Demosession, in der wissenschaftliche und kommerzielle Projekte ihre Forschungswerkzeuge und Methoden vorstellen konnten.
|
E-VALBU: Advanced SQL/XML processing of dictionary data using an object-relational XML database
Contemporary practical lexicography uses a wide range of advanced technological aids,most prominently database systems for the administration of dictionary content. Since XML has become a de facto standard for the coding of lexicographic articles,...
mehr
Volltext:
|
|
Zitierfähiger Link:
|
|
Contemporary practical lexicography uses a wide range of advanced technological aids,most prominently database systems for the administration of dictionary content. Since XML has become a de facto standard for the coding of lexicographic articles, integrated markup functionality – such as query, update, or transformation of instances – is of particular importance. Even the multi-channel distribution of dictionary data benefits from powerful XML database services. Exemplified by E-VALBU, the most comprehensive electronic dictionary on German verb valency, we outline an integrated approach for advanced XML storing and processing within an object-relational database, and for a public retrieval frontend using Web Services and AJAX technology.
|
Ein XML-basiertes Datenbanksystem für digitale Wörterbücher- Ein Werkstattbericht aus dem Institut für Deutsche Sprache
Das Online-Wortschatz-Informationssystem Deutsch (OWID) ist ein digitales Wörterbuchportal des Instituts für Deutsche Sprache. Alle darin zusammengeführten lexikografischen Daten sind auf XML-Basis feingranular strukturiert. Speicherung, Verwaltung...
mehr
Volltext:
|
|
Zitierfähiger Link:
|
|
Das Online-Wortschatz-Informationssystem Deutsch (OWID) ist ein digitales Wörterbuchportal des Instituts für Deutsche Sprache. Alle darin zusammengeführten lexikografischen Daten sind auf XML-Basis feingranular strukturiert. Speicherung, Verwaltung und Retrieval dieser Daten übernimmt das Orade-basierte Electronic Dictionary Administration System (EDAS). Der vorliegende Beitrag erläutert die XML-basierte Modellierung der Daten, XML-spezifische Fragen der Speicherung, sowie das Retrieval mit XPath und SQL/XML. ; The Institute for German Language (IDS) hosts the lexicographic portal OWID for online dictionary access. All lexicographic data share a fine-grained XML structure. Storing, administration, and retrieval are done using the ORACLE-based Electronic Dictionary Administration System (EDAS). This article copes with questions of XML modelling for dictionary data, storing of XML fragments within.
|
A hybrid approach to statistical and semantical analysis of web documents
This paper describes a new approach to improve the analysis and categorization of web documents using statistical methods for template based clustering as well as semantical analysis based on terminological ontologies. A domain-specific environment...
mehr
Volltext:
|
|
Zitierfähiger Link:
|
|
This paper describes a new approach to improve the analysis and categorization of web documents using statistical methods for template based clustering as well as semantical analysis based on terminological ontologies. A domain-specific environment serves for prove of concept. In order to demonstrate the widespread practical benefit of our approach, we outline a combined mathematical and semantical framework for information retrieval on internet resources.
|
Export in Literaturverwaltung |
|
A database-driven ontology for German grammar
The main objective of this article is to describe the current activities at the Mannheim Institute for German Language regarding the implementation of a domain-specific ontology for German grammar. We differentiate ontology bases from ontology...
mehr
Volltext:
|
|
Zitierfähiger Link:
|
|
The main objective of this article is to describe the current activities at the Mannheim Institute for German Language regarding the implementation of a domain-specific ontology for German grammar. We differentiate ontology bases from ontology management Systems, point out the benefits of database-driven Solutions, and go Step by Step through all phases of the ontology lifecycle. In Order to demonstrate the practical use of our approach, we outline the interface between our ontology and the grammis web Information System, and compare the ontology-based retrieval mechanism with traditional full text search.
|
Benutzeradaptive Systeme im Internet : informieren und lernen mit GRAMMIS und ProGr@mm
Die Publikation untersucht Nutzungs- und Gestaltungsprinzipien für benutzeradaptive Online Informationssysteme anhand des grammatischen Informationssystems "grammis" sowie der Propädeutischen Grammatik "ProGr@mm". Beides sind aktuelle...
mehr
Volltext:
|
|
Zitierfähiger Link:
|
|
Die Publikation untersucht Nutzungs- und Gestaltungsprinzipien für benutzeradaptive Online Informationssysteme anhand des grammatischen Informationssystems "grammis" sowie der Propädeutischen Grammatik "ProGr@mm". Beides sind aktuelle Internet-Projekte, die am Institut für Deutsche Sprache in Mannheim beheimatet sind und seit Jahren erfolgreich für die Vermittlung von linguistischem Wissen genutzt werden. Aufbauend auf einer Reflexion sowohl der Vorteile als auch der aktuellen und prinzipiellen Probleme des elektronischen Publizierens im WWW wird ein Lösungsansatz vorgestellt, der aus der Perspektive des Systemdesigners die Möglichkeiten der Informationshaltung sowie der benutzerspezifischen, hypertextuellen Informationspräsentation aufzeigt. Dieser Ansatz ist von der letztendlichen Gestaltung des Bildschirmaufbaus unabhängig und konzentriert sich vielmehr auf die Frage, wie der Produzent unter Ausnutzung des Kommunikationspotenzials des WWW den Zugriff auf digital vorliegende Informationen realisieren kann. Das Ziel ist, aus mittels XML und Metadaten inhaltlich erschlossenen Hypertexten dynamische Webdokumente zu generieren. Ein zentraler Punkt dabei ist die Modellierung des Dialogs mit dem Benutzer: Wie kann die Weiterentwicklung der reinen Nutzungsinteraktivität zur Aktionsinteraktivität realisiert werden? Wie können explizite Repräsentationen von individuellen Benutzercharakteristika ermittelt und sinnvoll für ein adaptives Systemverhalten genutzt werden.
|
Using a domain ontology for the semantic-statistical classification of specialist hypertexts
In this feasibility study we aim at contributing at the practical use of domain ontologies for hypertext classification by introducing an algorithm generating potential keywords. The algorithm uses structural markup information and lemmatized word...
mehr
Volltext:
|
|
Zitierfähiger Link:
|
|
In this feasibility study we aim at contributing at the practical use of domain ontologies for hypertext classification by introducing an algorithm generating potential keywords. The algorithm uses structural markup information and lemmatized word lists as well as a domain ontology on linguistics. We present the calculation and ranking of keyword candidates based on ontology relationships, word position, frequency information, and statistical significance as evidenced by log-likelihood tests. Finally, the results of our machine-driven classification are validated empirically against manually assigned keywords.
|
Export in Literaturverwaltung |
|