cis-kb21.github.io

Website for Korpusbearbeitung SoSe 21

Kurs “Korpusbearbeitung”

Sommersemester 2021

Centrum für Informations- und Sprachverarbeitung, LMU München

Sie erreichen den Dozenten unter:

kb21 [at] cis [dot] uni [minus] muenchen [dot] de

In der Vorlesung werden mit Hilfe von Programmen in einer Skriptsprache, speziellen Anwendungen und Betriebssystemtools große Korpora erschlossen, verarbeitet und linguistisch annotiert. Es werden wichtige Aufgaben der Korpusbearbeitung, wie z.B. Textkonvertierungen, Tokenisierungen, Erstellen von Frequenzlisten, Konkordanzen, n-Gramm-Extraktion vorgestellt und Lösungen erarbeitet. Parallel dazu werden auch einige exemplarisch ausgewählte Korpora und Verfahren der Arbeit mit Korpora vorgestellt und damit gearbeitet.

Die Klausur findet am 22.07.2021 um 14:00 Uhr s.t. statt. Anmerkungen zum Vorgehen finden Sie im FAQ.

Aktualisierung (02.09.2021)

Die Nachholklausur findet am Donnerstag, den 21.10.2021 von 14:00 – 16:00 Uhr statt. Um gleiche Bedingungen für die Nachholklausur sicher zu stellen, findet die Nachholklausur, genau wie die ursprüngliche Klausur, online statt (sehen sie dazu den Eintrag im FAQ). Bitte vergessen Sie nicht, sich zur Nachholklausur im LSF anzumelden. Der Anmeldezeitraum ist vom 27.09.2021 bis zum 11.10.2021.

Aktualisierung (02.08.2021)

Die Klausuren sind korrigiert. Wenn Sie die Klausur mitgeschrieben haben, sollten Sie eine Email erhalten haben. Bei Problemen wenden Sie sich an den Dozenten.

Frequently asked questions: FAQ

Datum Folien Übungsaufgaben Sonstige Materialien
15. April, 2021 Einführung   Video
22. April, 2021 Shell-Skripte   Video
29. April, 2021 Unix-Werkzeuge   Video
06. Mai, 2021 Ein- und Ausgabe   Video
20. Mai, 2021 sed und awk   Video
27. Mai, 2021 Unicode   Video
10. Juni, 2021 XML   Video
17. Juni, 2021 XML2 xmlpos Video
24. Juni, 2021 POS   Video
01. Juli, 2021 APIs compare pos taggers Video
08. Juli, 2021 Crawler dtacrawl.py dtacrawl_async.py Video
15. Juli, 2021 Zusammenfassung Probeklausur Video