Kurs “Korpusbearbeitung”
Sommersemester 2021
Centrum für Informations- und Sprachverarbeitung, LMU München
- Zeit/Vorlesung: Do 14:00-16-00 (c.t.)
- Ort/Vorlesung: Zoom
- Dozent: Florian Fink
Sie erreichen den Dozenten unter:
kb21 [at] cis [dot] uni [minus] muenchen [dot] de
In der Vorlesung werden mit Hilfe von Programmen in einer Skriptsprache, speziellen Anwendungen und Betriebssystemtools große Korpora erschlossen, verarbeitet und linguistisch annotiert. Es werden wichtige Aufgaben der Korpusbearbeitung, wie z.B. Textkonvertierungen, Tokenisierungen, Erstellen von Frequenzlisten, Konkordanzen, n-Gramm-Extraktion vorgestellt und Lösungen erarbeitet. Parallel dazu werden auch einige exemplarisch ausgewählte Korpora und Verfahren der Arbeit mit Korpora vorgestellt und damit gearbeitet.
Die Klausur findet am 22.07.2021 um 14:00 Uhr s.t. statt. Anmerkungen zum Vorgehen finden Sie im FAQ.
Aktualisierung (02.09.2021)
Die Nachholklausur findet am Donnerstag, den 21.10.2021 von 14:00 – 16:00 Uhr statt. Um gleiche Bedingungen für die Nachholklausur sicher zu stellen, findet die Nachholklausur, genau wie die ursprüngliche Klausur, online statt (sehen sie dazu den Eintrag im FAQ). Bitte vergessen Sie nicht, sich zur Nachholklausur im LSF anzumelden. Der Anmeldezeitraum ist vom 27.09.2021 bis zum 11.10.2021.
Aktualisierung (02.08.2021)
Die Klausuren sind korrigiert. Wenn Sie die Klausur mitgeschrieben haben, sollten Sie eine Email erhalten haben. Bei Problemen wenden Sie sich an den Dozenten.
Frequently asked questions: FAQ
Datum | Folien | Übungsaufgaben | Sonstige Materialien |
---|---|---|---|
15. April, 2021 | Einführung | Video | |
22. April, 2021 | Shell-Skripte | Video | |
29. April, 2021 | Unix-Werkzeuge | Video | |
06. Mai, 2021 | Ein- und Ausgabe | Video | |
20. Mai, 2021 | sed und awk | Video | |
27. Mai, 2021 | Unicode | Video | |
10. Juni, 2021 | XML | Video | |
17. Juni, 2021 | XML2 | xmlpos | Video |
24. Juni, 2021 | POS | Video | |
01. Juli, 2021 | APIs | compare pos taggers | Video |
08. Juli, 2021 | Crawler | dtacrawl.py dtacrawl_async.py | Video |
15. Juli, 2021 | Zusammenfassung | Probeklausur | Video |