Here you find the Part of Speech annotation for the ICSI Meeting Recorder Data. Please note, that the files only contain the POS information and no word information. You already have to have the ICSI corpus to use this data. When using this data, please cite the following paper: Margot Mieskes and Michael Strube:
Part-of-Speech Tagging of Transcribed Speech Proceedings of the 5th Conference on Language Resources and Evaluation (LREC 2006). Genua, Italy, May 22-28, 2006 (PDF).
This paper also contains a description of the method used and detailed results.
The format in the .txt files is one segment per line.
The Gold Standard files are:Bed016
Bed017
Bmr001
Bmr002
Bns003
Bmr003
Bmr004
Bmr005
Bsr001
Btr001
Btr002
Buw001
Here you find the Gold Standard manual annotation in .txt format.
Here you find the Gold Standard manual annotation in .mmax format.
Here you find the automatic POS annotation for the Gold Standard after retraining the four taggers on the manual data in .txt format.
Here you find the automatic POS annotation for the Gold Standard after retraining the four taggers on the manual data in .mmax format.
Here you find the automatic POS annotation for the whole corpus after retraining the four taggers on the manual data in .txt format.
Here you find the automatic POS annotation for the whole corpus after retraining the four taggers on the manual data in .mmax format.
The four taggers used were the following:
TBL Tagger: Eric Brill Some Advance in transformation based part of speech tagging In Proceedings of the 12th National Conference on Artificial Intelligence, Seattle, Washington 1. – 4. August 1994, pp. 722-727
TnT Tagger: Thorsten Brants TnT – A statistical Part Of Speech tagger In Proceedings of the 6th International Conference on Applied Natural Language Processing, Seattle, Washington 29. April – 4. May 2000, pp. 224-231
Stanford NLP Library Tagger: Kristina Toutanova and Christopher D. Manning Enriching the knowledge sources used in a maximum entropy part-of-speech tagger In Proceedings of the Joint SIGDAT Conference on Empirical methods in Natural Language Processing and very large corpus, Hong Kong 2000, pp. 63-70
Stanford NLP Library Tagger:Kristina Toutanova, Dan Klein, Christopher D. Manning and Yoram Singer Feature-Rich Part-of-Speech Tagging with a cyclic dependency network. In Proceedings of the Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics, Edmonton, Alberta, Canada, 27. May – 1. June 2003, pp. 252-259NLP Group
Diese Seite ist nur auf deutsch verfügbar
Zur englischen Seite wechseln oder auf dieser Seite bleiben.
Wir nutzen Cookies auf unserer Website. Einige von ihnen sind essenziell, während andere uns helfen, diese Website und Ihre Erfahrung zu verbessern.
Hier finden Sie eine Übersicht über alle verwendeten Cookies. Sie können Ihre Einwilligung zu ganzen Kategorien geben oder sich weitere Informationen anzeigen lassen und so nur bestimmte Cookies auswählen.
Essenzielle Cookies ermöglichen grundlegende Funktionen und sind für die einwandfreie Funktion der Website erforderlich.
Cookie-Informationen anzeigen Cookie-Informationen ausblenden
Name | |
---|---|
Anbieter | Eigentümer dieser Website |
Zweck | Speichert die Einstellungen der Besucher, die in der Cookie Box von Borlabs Cookie ausgewählt wurden. |
Cookie Name | borlabs-cookie |
Cookie Laufzeit | 1 Jahr |
Statistik Cookies erfassen Informationen anonym. Diese Informationen helfen uns zu verstehen, wie unsere Besucher unsere Website nutzen.
Cookie-Informationen anzeigen Cookie-Informationen ausblenden
Akzeptieren | |
---|---|
Name | |
Anbieter | HITS gGmbH |
Zweck | Cookie von Matomo für Website-Analysen. Erzeugt statistische Daten darüber, wie der Besucher die Website nutzt. |
Cookie Name | _pk_*.* |
Cookie Laufzeit | 13 Monate |
Inhalte von Videoplattformen und Social-Media-Plattformen werden standardmäßig blockiert. Wenn Cookies von externen Medien akzeptiert werden, bedarf der Zugriff auf diese Inhalte keiner manuellen Einwilligung mehr.
Cookie-Informationen anzeigen Cookie-Informationen ausblenden
Akzeptieren | |
---|---|
Name | |
Anbieter | |
Zweck | Wird verwendet, um Facebook-Inhalte zu entsperren. |
Datenschutzerklärung | https://www.facebook.com/privacy/explanation |
Host(s) | .facebook.com |
Akzeptieren | |
---|---|
Name | |
Anbieter | |
Zweck | Wird zum Entsperren von Google Maps-Inhalten verwendet. |
Datenschutzerklärung | https://policies.google.com/privacy |
Host(s) | .google.com |
Cookie Name | NID |
Cookie Laufzeit | 6 Monate |
Akzeptieren | |
---|---|
Name | |
Anbieter | |
Zweck | Wird verwendet, um Instagram-Inhalte zu entsperren. |
Datenschutzerklärung | https://www.instagram.com/legal/privacy/ |
Host(s) | .instagram.com |
Cookie Name | pigeon_state |
Cookie Laufzeit | Sitzung |
Akzeptieren | |
---|---|
Name | |
Anbieter | OpenStreetMap Foundation |
Zweck | Wird verwendet, um OpenStreetMap-Inhalte zu entsperren. |
Datenschutzerklärung | https://wiki.osmfoundation.org/wiki/Privacy_Policy |
Host(s) | .openstreetmap.org |
Cookie Name | _osm_location, _osm_session, _osm_totp_token, _osm_welcome, _pk_id., _pk_ref., _pk_ses., qos_token |
Cookie Laufzeit | 1-10 Jahre |
Akzeptieren | |
---|---|
Name | |
Anbieter | |
Zweck | Wird verwendet, um Twitter-Inhalte zu entsperren. |
Datenschutzerklärung | https://twitter.com/privacy |
Host(s) | .twimg.com, .twitter.com |
Cookie Name | __widgetsettings, local_storage_support_test |
Cookie Laufzeit | Unbegrenzt |
Akzeptieren | |
---|---|
Name | |
Anbieter | Vimeo |
Zweck | Wird verwendet, um Vimeo-Inhalte zu entsperren. |
Datenschutzerklärung | https://vimeo.com/privacy |
Host(s) | player.vimeo.com |
Cookie Name | vuid |
Cookie Laufzeit | 2 Jahre |
Akzeptieren | |
---|---|
Name | |
Anbieter | YouTube |
Zweck | Wird verwendet, um YouTube-Inhalte zu entsperren. |
Datenschutzerklärung | https://policies.google.com/privacy |
Host(s) | google.com |
Cookie Name | NID |
Cookie Laufzeit | 6 Monate |