We are developing WikiNet – a multi-language ontology by exploiting several aspects of Wikipedia. If you want to make your own WikiNet, here are the (Perl) scripts. Click here to download the current version, built from the 20120104 version of the English Wikipedia, with added lexicalizations from the Dutch (20120119), French (20120117), German (20120115), Italian (20120126), Arabic (20120123), Bulgarian (20120129), Farsi (20120124), Japanese (20120121), Korean (20120122), Russian (20120130), Turkish (20120124) and Chinese (20120128) versions (but it contains lexicalizations in many more languages — check the language statistics file for that). It contains a direct (index.wiki) and a reversed index (reversed_index.wiki) (both multi-lingual), a file with relations (data.wiki), definitions (defs.wiki) and more.The structure is as follows:
A bit more details in a README file, the relation statistics, the language statistics (number of lexicalizations and number of entries covered for each language represented), and a paper. Additional files include in-/out-going links between concepts, corresponding to the hyperlinks in the article bodies.
There are approximately 3 million concepts, and 38+ million relations.
We have a toolkit for visualizing and extracting information from WikiNet: WikiNetTK.
A precursor of the resource in simple text format (in English) is WikiRelations.
WikiNetTK is a tool that allows you to visualize WikiNet, and embed it in your NLP applications. Below are a few screenshots from the visualization component (click to enlarge).
Starting point — choose the concept to visualize, by inputting first the name, and then choosing from the candidates found the one you want:
Expand the relations surrounding a concept:
Visualize and browse information for a concept in text format:
Visualize the paths between concept pairs:
Download here a description of concepts in terms of their grammatical relations to open-class words, and selectional preferences for open-class words in terms of (general) concepts
Download here a multi-lingual dictionary extracted from the English dump of Wiktionary (20100403). The formatting is tab separated values (tsv) as follows:
ENTRY ID DIS POS VAR1 VAR2…
This dictionary contains only entries that have at least one translation. The total number of entries is 74,568, obtained by processing 1,741,886 articles. In the future we will combine this with the multi-lingual expressions extracted from Wikipedia.
reversed_index.wiki (or reversed_index.all.wiki) from WikiNet can also work as a parallel dictionary. They both contain also entries that have names only in English.
Diese Seite ist nur auf deutsch verfügbar
Zur englischen Seite wechseln oder auf dieser Seite bleiben.
Wir nutzen Cookies auf unserer Website. Einige von ihnen sind essenziell, während andere uns helfen, diese Website und Ihre Erfahrung zu verbessern.
Hier finden Sie eine Übersicht über alle verwendeten Cookies. Sie können Ihre Einwilligung zu ganzen Kategorien geben oder sich weitere Informationen anzeigen lassen und so nur bestimmte Cookies auswählen.
Essenzielle Cookies ermöglichen grundlegende Funktionen und sind für die einwandfreie Funktion der Website erforderlich.
Cookie-Informationen anzeigen Cookie-Informationen ausblenden
Name | |
---|---|
Anbieter | Eigentümer dieser Website |
Zweck | Speichert die Einstellungen der Besucher, die in der Cookie Box von Borlabs Cookie ausgewählt wurden. |
Cookie Name | borlabs-cookie |
Cookie Laufzeit | 1 Jahr |
Statistik Cookies erfassen Informationen anonym. Diese Informationen helfen uns zu verstehen, wie unsere Besucher unsere Website nutzen.
Cookie-Informationen anzeigen Cookie-Informationen ausblenden
Akzeptieren | |
---|---|
Name | |
Anbieter | HITS gGmbH |
Zweck | Cookie von Matomo für Website-Analysen. Erzeugt statistische Daten darüber, wie der Besucher die Website nutzt. |
Cookie Name | _pk_*.* |
Cookie Laufzeit | 13 Monate |
Inhalte von Videoplattformen und Social-Media-Plattformen werden standardmäßig blockiert. Wenn Cookies von externen Medien akzeptiert werden, bedarf der Zugriff auf diese Inhalte keiner manuellen Einwilligung mehr.
Cookie-Informationen anzeigen Cookie-Informationen ausblenden
Akzeptieren | |
---|---|
Name | |
Anbieter | |
Zweck | Wird verwendet, um Facebook-Inhalte zu entsperren. |
Datenschutzerklärung | https://www.facebook.com/privacy/explanation |
Host(s) | .facebook.com |
Akzeptieren | |
---|---|
Name | |
Anbieter | |
Zweck | Wird zum Entsperren von Google Maps-Inhalten verwendet. |
Datenschutzerklärung | https://policies.google.com/privacy |
Host(s) | .google.com |
Cookie Name | NID |
Cookie Laufzeit | 6 Monate |
Akzeptieren | |
---|---|
Name | |
Anbieter | |
Zweck | Wird verwendet, um Instagram-Inhalte zu entsperren. |
Datenschutzerklärung | https://www.instagram.com/legal/privacy/ |
Host(s) | .instagram.com |
Cookie Name | pigeon_state |
Cookie Laufzeit | Sitzung |
Akzeptieren | |
---|---|
Name | |
Anbieter | OpenStreetMap Foundation |
Zweck | Wird verwendet, um OpenStreetMap-Inhalte zu entsperren. |
Datenschutzerklärung | https://wiki.osmfoundation.org/wiki/Privacy_Policy |
Host(s) | .openstreetmap.org |
Cookie Name | _osm_location, _osm_session, _osm_totp_token, _osm_welcome, _pk_id., _pk_ref., _pk_ses., qos_token |
Cookie Laufzeit | 1-10 Jahre |
Akzeptieren | |
---|---|
Name | |
Anbieter | |
Zweck | Wird verwendet, um Twitter-Inhalte zu entsperren. |
Datenschutzerklärung | https://twitter.com/privacy |
Host(s) | .twimg.com, .twitter.com |
Cookie Name | __widgetsettings, local_storage_support_test |
Cookie Laufzeit | Unbegrenzt |
Akzeptieren | |
---|---|
Name | |
Anbieter | Vimeo |
Zweck | Wird verwendet, um Vimeo-Inhalte zu entsperren. |
Datenschutzerklärung | https://vimeo.com/privacy |
Host(s) | player.vimeo.com |
Cookie Name | vuid |
Cookie Laufzeit | 2 Jahre |
Akzeptieren | |
---|---|
Name | |
Anbieter | YouTube |
Zweck | Wird verwendet, um YouTube-Inhalte zu entsperren. |
Datenschutzerklärung | https://policies.google.com/privacy |
Host(s) | google.com |
Cookie Name | NID |
Cookie Laufzeit | 6 Monate |