2019 European Parliamentary Elections - CoNLL-U texts Par Arquivo.pt - pesquise páginas do passado This dataset is composed of the automatically parsed texts present in the "2019 European Parliamentary Elections - Raw texts" collection. The texts were automatically annotated using the UDify tool with its multilingual model. (2023-04-27) Related publications: Diego Alves,Computational… Qualité des métadonnées : 1.0/1 Qualité des métadonnées : Description des données renseignée Ressources documentées Licence renseignée Fréquence de mise à jour respectée Formats de fichiers standards Couverture temporelle renseignée Couverture spatiale renseignée En savoir plus sur cet indicateur — Mis à jour le 30 août 2023 0 réutilisation 0 favori
2019 European Parliamentary Elections - Raw texts Par Arquivo.pt - pesquise páginas do passado This corpus is composed of raw texts extracted from the EAWP23 collection of the Arquivo.pt which is composed of internet websites about the 2019 European Parliamentary Elections for all 24 European Union official languages. (2023-04-27) This data set was created by Diego Alves and was also… Qualité des métadonnées : 1.0/1 Qualité des métadonnées : Description des données renseignée Ressources documentées Licence renseignée Fréquence de mise à jour respectée Formats de fichiers standards Couverture temporelle renseignée Couverture spatiale renseignée En savoir plus sur cet indicateur — Mis à jour le 30 août 2023 0 réutilisation 0 favori
A n-grams collection extracted from the Portuguese Web Par Arquivo.pt - pesquise páginas do passado The n-grams collection was extracted from the collected documents whose identified language was Portuguese. We extracted word n-grams up to the fifht order (5-grams). A set of regular expressions to tokenize the text were applied. After the extraction, all n-grams with tokens having more than 32… Qualité des métadonnées : 1.0/1 Qualité des métadonnées : Description des données renseignée Ressources documentées Licence renseignée Fréquence de mise à jour respectée Formats de fichiers standards Couverture temporelle renseignée Couverture spatiale renseignée En savoir plus sur cet indicateur — Mis à jour le 29 août 2023 0 réutilisation 0 favori