Ceci est une expérience dégradée de dados.gov.pt - Portal de dados abertos da Administração Pública. Veuillez activer JavaScript et utiliser un navigateur à jour.

Jeux de données

Rechercher parmi les 10 798 jeux de données sur dados.gov.pt - Portal de dados abertos da Administração Pública

Rechercher dans les réutilisations

1 résultats

Trier par :

A n-grams collection extracted from the Portuguese Web

Par Arquivo.pt - pesquise páginas do passado

The n-grams collection was extracted from the collected documents whose identified language was Portuguese. We extracted word n-grams up to the fifht order (5-grams). A set of regular expressions to tokenize the text were applied. After the extraction, all n-grams with tokens having more than 32…

Qualité des métadonnées :

100.0/100

Mis à jour le 29 août 2023

Creative Commons CCZero

0 réutilisation
0 favori