A n-grams collection extracted from the Portuguese Web Par Arquivo.pt - pesquise páginas do passado The n-grams collection was extracted from the collected documents whose identified language was Portuguese. We extracted word n-grams up to the fifht order (5-grams). A set of regular expressions to tokenize the text were applied. After the extraction, all n-grams with tokens having more than 32… Qualité des métadonnées : 1.0/1 Qualité des métadonnées : Description des données renseignée Ressources documentées Licence renseignée Fréquence de mise à jour respectée Formats de fichiers standards Couverture temporelle renseignée Couverture spatiale renseignée En savoir plus sur cet indicateur — Mis à jour le 29 août 2023 0 réutilisation 0 favori