from unicodedata import category def get_all_unicode_letters ( categs = ( 'Lu' , 'Ll' , 'Lt' , 'Lm' ) ) : # Categores unicode dans lesquelles récupérer les lettres # On peut virer 'Lt', 'Lm' si on veut garder des lettres plus # proches de notre alphabet categs = set ( categs ) # on prend tous les symboles utf8 all_unicode = ( chr ( i ) for i in range ( 65536 ) ) # on garde ceux qui sont dans une categorie 'lettre' return '' . join ( c for c in all_unicode if category ( c ) in categs ) letters = get_all_unicode_letters ( )