replace typo with space
This commit is contained in:
parent
4bc7c4e2d6
commit
2f4045a98d
|
@ -24,6 +24,14 @@ if nb_sauts > 0:
|
||||||
# Corriger les espaces manquants autour de certaines ponctuations
|
# Corriger les espaces manquants autour de certaines ponctuations
|
||||||
contenu_corrige = re.sub(r"([.,;:!?])( )?", r"\1 ", contenu_corrige)
|
contenu_corrige = re.sub(r"([.,;:!?])( )?", r"\1 ", contenu_corrige)
|
||||||
contenu_corrige = re.sub(r"( )([.,;:!?])", r" \2", contenu_corrige)
|
contenu_corrige = re.sub(r"( )([.,;:!?])", r" \2", contenu_corrige)
|
||||||
|
# replace demiquatratin by full quadratin
|
||||||
|
contenu_corrige = contenu_corrige.replace('–', '—')
|
||||||
|
contenu_corrige = contenu_corrige.replace(' ?', chr(160)+"?")
|
||||||
|
contenu_corrige = contenu_corrige.replace(' !', chr(160)+"!")
|
||||||
|
contenu_corrige = contenu_corrige.replace(' »', chr(160)+"»")
|
||||||
|
contenu_corrige = contenu_corrige.replace('« ', "«"+chr(160))
|
||||||
|
contenu_corrige = contenu_corrige.replace('y’a', "y a")
|
||||||
|
|
||||||
nb_espaces = len(re.findall(r"([.,;:!?])( )?", contenu)) - len(re.findall(r"([.,;:!?])( )?", contenu_corrige)) + len(re.findall(r"( )([.,;:!?])", contenu)) - len(re.findall(r"( )([.,;:!?])", contenu_corrige))
|
nb_espaces = len(re.findall(r"([.,;:!?])( )?", contenu)) - len(re.findall(r"([.,;:!?])( )?", contenu_corrige)) + len(re.findall(r"( )([.,;:!?])", contenu)) - len(re.findall(r"( )([.,;:!?])", contenu_corrige))
|
||||||
if nb_espaces > 0:
|
if nb_espaces > 0:
|
||||||
print(f" Ajout d'espaces autour de certaines ponctuations : {nb_espaces} modification(s)")
|
print(f" Ajout d'espaces autour de certaines ponctuations : {nb_espaces} modification(s)")
|
||||||
|
|
Loading…
Reference in New Issue