Forum >> Principianti >> [risolto] Regex e parole unite da simboli

Pagina: 1

Buongiorno e buona domenica,

dato un testo:

testo = 'x-x-x y'


vorrei elaborare una regex che trovi ogni parola.
Lo scopo è quello di considerare parola unica tutte quelle unite da simboli, tipo apostrofi e trattini, come fanno i programmi di videoscrittura.
Le mie basilari conoscenze di Python mi suggeriscono solo una regex del genere:

(r'[\w+]*\W+[\w+]*', testo)


ma questa mi restituirebbe:

['x-x', '-x', ' y']


Come potrei modificare la regex in modo che restituisca correttamente tutte le parole a prescindere dalla loro lunghezza, eliminando anche i caratteri di spaziatura?

Grazie.



--- Ultima modifica di Idle in data 2019-01-13 08:53:42 ---

--- Ultima modifica di Idle in data 2019-01-13 08:55:05 ---

--- Ultima modifica di Idle in data 2019-01-13 08:56:20 ---

--- Ultima modifica di Idle in data 2019-01-13 15:11:46 ---
Guarda la documentazione per "re.split".
https://pythoninwindows.blogspot.com/p/blog-page.html
Le mie guide: Come installare e usare Python su Windows - Progetti Python multilingua
Grazie del suggerimento: funziona.

testo = 'x-x-x y'
re.split(r'[\W+]*\s+[\W+]*', testo)
>>> ['x-x-x', 'y']




Pagina: 1



Esegui il login per scrivere una risposta.