Tweet Cleaning
Supported from ^0.1.54
Fitur ini bisa menjadi alternatif untuk melakukan cleaning pada data Tweet yang ingin kamu olah.
1. Import
from frasa.preprocess import tweet
2. Full Cleaning
text = tweet(' ๐ต๏ธ Frasa is <b>#awesome #banget</b> ๐ https://github.com/novay/frasa <i>awesome</i> \n@404vay, @frasaId. http://t.co/g00gl ') print(text.clean())
frasa is awesome
3. Combine Features
Selengkapnya bisa buka halaman masing-masing Features. Manfaatkan kombinasi fitur ini apabila kamu ingin memiliki aturan atau urutan sendiri dalam cleaning tweet.
text = tweet(' ๐ต๏ธ Frasa is <b>#awesome #banget</b> ๐ https://github.com/novay/frasa <i>awesome</i> \n@404vay, @frasaId. http://t.co/g00gl ') text = text.whitespace().lower()text = text.emoji().remove()text = text.urls().remove()text = text.hashtag().remove()text = text.html().remove() print(text)
frasa is awesome @404vay, @frasaid.
4. Specific Process
For Next Release
text.clean([only=['emoji', 'urls']])
Frasa is <b>#awesome #banget</b> <i>awesome</i> \n@404vay, @frasaId.