Latest v0.1.58

Tweet Cleaning

Supported from ^0.1.54

Fitur ini bisa menjadi alternatif untuk melakukan cleaning pada data Tweet yang ingin kamu olah.

1. Import

from frasa.preprocess import tweet

2. Full Cleaning

text = tweet(' ๐Ÿ•ต๏ธ Frasa is <b>#awesome #banget</b> ๐Ÿ‘ https://github.com/novay/frasa <i>awesome</i> \n@404vay, @frasaId. http://t.co/g00gl ')
 
print(text.clean())
frasa is awesome

3. Combine Features

Selengkapnya bisa buka halaman masing-masing Features. Manfaatkan kombinasi fitur ini apabila kamu ingin memiliki aturan atau urutan sendiri dalam cleaning tweet.

text = tweet(' ๐Ÿ•ต๏ธ Frasa is <b>#awesome #banget</b> ๐Ÿ‘ https://github.com/novay/frasa <i>awesome</i> \n@404vay, @frasaId. http://t.co/g00gl ')
 
text = text.whitespace().lower()
text = text.emoji().remove()
text = text.urls().remove()
text = text.hashtag().remove()
text = text.html().remove()
 
print(text)
frasa is awesome @404vay, @frasaid.

4. Specific Process

For Next Release

text.clean([only=['emoji', 'urls']])
Frasa is <b>#awesome #banget</b> <i>awesome</i> \n@404vay, @frasaId.