Text Mining adalah proses ekstraksi pengetahuan dari data teks, menggunakan alat analisis untuk mengidentifikasi pola-pola dalam dokumen. Berbeda dengan data mining, sumber datanya adalah koleksi dokumen dan pola-pola ditemukan dalam teks tidak terstruktur. Fokus utama text mining adalah klasifikasi, pengelompokan, dan asosiasi teks. Pra-pemrosesan teks mencakup identifikasi fitur dan ekstraksi representasi dokumen. Text mining memanfaatkan pengetahuan dari bidang lain seperti temu kembali informasi dan linguistik komputasional. Perbedaan mendasar antara text mining dan pengambilan informasi adalah outputnya: pengetahuan probabilistik vs. item data relevan. Jenis teks dan formatnya beragam, dari teks polos hingga PDF dan XML. Tugas utama dalam data mining termasuk klasifikasi, regresi, dan pengelompokan.
TEXT MINING SUATU APLIKASI DATA MINING
DJ Press
0
Post a Comment