Dalam ekosistem digital modern, data menjadi fondasi utama pengambilan keputusan bisnis. Namun, data yang dihasilkan dari percakapan pelanggan sering kali tidak terstruktur, menjadikannya sulit dianalisis. Data mentah ini, yang mencakup teks, metadata, dan log interaksi, belum memiliki nilai bisnis hingga melewati proses transformasi.
Di sinilah Machine Learning berperan krusial. Dengan algoritma prediktif, ML dapat mengekstrak pola, menganalisis sentimen, dan memprioritaskan tiket secara otomatis. Hal ini mengubah data percakapan menjadi insight yang dapat diintegrasikan langsung ke dalam alur kerja operasional.
Pada sesi AI Insight kali ini, kami mengundang Rijalul Fikri, selaku Head of Solution & Support Qiscus, untuk membagikan wawasannya tentang bagaimana mengoptimalkan Machine Learning untuk mendapatkan insight berharga dari data mentah.
Untuk memahami lebih dalam, tonton video lengkapnya di atas dan simak penjelasan detailnya dalam artikel di bawah ini.
Apa itu Machine Learning
Machine Learning (ML) adalah teknologi yang memungkinkan sistem komputer belajar secara otomatis dari data, tanpa harus diprogram ulang untuk setiap tugas. Perkembangannya berakar pada disiplin seperti statistika, matematika, dan data mining, yang memberi kemampuan bagi ML untuk menganalisis data dan menghasilkan prediksi atau keputusan secara mandiri.
Konsep ML mulai diperkenalkan sejak awal abad ke-20 oleh ilmuwan seperti Adrien Marie Legendre, Thomas Bayes, dan Andrey Markov. Salah satu penerapan awal yang terkenal adalah Deep Blue—komputer ciptaan IBM yang pada 1996 berhasil mengalahkan juara catur dunia berkat kemampuannya mempelajari pola permainan.
Kini, ML hadir di berbagai aspek kehidupan sehari-hari, mulai dari face unlock pada smartphone, rekomendasi iklan di media sosial, hingga sistem prediksi cuaca. ML belajar dari data yang tersedia sejak pengembangan awal, lalu terus beradaptasi dengan data baru, menggunakan berbagai teknik seperti supervised learning, unsupervised learning, dan reinforcement learning.
Mengapa Machine Learning Penting untuk Data
Machine Learning mengubah data mentah menjadi informasi terstruktur yang dapat digunakan untuk memahami pola, memprediksi tren, dan mendukung keputusan secara akurat. Secara umum, data yang digunakan dalam ML dapat berasal dari berbagai sumber, dan biasanya terdiri dari:
1. Data Teks
Unstructured data seperti artikel, chat, ulasan pelanggan, dan posting media sosial, yang memerlukan teknik Natural Language Processing (NLP) untuk mengubah bahasa manusia menjadi representasi numerik yang dapat dipahami oleh algoritma ML.
2. Data Numerik
Angka yang terukur seperti penjualan harian, suhu, trafik jaringan, atau metrik performa sistem, yang sering menjadi input utama dalam model regression dan time series forecasting karena sifatnya yang kuantitatif dan terukur.
3. Data Kategorikal
Nilai diskrit seperti jenis produk, kota, status transaksi, atau kategori layanan, yang biasanya di-encode menjadi format numerik menggunakan teknik seperti one-hot encoding atau label encoding sebelum dimasukkan ke model ML.
4. Data Timeseries
Data yang diurutkan berdasarkan waktu, misalnya harga saham, log sensor IoT, atau jumlah transaksi per jam, yang memerlukan teknik khusus untuk mempertimbangkan seasonality dan trend seperti ARIMA, Prophet, atau LSTM.
Bagaimana Machine Learning Mengubah Data Menjadi Insight
Machine Learning (ML) memanfaatkan berbagai pendekatan algoritma—seperti supervised learning, unsupervised learning, dan reinforcement learning—untuk memproses data mentah menjadi actionable insights. Insight ini kemudian dapat langsung digunakan untuk pengambilan keputusan strategis, optimasi operasional, maupun pengembangan produk.
1. Customer Segmentation (Clustering / Unsupervised Learning)
Mengelompokkan pelanggan atau pengguna berdasarkan kesamaan perilaku, preferensi, dan interaksi untuk menciptakan strategi layanan dan pemasaran yang lebih tepat sasaran.
Proses Teknis:
- Data Input: Riwayat interaksi pengguna, frekuensi penggunaan produk, jenis layanan yang dipilih.
- Preprocessing: Normalisasi data, feature scaling, dan penanganan nilai hilang (missing values).
- Algoritma: K-Means, Hierarchical Clustering, atau DBSCAN.
- Output Insight: Segmen pelanggan dengan karakteristik unik.
2. Fraud Detection (Classification / Supervised Learning)
Mendeteksi pola anomali pada data transaksi atau aktivitas pengguna untuk mencegah potensi penipuan secara real-time.
Proses Teknis:
- Data Input: Riwayat transaksi, lokasi login, perangkat yang digunakan, kecepatan aktivitas.
- Preprocessing: Feature engineering seperti jumlah transaksi dalam periode tertentu atau jarak geografis antar transaksi.
- Algoritma: Random Forest, Gradient Boosting, atau Logistic Regression.
- Output Insight: Prediksi status transaksi dengan skor probabilitas risiko.
3. Sentiment Analysis (Text Classification / NLP)
Mengidentifikasi nada emosi dan opini publik dari teks untuk memahami persepsi pelanggan terhadap produk atau layanan.
Proses Teknis:
- Data Input: Ulasan pelanggan, komentar media sosial, percakapan customer service.
- Preprocessing: Tokenization, stopword removal, lemmatization, konversi teks menjadi vektor (TF-IDF, word embeddings).
- Algoritma: Naive Bayes, SVM, atau model transformer seperti BERT.
- Output Insight: Skor sentimen (positif, negatif, netral) beserta topik terkait.
4. Demand Forecasting (Time Series Forecasting)
Memproyeksikan kebutuhan dan permintaan di masa depan untuk mengoptimalkan persediaan, kapasitas produksi, dan sumber daya operasional.
Proses Teknis:
- Data Input: Data historis permintaan produk, penjualan, tingkat stok, atau jumlah permintaan layanan.
- Preprocessing: Penanganan seasonality dan trend, mengisi data yang hilang, mengubah format menjadi time series.
- Algoritma: ARIMA, Prophet, atau LSTM.
- Output Insight: Prediksi volume permintaan dengan interval kepercayaan.
AI Bukan hanya ChatGPT
Dalam beberapa tahun terakhir, popularitas ChatGPT dan berbagai image generator seperti MidJourney atau DALL·E membuat banyak orang beranggapan bahwa Artificial Intelligence (AI) hanya identik dengan teknologi generatif. Padahal, AI adalah payung besar yang mencakup banyak cabang dan pendekatan, tidak terbatas pada model generative AI.
Secara umum, AI mencakup berbagai bidang, antara lain:
- Machine Learning (ML): Algoritma yang mempelajari pola dari data historis untuk membuat prediksi atau klasifikasi.
- Computer Vision (CV): Sistem yang memahami dan memproses informasi visual, seperti deteksi objek atau pengenalan wajah.
- Natural Language Processing (NLP): Teknologi yang memproses bahasa manusia, termasuk chatbot, machine translation, dan text summarization.
- Robotics & Control Systems: AI yang mengendalikan robot atau sistem otomatis di manufaktur dan logistik.
- Optimization & Decision Systems: AI yang digunakan untuk penjadwalan, perencanaan, dan optimasi sumber daya.
Perbedaan Pendekatan Manual vs Machine Learning
Dalam pengembangan sistem, terdapat dua pendekatan utama untuk memproses data dan mengambil keputusan: pendekatan manual berbasis aturan (rule-based) dan pendekatan Machine Learning (ML).
1. Rule-Based (Pendekatan Manual)
Pada sistem berbasis aturan, pengembang menentukan logika secara eksplisit dalam bentuk if-else statements atau decision trees yang dibuat secara manual. Setiap kemungkinan kondisi harus diprediksi dan diatur terlebih dahulu.
Contoh:

Artinya, sistem hanya akan merespons jika kondisi yang sudah ditentukan terpenuhi.
Kelebihan:
- Mudah diimplementasikan untuk kasus sederhana.
- Hasilnya dapat diprediksi karena semua aturan eksplisit.
Kekurangan:
- Tidak adaptif terhadap pola baru.
- Tidak efisien untuk data berskala besar.
- Membutuhkan pembaruan manual setiap kali ada perubahan kondisi.
2. Machine Learning (Pendekatan Otomatis)
Dalam ML, sistem belajar dari contoh data historis untuk menemukan pola dan membuat prediksi secara otomatis. Model dilatih dengan training data, kemudian diaplikasikan pada data baru tanpa memerlukan aturan yang ditulis secara eksplisit.
Contoh:
Model dilatih dengan ribuan contoh percakapan yang dikategorikan, sehingga dapat mengklasifikasikan pesan baru seperti “refund” ke kategori finance meskipun kata yang digunakan berbeda, misalnya “uang kembali” atau “pengembalian dana”.
Keunggulan ML:
- Menangani data dalam jumlah besar: Mampu memproses jutaan data dengan cepat.
- Fleksibel terhadap perubahan pola: Model dapat diperbarui (retraining) saat data baru masuk.
- Mendeteksi pola kompleks: Dapat menemukan hubungan non-linear yang sulit ditulis dalam aturan manual.
Machine Learning Methods
Secara umum, model machine learning dapat diklasifikasikan menjadi tiga kategori utama berdasarkan metode pembelajaran dan jenis umpan balik yang digunakan selama proses pelatihan, yaitu Supervised Learning, Unsupervised Learning, dan Reinforcement Learning.
1. Supervised Learning
Supervised learning, atau pembelajaran terawasi, adalah metode yang menggunakan dataset berlabel untuk melatih algoritma agar dapat mengklasifikasikan data atau memprediksi hasil dengan akurat. Saat data input diberikan ke model, bobot (weights) model akan disesuaikan hingga menghasilkan performa terbaik. Proses ini biasanya dilakukan melalui cross validation untuk menghindari masalah overfitting (model terlalu sesuai pada data latih) atau underfitting (model kurang mampu mengenali pola).
Pendekatan ini banyak digunakan untuk menyelesaikan masalah dunia nyata dalam skala besar, misalnya mengklasifikasikan email spam agar langsung dipindahkan ke folder terpisah dari kotak masuk. Contoh algoritma yang digunakan antara lain: Neural Networks, Naïve Bayes, Linear Regression, Logistic Regression, Random Forest, dan Support Vector Machine (SVM).
2. Unsupervised Learning
Unsupervised learning, atau pembelajaran tanpa pengawasan, adalah metode yang menggunakan algoritma machine learning untuk menganalisis dan mengelompokkan dataset yang tidak memiliki label. Kelompok data yang terbentuk sering disebut cluster. Algoritma ini secara otomatis menemukan pola tersembunyi atau pengelompokan data tanpa campur tangan manusia.
Kemampuan unsupervised learning untuk mengidentifikasi kesamaan dan perbedaan dalam data membuatnya ideal untuk analisis data eksploratif, strategi cross-selling, segmentasi pelanggan, serta pengenalan pola dan gambar. Metode ini juga digunakan untuk mengurangi jumlah fitur dalam model melalui proses dimensionality reduction. Dua pendekatan populer adalah Principal Component Analysis (PCA) dan Singular Value Decomposition (SVD). Algoritma umum lainnya mencakup Neural Networks, K-Means Clustering, dan Probabilistic Clustering Methods.
3. Reinforcement Learning
Reinforcement learning adalah metode machine learning yang mirip dengan supervised learning, tetapi algoritma tidak dilatih menggunakan data sampel yang lengkap. Model ini belajar secara bertahap melalui proses trial and error. Setiap rangkaian tindakan yang menghasilkan hasil positif akan diperkuat, sehingga model dapat mengembangkan strategi atau kebijakan terbaik untuk memecahkan masalah tertentu.
Alur Kerja Machine Learning

Setiap proyek Machine Learning (ML) biasanya mengikuti alur kerja terstruktur yang memastikan model yang dihasilkan tidak hanya akurat, tetapi juga siap digunakan di dunia nyata. Proses ini dimulai dari pengumpulan data yang relevan, baik dari API, data warehouse, sensor, maupun sumber publik. Data tersebut kemudian melalui tahap preprocessing untuk membersihkan error, mengatasi nilai yang hilang, menghapus duplikasi, dan menormalkan format agar konsisten.
Langkah berikutnya adalah feature selection dan feature engineering, di mana variabel yang paling relevan dipilih atau diubah menjadi bentuk yang lebih bermakna—misalnya, mengekstrak hari dalam minggu dari timestamp atau membuat skor sentimen dari teks. Setelah itu, data siap untuk tahap model training, yaitu melatih algoritma menggunakan data historis dengan pembagian training set dan test set, sekaligus melakukan hyperparameter tuning untuk mencapai performa optimal.
Model yang sudah dilatih akan melalui proses evaluation menggunakan metrik seperti accuracy, precision, recall, F1-score, dan ROC-AUC untuk memastikan kemampuannya bekerja di berbagai skenario. Jika hasilnya memuaskan, model masuk ke tahap deployment, di mana ia diintegrasikan ke sistem produksi—baik untuk prediksi batch berkala maupun real-time inference—sehingga dapat langsung memberikan insight atau rekomendasi bagi proses bisnis.
Contoh Skenario Penerapan Machine Learning
Penerapan Machine Learning dalam bisnis dapat mencakup berbagai skenario, mulai dari peningkatan pengalaman pelanggan hingga optimasi operasional. Berikut beberapa contoh penerapan yang umum digunakan:
1. Customer Segmentation
Mengelompokkan pelanggan ke dalam segmen yang memiliki kesamaan perilaku, preferensi, atau pola interaksi. Dengan segmentasi ini, strategi pemasaran dan layanan dapat lebih terarah. Dengan Qiscus CDP (Customer Data Platform), semua data interaksi pelanggan dari berbagai kanal (WhatsApp, email, live chat, dll.) dikumpulkan di satu tempat.
Machine Learning kemudian dapat menganalisis data ini—termasuk frekuensi chat, jenis pertanyaan, atau waktu aktif—untuk mengidentifikasi segmen pelanggan yang unik. Misalnya, Anda bisa mengelompokkan pelanggan menjadi “Pengguna Aktif,” “Pelanggan yang Butuh Bantuan Ekstra,” atau “Pelanggan Potensial.” Hasilnya, tim Anda dapat merancang penawaran personalisasi atau kampanye retensi yang spesifik untuk setiap kelompok.
2. Sentiment Analysis
Menganalisis pesan pelanggan untuk mengukur tingkat kepuasan dan emosi yang tersampaikan, baik positif, negatif, maupun netral. Model NLP dapat digunakan untuk memantau perubahan sentimen dari waktu ke waktu, sehingga tim customer service bisa segera merespons keluhan dan memanfaatkan momen positif untuk meningkatkan engagement.
3. Churn Prediction
Memprediksi pelanggan yang berisiko berhenti menggunakan layanan berdasarkan penurunan frekuensi interaksi, keterlambatan respon, atau pola komunikasi yang berubah. Dengan informasi ini, tim dapat melakukan tindakan pencegahan, seperti memberikan insentif atau menghubungi pelanggan sebelum mereka benar-benar berhenti.
4. Sales Forecasting
Memperkirakan kebutuhan tenaga penjualan atau proyeksi pendapatan berdasarkan tren historis interaksi pelanggan, permintaan produk, dan siklus penjualan. Hasil prediksi ini membantu manajemen dalam merencanakan target, mengatur stok, dan mengoptimalkan strategi penjualan di periode tertentu.
5. Ticket Prioritization
Mengotomatiskan proses pemberian prioritas pada tiket yang masuk berdasarkan tingkat urgensi. Sistem dapat menganalisis kata kunci, kategori masalah, atau profil pelanggan untuk memastikan tiket kritis ditangani lebih cepat.
Machine Learning dapat secara otomatis menganalisis pesan masuk dan mengkategorikannya berdasarkan urgensi. Misalnya, pesan yang mengandung kata kunci seperti “masalah pembayaran” atau “urgent” bisa langsung diprioritaskan dan dialihkan ke agen senior melalui Qiscus Helpdesk. Sistem ini memastikan tiket kritis ditangani lebih cepat, sehingga waktu respons dapat ditekan dan kepuasan pelanggan meningkat.
Dari Data Mentah Menjadi Keunggulan Kompetitif
Pada akhirnya, Machine Learning bukan sekadar tren teknologi, melainkan fondasi strategis yang mampu mengubah data mentah menjadi insight berdaya guna. Dengan kemampuannya mengotomatisasi analisis, memprediksi tren, hingga meningkatkan pengalaman pelanggan, ML memberi bisnis keunggulan kompetitif di tengah dinamika digital yang serba cepat.
Ingin tahu bagaimana Machine Learning bisa diimplementasikan secara nyata di bisnis Anda? Hubungi Qiscus sekarang dan temukan solusi terbaiknya.