Friday, March 4, 2016

Content-based Recommender Systems merekomendasikan item yang typical (contentnya) nya yang representasinya sama dengan item yang relevan dengan pengguna, kesamaan item dihitung berdasarkan pada fitur yang berhubungan dengan item.



Konsep Dasar Content-based Recommender Systems
Proses rekomendasi content-based recommender systems pada dasarnya dengan cara mencocokkan atribut profil pengguna terhadap atribut dari objek konten, hasil tersebut berdasarkan penilaian relevansi yang mewakili tingkat pengguna minat dalam objek itu.

A High Level Architecture of Content-based Systems
System Content-based Information Filtering (IF) memerlukan teknik yang tepat dalam menghasilkan item dan memproduksi profil pengguna, proses rekomendasi dilakukan dalam tiga langkah, yang masing-masing ditangani oleh komponen terpisah diantaranya…
         Content Analyzer
Komponen ini mewakili isi dari item (Dokumen, Web pages, News, Product descriptions, etc.), sebagai catatan Informasi tidak memiliki struktur (misalnya teks) tentu sebelumnya memerlukan sebuah langkah pre-processing guna mengekstrak informasi yang relevan terstruktur. Komponen ini merupakan representasi input untuk Profil Learner dan Filtering Component.

         Profile Learner
Komponen ini mengumpulkan data representative dari preferensi pengguna dan melakukan generalisasi data dalam membangun pengguna profil pengguna. Biasanya, strategi generalisasi diwujudkan melalui machine learning technique.

         Filtering Component
Komponen ini mengeksploitasi profil pengguna dalam menyarankan item yang relevan dengan representasi profil pengguna terhadap bahwa barang yang akan direkomendasikan.



Kelebihan dan Kekurangan dari Content-based Filtering
KELEBIHAN
USER INDEPENDENCE
Tidak tergantung user lain, content based filtering membangun profil dengan cara mengeksploitasi berdasarkan penilaian yang disediakan oleh pengguna aktif.

TRANSPARENCY
Terdapat perincian cara kerja system rekomendasi dalam memunculkan item yang relevan berdasarkan fitur konten.
NEW ITEM
Mampu merekomendasikan item belum dinilai oleh setiap pengguna.

KEKURANGAN
LIMITED CONTENT ANALYSIS
Memiliki keterbatasan dalam jumlah, jenis fitur yang terkait, apakah secara otomatis atau manual, begitupula dengan item-item yang disarankan.

OVER-SPECIALIZATION
Content based filtering tidak memiliki metode yang melekat untuk menemukan sesuatu yang tidak terduga. Sistem hanya akan menunjukkan item yang nilainya tinggi untuk dicocokkan dengan profil pengguna, maka pengguna akan selalu menemukan item serupa dengan yang sudah direkomendasikan sebelumnya.
Kelemahan ini juga disebut masalah item yang dihasilkan secara kebetulan (serendipity), kecenderungan untuk menghasilkan rekomendasi dengan tingkat yang terbatas dalam menghasilkan kebaruan.

NEW USER
Sistem akan tidak dapat memberikan rekomendasi yang dapat diandalkan pada pengguna baru, karena membutuhkan penelusuran terlebih dahulu pada preferensi pengguna.

State of the Art of Content-based Recommender Systems
Konten berbasis penyaringan mengeksploitasi isi item data untuk memprediksi relevansinya berdasarkan profil pengguna. Penelitian pada content based recommender systemmelingkupi banyak topik ilmu komputer, terutama Information Retrieval (IR) dan Artificial Intelligence.
Item Representation
Item yang dapat direkomendasikan kepada pengguna yang diwakili oleh satu set fitur, juga disebut atribut atau properti.
        Keyword-based Vector Space Model
Kebanyakan content based recommender system menggunakan model pengambilan relatif sederhana, seperti pencocokan kata kunci atau Space Model Vector (VSM) dengan dasar TF-IDF pembobotan.

        Review of Keyword-based Systems
Beberapa recommender system berbasis keyword telah dikembangkan, memungkin untuk menemukan dalam berbagai domain aplikasi, seperti website berita, musik, e-commerce, film, dll Setiap domain menyajikan masalah yang berbeda yang memerlukan solusi berbeda pula.

        Semantic Analysis by using Ontologies
Analisis semantik memungkinkan learning yang lebih akurat terhadapa profil yang berisi referensi konsep didefinisikan dalam knowledge eksternal.
Tujuan utama pendekatan menyediakan recommender system secara cultural dan berdasarkan pengetahuan linguistikyang mampu menafsirkan natural language dan penalaran pada konten yang dibuat.

Penyajian review ini dilakukan dengan memperhatikan beberapa kriteria:
       •     Jenis sumber pengetahuan yang terlibat (mis leksikon, ontologi, dll)
       •     Teknik diadopsi untuk anotasi atau representasi dari item;
       •     Jenis konten termasuk dalam pengguna profile;
       •     Item-profil strategi yang cocok.

        Semantic Analysis by using Encyclopedic Knowledge Sources
Meningkatkan efektivitas teknik pengolahan bahasa alami (natural language) dengan menghasilkan fitur yang lebih informatif daripada kamus kata-kata. Pnelusuran profil pengguna bisa dihasilkan dari pengetahuan eksogen (eksternal disediakan) dan berkaitan dengan pengetahuan endogen (diekstraksi dari dokumen itu sendiri). Contoh basis pengetahuan tujuan umum diantaranya Open Directory Project (ODP), Web Direktori Yahoo!, dan Wikipedia.

Metode Pembelajaran untuk User Profiles
Machnie learning techniques, pada umumnya digunakan dalam menganut profil pengguna pada content based recommender system, yang cocok untuk kategorisasi teks.
        Probabilistic Methods and Naıve Bayes
Naïve Bayes merupakan pendekatan probabilistik untuk pembelajaran induktif, dan berdasarkan teori klasifkasi teorema Bayesian.

P(c|d), dokumen d milik kelas c,
P(c), probabilitas mengamati dokumen kelas c,
P(d|c), probabilitas mengamati dokumen d diberikan c dan
P(d), probabilitas mengamati contoh d.

        Relevance Feedback and Rocchio’s Algorithm
Metode Rocchio ini digunakan untuk menginduksi linear, algoritma ini merepresentasikan dokumen sebagai vektor, sehingga dokumen dengan konten serupa memiliki vektor yang sama. Teknik ini diterapkan dalam Information Retrieval (IR) yang membantu pengguna secara bertahap untuk menyaring kembali pertanyaan berdasarkan hasil pencarian sebelumnya.

        Other Methods
Decision Tree
Decision rule classifiers
Nearest neighbor algorithms

Kesimpulan

Content-based recommender systems hanya dapat merekomendasikan item yang memiliki nilai tinggi terhadap profil pengguna, sehingga membatasi pengguna untuk mendapatkan rekomendasi item lain diantara yang sudah direkomendasikan serupa dengan yang sudah dinilai, kekurangan ini, disebut over-spesialisasi, trend kedepanya menganalisa sistem agar dapat digunakan secara efektif dalam skenario dunia nyata, tentunya dengan perbaikan bagaimana merekomendasikan pada pengguna secara  cara lebih baik tidak secara surprising and unexpected (serendipitous).

Sumber : Content-based Recommender Systems: State of the Art and Trends
Pasquale Lops, Marco de Gemmis and Giovanni Semeraro

1 comments:

  1. Bet365 Bonus Code: Just enter the correct number for signup
    Simply bet365 enter your ボンズ カジノ bet365 bonus code and receive a deposit bonus of up to $500 (not a deposit). This bet365 bonus code allows 메리트카지노 you to

    ReplyDelete