Pengertian latent semantic index search LSI

by

helmy

Selamat Datang di Blog Orang IT. Latent semantic index merupakan istilah yang awalnya terdengar asing oleh webmaster pemula namun di ebook dan diskusi para mastah istilah ini cukup sering dipergunakan untuk menggambarkan sebuah kata kunci. Seseorang yang memahami istilah ini dan menggunakan nya dalam membalas komentar diforum secara tidak langsung membuat mereka terlihat lebih pintar
Sebenarnya tidak juga , bedanya hanya mereka tau istilah tersebut lebih dulu ketimbang anda. Dalam postingan kali ini saya akan menjelaskan pengertian Latent semantic index dan peran nya dalam hal SEO mengingat sebuah istilah bukan hanya istilah belaka namun menjadi dasar penting dalam pemilihan kata kunci untuk judul artikel blog
Beda latar belakang beda pemahaman , bagi orang awam menganggap istilah laten erat kaitan nya dengan bahaya latent ( sering diungkapkan dalam acara debat politik ) , ada benarnya juga mengingat arti kata dari latent adalah sesuatu yang terpendam atau tersembunyi
Sementara semantic dalam kamus besar bahasa indonesia artinya adalah ” arti kata ” atau penyebutan yang ketiga yaitu index artinya daftar

Mengenal LSI Latent index semantic

Latent Semantic Index (LSI) biasa disebut Latent Semantic Analysis, adalah suatu teknik matematis dalam menganalisa akurasi dari suatu dokumen dengan teknis yang biasa disebut “singular value decomposition”. Agar tidak terkesan rumit, intinya teori ini mencoba mencari hubungan makna kata (semantik) untuk membuat pemahaman tentang informasi yang disediakan.
Sebagian orang menganggap LSI sama dengan sinonim kata , secara hasil penelusuran mungkin memang sama bedanya pada sistemnya kalau sinonim murni dari padanan kata sementara LSI berasal dari hasil olah kata algoritma matematis
Kata “Pagar”, “Betis”, dan “Ayu” adalah kata yang mudah dimengerti, namun saat kata ini dikombinasikan artinya bisa menjadi kata yang berbeda. Disinilah komputer (dalam konteks artikel ini adalah Mesin Pencari Google) ‘berusaha’ memaknai arti kata-kata yang berkaitan.

semantic index search LSI

Sayang nya google sendiri tidak cukup pintar . . .
Apakah Google menggunakan Latent Semantic Index sebagai ranking factor ? Tidak secara langsung. Karena LSI pada dasarnya berbicara soal makna kata tidak berhubungan dengan konteks dari Artikel.
Pada Oktober 2015, Google membuat sebuah pemberitaan tentang algoritma terbaru yang disebut Rank Brain, sebuah teknologi machine learning untuk secara pintar bisa mendeteksi “Maksud” atau “Makna” dari setiap pencarian dalam mesin pencari.
Sebuah paten yang didaftarkan pada Mei 2015 dan akhirnya disetujui pada Agustus 2017 kemarin dikenal dengan “Word Vector” ini deskripsi nya (dalam bahasa Inggris) :
 “Methods, systems, and apparatus, including computer programs encoded on computer storage media, for computing numeric representations of words. One of the methods includes obtaining a set of training data, wherein the set of training data comprises sequences of words; training a classifier and an embedding function on the set of training data, wherein training the embedding function comprises obtained trained values of the embedding function parameters; processing each word in the vocabulary using the embedding function in accordance with the trained values of the embedding function parameters to generate a respective numerical representation of each word in the vocabulary in the high-dimensional space; and associating each word in the vocabulary with the respective numeric representation of the word in the high-dimensional space.”
Metode, sistem, dan peralatan, termasuk program komputer yang dikodekan pada media penyimpanan komputer, untuk menghitung numerik kata-kata komputasi.

Salah satu metode termasuk memperoleh satu set data pelatihan, di mana set data pelatihan terdiri dari urutan kata; melatih penggolong dan fungsi penyematan pada set data pelatihan, di mana pelatihan fungsi penyematan terdiri dari nilai terlatih yang diperoleh dari parameter fungsi penyematan; memproses setiap kata dalam kosakata menggunakan fungsi embedding sesuai dengan nilai-nilai terlatih dari parameter fungsi embedding untuk menghasilkan representasi numerik masing-masing kata dalam kosakata dalam ruang dimensi tinggi; dan mengaitkan setiap kata dalam kosakata dengan representasi numerik kata masing-masing dalam ruang berdimensi-tinggi ( translate )

Banyak artikel SEO yang memberikan pandangan terhadap paten ini, menariknya paten ini sama sekali tidak membahas tentang LSI, bahkan situs seperti Search Engine Journal menerbitkan tulisan bahwa LSI tidak akan membantu SEO Anda.
Sementara di artikel SEO lokal kita banyak webmaster mengatakan anda harus menggunakan keyword dari LSI yang merupakan bagian dari suggest keyword , padahal berbeda sama sekali
Suggest keyword menampilkan daftar kata yang paling sering dicari oleh orang di internet sementara semantic hanya olah kata yang ditampilkan secara numerik fungsinya membantu pengguna google menelusuri kata kunci yang dalam susunan keyword lain ( jadi LSI bukanlah keyword yang sering dicari orang )
Membicarakan LSI adalah salah kaprah jika dikaitkan dengan faktor ranking, dibilang salah sekali juga tidak, karena maksud dari para pengguna sebenarnya adalah Semantic Text atau korelasi kata untuk memperkuat konteks, menggunakan sinonim adalah salah satu triknya.
Ya anggap saja banyak orang berkata ODOL untuk menggosok gigi, padahal odol adalah merk pasta gigi, dan tidak semua pasta gigi adalah ODOL… kira kira begitulah…
Bicara soal semantic, mungkin kata yang populer saat ini adalah Semantic Search

Mengenal semantic search

Semantic Search adalah analisa pola pencarian pada mesin pencari, dimana suatu pencarian, berkaitan dengan pencarian sebelumnya.
Saya mencari pencarian di Google, “Berapa tinggi monas” ?
Dalam konteks semantic search, Google akan ‘berusaha’ mempelajari relevansi pencarian yang berkaitan dengan pencarian sebelumnya. Coba sekarang klik kotak pencariannya
Pada konsep Semantic Search anda harus berpikir lebih jauh daripada Kata Kunci (Keyword), Semantic Search bicara soal pengalaman pengguna menemukan informasi
– Topik, Bukan Keyword: Mulai dari memilih topik (tentunya gunakan kata kunci yang anda targetkan)

– Lihat Relasi (Semantic)-nya: Lakukan riset, topik apakah yang berkaitan (menurut Google) ? Anda bisa melihat dari Google Suggest maupun related search

Pengertian latent semantic index

Ingin mempersingkat proses ini? gunakan tools seperti LSIGraph atau ahrefs

– Topics Buckets. Bangun kumpulan topik yang mendukung topik utama dalam situs.

– Optimasi. Ciptakan pengalaman penggguna yang baik untuk Google Bot dan tentunya Pengunjung Situs

– – – – Google Bot : Gunakan Schema

– – – Pengunjung Situs: Pastikan menulis untuk pengunjung, bukan untuk Google Bot, abaikan penggunaan kata kunci berulang-ulang (keyword stuff)

– – – – Gunakan Gambar (infografis lebih menarik)

– – – – Pisahkan paragraf yang panjang agar tulisan mudah dibaca

– – – – Tambahkan Video, Slide untuk mendukung tulisan anda ( jika memungkinkan)

– – – – Setelah menerbitkan tulisan, tanyakan pada diri anda “apakah ini tulisan terbaik untuk topik ini ?”, jika tidak, ayo diperbaiki.

– Share. Sebarkan artikel pada media sosial

– Monitor. Secara berkala lihat halaman itu dalam Google Analytics, berapa bounce rate-nya ? berapa lama orang membaca artikel anda (Time on Page), Jika hasil pengukurannya kurang baik, lihat apakah masalahnya teknis (layout situs yang kurang baik, loading yang lama, dsb) atau tulisan pada situs anda yang ternyata tidak menarik.

Latent Semantic Indexing juga beda sama TF-IDF !

TF IDF (term frequency–inverse document frequency) ini tehnik yang berbeda saat menganalisa kata, tehnik ini biasanya dilakukan untuk melihat kata-kata yang sering digunakan pada dokumen hasil pencarian Google. Cara TF-IDF ini termasuk tehnik favorit saya karena disini kita sedikit Reverse Engineering melihat kata kata penting dari halaman hasil pencarian yang terbukti sudah disukai google
Caranya:

– Ambil daftar top 10 hasil pencarian (halaman pertama)
– Ambil setiap isi halamannya, jadikan satu halaman
– Hitung frekuensi dan keyword densitiy

Baca juga : Mengolah keyword dalam artikel blog

Related Post