Setiap orang yang mengenal internet pasti juga tahu dengan website yang bernama Google. Dengan Google, kita dapat mencari informasi yang kita inginkan dengan cepat. Layanan seperti Google pun banyak dan mereka biasanya disebut mesin pencari. Tanpa mesin pencari, setiap situs baru tidak dapat diakses dan menemukan konten terbaru menjadi mustahil.
Peran mesin pencari di jagat internet sangat berpengaruh dan jika tidak ada, maka pengguna internet tidak akan banyak seperti sekarang. Lalu, apakah anda mengerti bagaimana cara kerja mesin pencari?
Secara umum, mesin pencari melakukan 3 hal. Yang pertama adalah proses merangkak/crawling. Hal ini bertujuan untuk menemukan konten baru di internet. Kedua adalah proses pengindeksan/indexing, dimana mesin pencari melakukan indeks dan menyimpan konten. Terakhir adalah proses pengambilan/retrieval, dimana mesin pencari mendapatkan konten yang ada di situs tersebut. Mari kita bahas satu persatu mengenai proses tersebut.
Crawling/merangkak
Untuk menemukan informasi baru, mesin pencari memerlukan perangkat untuk mengambil data dari situs. Perangkat ini biasanya disebut sebagai crawler. Crawler biasanya melakukan pindai dan mengoleksi data seperti judul, gambar, kata kunci, maupun tautan lainnya dalam halaman tersebut. Setiap mesin pencari memiliki versi crawler-nya sendiri-sendiri, sehingga mungkin saja berbeda dalam mengambil informasi.
Namun semua itu tidak berguna jika mesin pencari tidak menemukan situs apa yang akan di crawling. Nah, untuk itu ada perangkat tersendiri untuk melakukan hal tersebut dalam bentuk automated bot. Artinya ada bot yang secara otomatis dapat mengunjungi halaman-halaman yang ada (biasanya disebut “spider”).
Jika anda memiliki situs dan ingin mesin pencari menemukan situs anda, biasanya anda diminta untuk mengirimkan sitemap atau peta situs. Peta situs ini berisi semua tautan, baik tautan beranda maupun artikel yang anda buat, sehingga spider dapat mengunjungi halaman tersebut satu per satu.
Proses crawling ini tentu memiliki kecepatannya sendiri-sendiri tergantung mesin pencarinya. Pada waktu awal Google berjalan, spider milik Google dapat membaca beberapa ratus halaman per detik. Saat ini, ia dapat membaca ribuan halaman dalam satu detik.
Setiap pemilik situs juga bisa menandai halamannya sebagai “noindex”, yang artinya halaman tersebut tidak akan di indeks oleh mesin pencari.
Indexing/Pengindeksan
Setelah selesai di crawling, maka tugas selanjutnya mesin pencari adalah melakukan pengindeksan atau indexing. Jika anda membaca buku, ada sebagian buku yang menaruh halaman indeks di paling akhir buku. Tujuannya adalah agar anda dapat menemukan istilah atau topik tertentu yang ada di buku.
Sama dengan hal tersebut, mesin pencari melakukan indeks untuk seluruh website di seluruh dunia dan menyimpannya di server yang sangat besar. Semua informasi tersebut disimpan demi mendapatkan hasil yang relevan ketika anda menggunakan mesin pencari. Ukuran dari seluruh informasi tersebut dapat mencapai ribuan petabyte dimana 1 petabyte sama dengan 1000 terabyte.
Jika anda penasaran bagaimana cara perusahaan mesin pencari seperti Google menyimpan datanya, gambar diatas merupakan datacenter dari Google dimana mereka menyimpan seluruh informasi web-nya.
Retrieval/Pengambilan
Langkah terakhir cara kerja mesin pencari yang harus anda tahu adalah pengambilan hasil pencarian. Setiap kali anda mengetik sesuatu di mesin pencari dan menekan enter, mesin pencari akan menunjukkan 10 situs yang relevan untuk pencarian anda. Lalu, bagaimana mesin pencari seperti Google menentukan mana situs yang ada di daftar pertama?
Setiap perusahaan mesin pencari seperti Google, Bing, Yahoo, maupun Yandex memiliki algoritma-nya sendiri bagaimana mereka menentukan situs yang relevan di hasil pencarian. Ada banyak kriteria yang digunakan, sehingga perusahaan mesin pencari biasanya mematenkan cara mereka menentukan hasil pencarian. Karena metode yang digunakan berbeda, bisa dipastikan hasil pencarian akan berbeda jika anda menggunakan Google lalu berpindah ke Bing.
Dengan miliar situs yang ada di dunia, menentukan apa saja situs yang bisa keluar di halaman pertama mesin pencari menjadi sangat sulit. Perusahaan mesin pencari melindungi algoritma bagaimana mereka menentukan hasil pencarian. Jika tidak dilindungi, maka akan ada pihak-pihak yang dapat menemukan kriterianya tersebut dan menggunakannya agar situsnya dapat menduduki peringkat pertama di hasil pencarian.
Menemukan metode bagaimana mesin pencari menentukan posisi situs bisa diketahui, namun tidak semudah yang dulu.
Salah satu tips agar situs anda memiliki peringkat yang tinggi yaitu dengan menyertakan kata kunci yang sering dipakai oleh pencari. Jika anda mencari “cara kerja mesin pencari”, maka Google akan menghitung seberapa banyak kata kunci tersebut hadir di sebuah situs.
Namun cara tersebut dapat di salah gunakan oleh pemilik situs dengan menambahkan kata kunci tersebut terus menerus dan artikel yang dimiliki menjadi penuh dengan kata kunci yang tidak relevan. Tentu hal tersebut tidak baik bagi pembaca seperti anda.
Tips diatas memang masih berlaku jika anda ingin situs anda menjadi lebih populer, namun mungkin ada ratusan kriteria lainnya yang dimiliki perusahaan mesin pencari agar situs anda menduduki halaman pertama. Secara garis besar, selalu buatlah artikel yang berkualitas.
Bagaimana menurut anda artikel Cara Kerja Mesin Pencari Yang Wajib Anda Ketahui?
Mesin pencari selalu digunakan oleh 2 tipe orang. Pertama adalah pemilik situs yang ingin situsnya berada di halaman pertama dan anda sebagai pencari informasi yang ingin mendapatkan informasi yang diinginkan. Menyeimbangkan algoritma agar memenuhi 2 tipe orang tersebut sangatlah sulit. Dengan mengetahui cara kerja mesin pencari, anda akan lebih menghargai mesin pencari seperti Google yang selalu menemani kita di setiap ketidaktahuan.
Sekarang giliran anda yang berbicara, apakah masih ada hal yang belum anda pahami mengenai cara kerja mesin pencari? Atau anda mengetahui ada cara lain dalam mencari informasi di mesin pencari? Silahkan tulis di kotak komentar yang tersedia.