TEKNIK PENELUSURAN SEARCH ENGINE
A. Pengertian Aplikasi Search
Engine
Search engine (mesin
pencari/pelacak/penelusur) adalah salah satu program komputer yang dirancang
khusus untuk membantu seseorang menemukan file-file yang disimpan dalam
komputer, misalnya dalam sebuah web server umum di web (www) atau komputer
sendiri. Mesin pencari memungkinkan kita untuk meminta content media dengan
kriteria yang spesifik (biasanya berisikan frase atau kata yang kita inginkan)
dan memperoleh daftar file yang memenuhi kriteria tersebut. Mesin pencari
biasanya menggunakan indeks (yang sudah dibuat sebelumnya dan dimutakhirkan
secara teratur) untuk mencari file setelah pengguna memasukan kriteria
pencarian.
Mesin pencari yang
akan dibahas adalah mesin pencari khusus yang digunakan untuk mencari informasi
dan berbagai file di Internet, sehingga mesin pencari sangat berguna bagi para
penggunanya untuk mencari berbagai bahan referensi atau lainnya.
Untuk memudahkan pencarian di database yang begitu besar, mesin pencari menggunakan indeks untuk memilah-milah informasi yang ada di database. Sedangkan untuk memudahkan dan mempercepat pencarian, mesin pencari mempunyai metode pencarian tertentu yang sering di sebut algoritma pencarian, kecepatan dan ketepatan pencarian sebuah mesin pencarian tergantung kepada cara pengindeksan dan algoritma pencarian yang digunakan. Secara prinsip, tujuan dari sebuah program searching engine adalah menemukan dokumen atau arsip elektronis di internet yang sesuai dengan kebutuhan atau permintaan pengguna dalam waktu yang sesingkat-singkatnya. Kedua hal inilah, yaitu kualitas hasil temuan dan waktu pencarian, yang kemudian menjadi pengukur baik tidaknya kinerja sebuah searching engine.
Untuk memudahkan pencarian di database yang begitu besar, mesin pencari menggunakan indeks untuk memilah-milah informasi yang ada di database. Sedangkan untuk memudahkan dan mempercepat pencarian, mesin pencari mempunyai metode pencarian tertentu yang sering di sebut algoritma pencarian, kecepatan dan ketepatan pencarian sebuah mesin pencarian tergantung kepada cara pengindeksan dan algoritma pencarian yang digunakan. Secara prinsip, tujuan dari sebuah program searching engine adalah menemukan dokumen atau arsip elektronis di internet yang sesuai dengan kebutuhan atau permintaan pengguna dalam waktu yang sesingkat-singkatnya. Kedua hal inilah, yaitu kualitas hasil temuan dan waktu pencarian, yang kemudian menjadi pengukur baik tidaknya kinerja sebuah searching engine.
B. Komponen Search Engine
Search engine terdiri atas lima komponen,
yaitu:
1. Query Interface
Query interface adalah komponen penting pertama yang merupakan bentuk tampilan atau format situs yang menyediakan fasilitas searching engine. Bentuk yang paling sederhana adalah tersedianya sebuah kotak kosong di situs dimana user dapat menuliskan data atau informasi yang ingin dicari (lihat situs Yahoo.com atau Altavista.com). Yang harus diketahui oleh user adalah bahwa tidak semua situs memiliki kemampuan yang sama dalam membantu user untuk mengekspresikan jenis data atau informasi yang ingin dicari. Dalam bahasa komputer cara mengekspresikan ini disebut sebagai query. Contohnya adalah seseorang yang ingin mencari data atau informasi mengenai hal-hal yang berkaitan dengan kesehatan ibu dan anak, dapat menggunakan query semacam: “kesehatan” and “ibu” and “anak”.
Query interface adalah komponen penting pertama yang merupakan bentuk tampilan atau format situs yang menyediakan fasilitas searching engine. Bentuk yang paling sederhana adalah tersedianya sebuah kotak kosong di situs dimana user dapat menuliskan data atau informasi yang ingin dicari (lihat situs Yahoo.com atau Altavista.com). Yang harus diketahui oleh user adalah bahwa tidak semua situs memiliki kemampuan yang sama dalam membantu user untuk mengekspresikan jenis data atau informasi yang ingin dicari. Dalam bahasa komputer cara mengekspresikan ini disebut sebagai query. Contohnya adalah seseorang yang ingin mencari data atau informasi mengenai hal-hal yang berkaitan dengan kesehatan ibu dan anak, dapat menggunakan query semacam: “kesehatan” and “ibu” and “anak”.
Walaupun secara
internasional telah diusulkan dan ditentukan standar baku dalam menuliskan
sebuah query, namun terlihat bahwa masing-masing situs menawarkan beragam cara
yang berbeda. Yang utama bagi user adalah bahwa Query Interface yang ditawarkan
mudah dipergunakan dan efektif.
2. Query Engine
Komponen kedua adalah Query Engine, merupakan sebuah program yang bertugas untuk menterjemahkan keinginan user ke dalam bahasa yang dimengerti oleh mesin komputer. Secara teknis, perusahaan-perusahaan penyedia searching engine berlomba-lomba membuat query engine yang baik sehingga selain tepat dalam mengekspresikan keinginan user, dapat pula melakukan tugas pencarian secara cepat. Query Engine ini pulalah yang segera melakukan pencarian arsip dan dokumen yang tepat di dalam sistem basis data (database) yang bersangkutan.
Komponen kedua adalah Query Engine, merupakan sebuah program yang bertugas untuk menterjemahkan keinginan user ke dalam bahasa yang dimengerti oleh mesin komputer. Secara teknis, perusahaan-perusahaan penyedia searching engine berlomba-lomba membuat query engine yang baik sehingga selain tepat dalam mengekspresikan keinginan user, dapat pula melakukan tugas pencarian secara cepat. Query Engine ini pulalah yang segera melakukan pencarian arsip dan dokumen yang tepat di dalam sistem basis data (database) yang bersangkutan.
3. Database
Database pada
dasarnya merupakan kumpulan atau daftar dari dokumen maupun arsip dari seluruh
situs yang ada di internet. Semakin besar skala internet, akan semakin besar
pula kapasitas penyimpan yang dibutuhkan.
4. Spider
Spider merupakan komponen terpenting dalam sebuah searching engine. Secara berkala dan kontinyu, spider akan mendata setiap situs yang ada di internet, baik yang baru maupun yang lama. Terhadap masing-masing situs, selain alamatnya, akan diambil kata-kata kunci dari arsip maupun dokumen yang ditemukan. Katakanlah dari situs Bidanku.com akan diambil setiap kata pada kalimat judul artikel, disinilah sebenarnya persaingan antara situs terjadi, yaitu strategi dan teknik apa yang dipergunakan dalam melakukan sampling terhadap kata-kata yang akan menjadi kunci dalam pencarian arsip dan dokumen. Harap diingat bahwa tidak semua situs melakukan proses updating dan sampling ini secara kontinyu (24 jam sehari), yang dapat menyebabkan telah hilangnya beberapa arsip dan dokumen dari internet saat user mencarinya.
Spider merupakan komponen terpenting dalam sebuah searching engine. Secara berkala dan kontinyu, spider akan mendata setiap situs yang ada di internet, baik yang baru maupun yang lama. Terhadap masing-masing situs, selain alamatnya, akan diambil kata-kata kunci dari arsip maupun dokumen yang ditemukan. Katakanlah dari situs Bidanku.com akan diambil setiap kata pada kalimat judul artikel, disinilah sebenarnya persaingan antara situs terjadi, yaitu strategi dan teknik apa yang dipergunakan dalam melakukan sampling terhadap kata-kata yang akan menjadi kunci dalam pencarian arsip dan dokumen. Harap diingat bahwa tidak semua situs melakukan proses updating dan sampling ini secara kontinyu (24 jam sehari), yang dapat menyebabkan telah hilangnya beberapa arsip dan dokumen dari internet saat user mencarinya.
5. Indexer
Indexer merupakan
sebuah program untuk mempercepat proses pencarian. Filosofi yang dipergunakan
mirip dengan prinsip penggunaan indeks pada kamus atau buku-buku. Perang antar
situs pun terjadi di sini, karena teknik melakukan indeks akan sangat
berpengaruh terhadap kecepatan pencarian data atau informasi. Biasanya yang
terjadi di sini adalah adu algoritma (alur logika sebuah program) antar para
programmer yang direkrut oleh masing-masing perusahaan.
Berikut disajikan gambar yang memperlihatkan 5 (lima) komponen
utama dari arsitektur sebuah program searching engine (Indrajit,
2000).
Gambar: Komponen Utama Program Search Engine
Sedangkan struktur
umum sebuah mesin pencari adalah sebagai berikut :
1. Kotak teks pencari, kotak ini digunakan sebagai
tempat memasukan kata kunci yang akan dijadikan acuan dilakukan pencarian.
2. Tombol pencari, tombol ini yang akan menjalankan
perintah pencarian.
C. Jenis Search Engine
Berdasarkan cara mengumpulkan data
halaman-halaman web, mesin pencari dapat di kelompokkan menjadi 4 kategori :
1. Human Organized Search
Engine
Mesin pencari yang
dikelola sepenuhnya oleh tangan manusia. Mesin pencari ini menggunakan metode
dengan memilah-milih informasi yang relevan dan dikelompokan sedemikian rupa
sehingga lebih bermakna dan bermanfaaat bagi penggunannya. Situs ini dalam
prakteknya memperkerjakan para pakar dalam bidang-bidang tertentu, kemudian
para pakar tersebut dapat mengkelompokan situs-situs tertentu sesuai dengan
bidangnnya atau kategori situs itu sendiri.
Contoh: Yahoo!(www.yahoo.com), LooKSmart (www.looksmart.com), About (www.about.com) , Open Directory (Dmoz.org).
Contoh: Yahoo!(www.yahoo.com), LooKSmart (www.looksmart.com), About (www.about.com) , Open Directory (Dmoz.org).
2. Computer Created Search
Engine
Search engine
kategori ini banyak memiliki kelebihan karena banyak menyajikan inforrmasi
walaupun kadang-kadang ada beberapa informasi yang tidak relevan tidak seperti
yang kita inginkan. Search engine ini telah menggunakan software laba-laba atau
spider software yang berfungsi menyusup pada situs-situs tertentu, kemudian
mengumpulkan data serta mengelompokan dengan sedikit bantuan tangan manusia.
Contoh: WebCrawler (www.webcrawler.com), Excite (www.excite.com), Inktomi (www.inktomi.com), Northen Light (www.northenlight.com), Fast Search (www.altheweb.com).
Contoh: WebCrawler (www.webcrawler.com), Excite (www.excite.com), Inktomi (www.inktomi.com), Northen Light (www.northenlight.com), Fast Search (www.altheweb.com).
3. Hybrid Seacrh Engine
Merupakan gabungan
antara tangan manusia dengan computer, sehingga menghasilkan hasil pencarian
yang relative akurat. Peran manusia dalam hal ini adalah sebagai penelaah dalam
proses pengkoleksian database halaman web. Sebenarnya tipe ini lah yang paling
mudah pembuatannya karena dapat didesain sesuai dengan keinginan kita.
Contoh: Google (www.google.com), Lycos (www.lycos.com), AltaVista (www.altavista.com), HotBot (www.hotbot.com), Go To (www.goto.com), Snap (www.snap.com), Direct Hit (www.directhit.com), Go (go.com).
Contoh: Google (www.google.com), Lycos (www.lycos.com), AltaVista (www.altavista.com), HotBot (www.hotbot.com), Go To (www.goto.com), Snap (www.snap.com), Direct Hit (www.directhit.com), Go (go.com).
4. MetaCrawler/Metasearch
Merupakan perantara
dari mesin pencari yang sebenarnya. Mesin ini hanya akan mengirimkan permintaan
pencarian ke berbagai mesin pencari serta menampilkan hasilnya satu di layer
browser sehingga akan menampilkan banyak sekali hasil dari ber bagai mesin
pencari yang ada.
Contoh: SavvySearch (savvysearch.com), Dogpile (www.dogpile.com), The Big Hub (www.infind.com), C4 Total Search (www.snap.com). Mesin pencari yang
cukup populer, yaitu: Google, Yahoo!, Alltheweb, MSN, AskJeeves, AltaVista, dan
Lycos. Mesin pencari orang: Infospace, Spock, Yellowpages.com, Zabasearch.com,
Zoominfo. Mesin pencari visual: Grokker, Kartoo, Avintura. Mesin pencari multimedia:
Blinkx, Find sounds, Pic search, Podscope, Youtube.
D. Cara Kerja Search Engine
Program Search Engine dalam menjalankan fungsinya sebenarnya
bekerja bersamaan dengan Browser. Ketika kita mengetikkan sesuatu lalu
Enter, Search Engine-lah yang bekerja melakukan pencarian di database.
Hasil yang didapat diberikan kembali ke Browser, lalu Browser menampilkannya
untuk kita dalam format yang mudah kita mengerti. Sebenarnya Search Engine
tidak tampak, ia bekerja di balik layar. Search Engine juga sebenarnya bekerja
dengan teman-temannya yaitu crawler atau indexer atau robot atau bot.
Sederhananya,
proses yang berlangsung adalah: saat user membuka Browser, dan memerintahkan
pencarian, maka browser minta tolong Search Engine untuk mencarikan. Jika sudah
didapat, hasilnya dikembalikan ke Browser dan Browser menampilkannya untuk
user. Semuanya berlangsung sangat cepat sehingga kita tidak mengetahui proses
sesungguhnya yang terjadi.
Mesin pencari web
bekerja dengan cara menyimpan informasi tentang banyak halaman web, yang
diambil secara langsung dari www. Halaman ini di ambil dengan web
crawler-browser web yang otomatis mengikuti setiap pranala yang dilihatnya. Isi
setiap halaman lalu dianalisis untuk menentukan cara mengindeksnya (misalnya
kata-kata di ambil dari judul, subjudul, atau field khusus yang di sebut meta
tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk
digunakan dalam pencarian selanjutnya.
Sebagian mesin pencari seperti Google, menyimpan seluruh atau
sebagian halaman sumber (yang disebut cache) maupun informasi
tentang halaman web itu sendiri. Ketika seorang pengguna menggunakan mesin
pencari dan memasukan query, biasanya dengan memasukan kata kunci, mesin
mencari akan mengindeks dan memberikan daftar halaman web yang paling sesuai
dengan kriterianya. Daftar ini biasanya disertai ringkasan singkat menggenai
judul dokumen dan terkadang sebagian teks dari hasil pencarian yang kita cari.
Sangat banyak hasil
data yang akan di munculkan oleh mesin pencari ketika pengguna mengetikan
sebuah kata kunci, urutan yang ada di paling atas atau halaman pertamalah yang
mempunyai isi paling akurat. Keakuratan sebuah mesin pencari dalam menyajikan
data dan informasi yang dicari oleh pengguna dapat menjadi tolak ukur kualitas
sebuah mesin pencari. Semakin tinggi keakuratan data yang disajikan maka
semakin baik mesin pencarian tersebut. Untuk mencari sebuah informasi pada
sebuah laman web, juga bisa dituliskan pada query web yang telah kita buka.
Secara umum, cara kerja mesin pencarian dimulai saat user
menulis alamat website (URL). Saat alamat web terisi, maka spider dari search engine akan menerima dan
menganalisa URL. Secara otomatis spider memutuskan web yang didaftar layak
diterima atau tidak. Jika layak, maka spider langsung menambahkan alamat URL
tersebut ke sistem database. Rangking segera ditetapkan dengan algoritma dan
caranya masing-masing. Jika tidak layak maka users terpaksa bersabar dan
mengulangi pendaftaran diwaktu yang lain.
E. Mesin Pencarian Google
Google merupakan sebuah perusahaan publik Amerika Serikat,
berperan dalam pencarian Internet, Cloud Computing, serta teknologi iklan
online & perangkat lunak (mesin pencari terbesar di dunia). Alamat web (http://www.google.com).
Selain pencarian
web, Google juga menyediakan jasa pencarian gambar, pencarian berita serta
pencarian pada arsip USENET (newsgroup), serta direktori, seperti Yahoo!
Kelemahannya terletak pada tidak tersedianya pencarian file, video, dan audio.
Keunggulan Google terutama adalah pada pencarian teks, terutama dari algoritma
PageRank, database-nya yang besar serta banyaknya jenis file yang diindeksnya.
Kelebihan:
1. Kecepatan dan kemudahan dalam mencari
2. lebih canggih dengan fitur yang dimilikinya
3. Tampilan yang sederhana
4. Google merupakan satu-satunya mesin pencari yang memilki cach.
Dengan adanya cache ini, si pencari dapat menghemat waktu pencarian, karena
hasil pencarian yang akan ditampilkan
5. Dapat mencari segala informasi seperti gambar, berita artikel,
hiburan dll.
Kekurangan:
Dengan kelebihan
yang dimilikinya, ternyata mesin pencari ini jadi bidikan para spamer untuk
menampilkan iklan-iklan yang tidak diperlukan. Mereka memanfaatkan setiap celah
yang ada pada sistem algoritma Google untuk memaksa iklan mereka tampil pada
halaman terdepan. Maka, pencarian pun terasa tergangggu.
F. Fitur Pencarian Google
Secara umum, jenis pencarian pada mesin pencarian/website ada
dua yaitu: Basic Search dan Advanced Search. Basic
Search adalah fitur pencarian yang sudah biasa kita gunakan yaitu
ketika mengakses langsung, missal pada google.com. Sedangkan Advanced
Search menyediakan berbagai pilihan fitur pencarian baik untuk
operator dasar, file format yang ingin kita cari, bahasa, region, dsb.
Sebenarnya masih sangat banyak fitur pencarian yang bisa kita
gunakan, tapi tidak terdapat di menu pilihan Advanced Search.
Dengan kata lain kita harus memasukannya query di form
pencarian di Basic Search langsung. Di bawah ini akan
disajikan permainan query dan operator pencarian.
1. Fitur Pencarian Dasar
a. FRASE: Mencari informasi yang mengandung frase yang dicari dengan
menggunakan tanda “”. Contoh: “kesehatan reproduksi”
b. SINONIM (~): Mencari kata beserta sinonim-sinonimnya. Contoh di bawah
akan membawa hasil pencarian: bayi baru lahir (infant) dan sinonimnya.
Contoh: ~infant
c. ASTERIK (*): Karakter pengganti kata. Dari contoh di bawah, hasil
yang didapat bisa: ikan bakar pedas, ikan goreng pedas, ikan masak pedas, dsb.
Contoh: ikan * pedas
d. TANDA TITIK (.): Karakter pengganti huruf, angka dan
karakter tunggal. Dari contoh di bawah, hasil yang didapat bisa: kopi,
koki, kodi, dsb. Contoh: ko.i
e. CASE INSENSITIVE: Pencarian di Google menganggap
kapital & bukan kapital sebagai sesuatu yang sama. Jadi, kehamilan
aterm, Kehamilan Aterm, KEHAMILAN aterm, akan membawa
hasil pencarian yang sama
f. PENGABAIAN KATA: Google mengabaikan keyword berupa
karakter tunggal & kata-kata berikut: a, about, an, and, are, as, at,
b, by, from, how, i , in, is, it, of, on, or, that, the, this, to, we, what,
when, where, which, with. Apabila kita masih tetap menginginkan pencarian
kata tersebut, bisa dengan menggunakan karakter + di depan kata yang dicari
(contoh: Love Rain Episode +I), atau bisa juga dengan menganggapnya
sebagai frase (contoh: “Love Rain Episode I”)
g. I’M FEELING LUCKY: Akan membawa kita langsung menuju
ke hasil pencarian pertama dari query kita.
2. Fitur Pencarian Lanjut
a. DEFINE: Mencari definisi dari sebuah terminologi. Dari contoh di
bawah, hasil yang didapat adalah berbagai definisi tentang e-learning
dari berbagai sumber. Contoh: define:e-learning
b. CACHE: Menampilkan situs web yang telah diindeks oleh Google meskipun
sudah tidak aktif lagi. Contoh di bawah akan menghasilkan pencarian kata php pada
situs bidanku.com yang ada di indeks
Google. Contoh: cache:bidanku.com php
c. LINK: Menampilkan daftar link yang mengarah ke sebuah situs. Contoh
di bawah akan menampilkan daftar link yang mengarah ke situs bidanku.com.
Contoh: link:bidanku.com
d. RELATED: Menampilkan daftar situs yang serupa, mirip atau
memiliki hubungan dengan suatu situs. Contoh: related:oshigita.wordpress.com
e. INFO: Menampilkan informasi yang Google ketahui tentang sebuah
situs. Contoh: info:oshigita.wordpress.com
f. SITE: Menampilkan pencarian khusus di suatu situs yang
ditunjuk. Contoh: java site:bidanku.com
g. FILETYPE: Menampilkan hasil pencarian berupa suatu jenis
(ekstensi) file tertentu. Jenis file yang bisa dicari adalah: doc, xls,
rtf, swf, ps, lwp, wri, ppt, pdf, mdb, txt, dsb. Contoh di bawah akan
menampilkan hasil pencarian berupafile PDF yang mengandung
keyword preeklamsi berat. Contoh: preeklamsi berat
filetype:pdf
h. ALLINTITLE: Menampilkan seluruh kata yang dicari dalam TITLE
halaman. Contoh di bawah akan menghasilkan halaman yang memiliki title mola
hidatidosa. Allintitle ini tidak dapat digabungkan dengan operator
(sintaks) lain. Gunakan intitle untuk keperluan itu. Contoh: allintitle:mola
hidatidosa
i. INTITLE: Menampilkan satu kata yang dicari dalam TITLE halaman.
Contoh di bawah akan menghasilkan halaman yang memiliki title kehamilan dan
isi halaman yang mengandung kata perdarahan. Contoh: intitle:kehamilan
perdarahan
j. ALLINURL: Menampilkan seluruh kata yang dicari di dalam URL.
Contoh di bawah akan menghasilkan daftar URL yang mengandung kata imunisasi dan bayi.
Allinurl ini tidak dapat digabungkan dengan operator (sintaks) lain. Gunakan
inurl untuk keperluan itu. Contoh: allinurl:imunisasi bayi
k. INURL: Menampilkan satu kata yang dicari di dalam URL. Contoh
di bawah akan menghasilkan daftar URL yang mengandung kata kontrasepsi dan
isi halaman yang mengandung kata hormonal. Contoh: inurl:kontrasepsi
hormonal
G. Boolean Logic
Boolean logic
adalah suatu pencarian pelacakan yang menyatakan tentang hubungan antara
variabel yang dicari dengan variabel terkait. Boolean logic juga merupakan
identifikasi spesifik tentang artikel yang akan dicari. Boolean logic
dikembangkan oleh George Boole (1815-1864), adalah suatu metode pencarian
informasi, yang memfokuskan hasil penelusuran dimana pencarian datanya
menggunakan kata kunci.
Boolean logic
terdiri dari operasi logika AND, OR dan NOT. Pada fitur pencarian Google,
operasi ini merupakan bagian dari fitur pencarian dasar. Penggunaan operasi
logika ini dapat memudahkan user dalam mendapatkan informasi yang diinginkan.
Boolean logic merupakan operasi logika yang digunakan untuk mendapatkan
informasi di PubMed (NCBI).
1. AND: Mencari informasi yang mengandung kedua kata yang dicari.Bisa
menggunakan salah satu dari tiga alternatif berikut. Contoh: kehamilan
gemelli , kehamilan AND gemeli, kehamilan+gemelli
2. OR: Mencari informasi yang mengandung salah satu dari kedua kata.
Bisa menggunakan salah satu dari dua alternatif berikut. Contoh: kembar
OR gemelli, kembar | gemelli
3. NOT: Hasil pencarian mengandung kata yang di depan, tapi tidak yang
dibelakang minus (-). Contoh di bawah akan mencari informasi yang mengandung
kata kontrasepsi tapi bukan suntik. Contoh: kontrasepsi
–suntik.
Berikut video yang menjelaskan search engine :
Berikut video yang menjelaskan search engine :
Sands Casino | $400 No Deposit Bonus | Online Casino
BalasHapusSands Casino is one of the biggest and 1xbet most trusted หาเงินออนไลน์ names septcasino in the casino industry. With an array of slots and live casino games, this gaming brand