Yeni arama motoru : YANDEX


Uzun zamandır teknoloji kokan bir reklam dönüyor televizyonlarda yeni arama motoru Yandex şeklinde. Google devriminden sonra bilgi erişim konusunda bir de yandex devrim yapma peşinde; hem de reklamlar dikkatle izlenirse daha ilerisini vaat ederek. Google’dan ilerisi nedir konusu sanırım biraz teknolojik ve birazcık bizim alanımıza giriyor.

Hiç şüphesiz Google ve Facebook hizmetleri en az İnternet kadar sükse yapan iki hizmet veya teknoloji. Neredeyse herkes her şeyi Google’dan bulabileceğini düşünmeye başladı. Her şeyin google’da olmadığını bilen bizler bile aklımıza takılan herhangi bir soru da ilk önce ona başvuruyoruz. Acıktığımızda tantunicinin telefon numarasını, hasta olunca en yakındaki hastaneyi, bir yere gitmeden önce gideceğimiz yeri hepsini Google’dan buluyoruz. Bir vali beyin, şehirde kütüphane isteyenlere “Google var ya” demesine katılmıyorum ama birçok kişi Google arama motorunu inanın kütüphanelerden çok daha fazla kullanıyor. Facebook ise apayrı ve çok güçlü bir fenomen. Unutulmaya yüz  tutan nice dostluk ve akrabalık yeniden canlanır gibi oldu. Tabi ki sonuçta su yolunu buluyor ve insanlar arkadaş olabilecekleri ile arkadaşlığa devam ediyor ama yine de teknolojinin dostluklara hizmeti anlamında önemli başarıları yadsınamaz.

Gelelim Yandex mevzusuna. Malumunuz olduğu üzere Google ve diğer arama motorları, yani aradığımız anahtar kelimelere karşılık bize dokümanlar getiren sistemler kelime tabanlı çalışıyor. Anahtar kelimelerimizin geçtiği doküman veya web sayfaları bize geri döndürülüyor. Google diğerlerinden farklı olarak PageRank isimli bir algoritma yardımıyla, sorgu sonucu dönen dokümanları bir puana göre sıraladığı için yıllarca iyi bir performans gösterdi ve hala gösteriyor; fakat, dikkatli arama yapan kişiler Google arama motorunun bile bazı hatalarını görmüştür. Aslında alakasız gelen dokümanlar ile aradığımıza uygun az sayıda doküman bulmak gibi. Asıl işimizi görecekler yerine farklı dokümanlarla uğraşıp duruyoruz yıllardır. Kimi istatistiklere göre bulduklarımızın sadece yüzde 1’i işimize yarayan diğerleri ise yaramayan dpkümannlar. Ayrıca; aslında kullanılabilir 100 kaynaktan sadece 1 tanesine erişebiliyoruz. Bu durumda bolca çöp demek. Sanal ortamın kargaları gibi çöp arasından değerli bilgi arıyoruz, hem de yıllardır, hem de Google’a rağmen. Çözüm ise anlamsal arama yani “semantic search”. Anlamsal web konusu ile de yakından ilgili bu durum aynı zamanda kavramsal arama “concept search” konusunu da içeriyor.

Anlamsal arama, bir kelime ile aynı anlama gelecek kelimelerin de aramaya dahil edilmesi anlamına geliyor. Malumunuz dilimizde birçok kelimenin birden çok anlamı olduğu gibi birçok kelimede bazen tek bir anlamı ifade ediyor. Sinonim veritabanları ile bu problem bir miktar çözülmüş durumda fakat daha bütüncül bir çözüm için kavramsal arama konusunun başarılması gerekiyor. Kavramlar arası ilişkiler, alt kavram üst kavram ilişkileri ve kavram hiyerarşisi çözülebildiği takdirde sonuçlar mevcuttan çok daha fazlasını bize sunacak gibi.

Reklamlara bakılırsa yandex bu problemlerin çoğunu çözmüş görünüyor. Acaba gerçekten öyle mi ben ve bu memlekette doğal dil çalışan birçok kişi merak ediyordur eminim. Çünkü sadece ülkemizde değil bütün dünyada da concept search gibi konular henüz araştırma aşamasında görülmekte. Eğer gerçekten reklamlarda verilmeye çalışılan imajın içi dolu ise ekibi tebrik ediyorum yok değilse de daha baştan Google karşısında direnebileceğini sanmıyorum.

Hidayet Takcı
         

Yorumlar

Bu blogdaki popüler yayınlar

GÜRÜN MESLEK YÜKSEKOKULU

Bilgisayar Mühendislerine ve Bilgisayar Mühendisi Olacaklara Tavsiyeler

Bilgisayar Mühendisliği Oryantasyon Dersi