Нещодавно РБК оголосила про намір пропонувати рішення для пошуку інформації в файлових сховищах великих корпорацій, базах даних з мільйонами записів або масштабних інтернет-порталах, засновані на пошуковій системі розробленої американською компанією Altavista. Віце-президент з інформаційних технологій Холдингу РБК Олексій Кузовкін і технічний директор Холдингу РБК Максим Филамофитскому розповіли "Компьюлента" подробиці.
- "Яндекс" стверджує. що якщо вірити першим враженням, у AltaVista є деякі проблеми з російською мовою.
У версію пошукового механізму альтавист, яку ми пропонуємо, вбудована повноцінна підтримка російської морфології, причому спеціально розроблена і адаптована для задач пошуку. Робота зі створення модуля підтримки російської мови велася нами більше півтора року. Просто в Yandex не до кінця усвідомили завдання, які вирішує наша система. По крайней мере, нам вони не задали ніяких питань.
- Наскільки відомо, підтримку російської мови в Altavista додали безпосередньо в РБК. Чи не могли б Ви розповісти про це докладніше?
- Які інші системи пошуку використовувалися на РБК раніше?
- Чи проводилося порівняльне тестування Altavista і інших пошукових систем?
Звичайно, проводилося. Ми розробили спеціальну методику тестування, яка включала в себе оцінку якості пошуку (релевантності), швидкість пошуку, можливість роботи з різними форматами, якість підтримки російської мови і багато інших показників. AltaVista перемогла за всіма показниками. Справа в тому, що пошукова технологія в веб відрізняється від корпоративної наявністю так званого "хробака", який збирає документи з Інтернет. У нас ця можливість не використовується, так як ми знаємо, як зберігаються наші документи. Корпоративна ж пошукова система повинна підтримувати різні формати даних, AltaVista вміє сприймати більш 250 різних форматів електронних документів.