Форум Рідного Міста

Спроба створення аналога Google з відкритими кодами

Agent86 - 17-9-2003 у 05:37

Опублiковано 20 серпня 2003 року

Прототипом чергової розробки з відкритим вихідним кодом стала, як часто буває, програма, алгоритми якої зберігаються за сімома печатками. Проект створення аналога пошукової системи Google був початий майже цілий рік назад. Весь цей час робота велась в таємниці. Тільки тепер інформація про систему за назвою Nutch була представлена широкій публіці.

Розробку альтернативи Google підтримує компанія Overture, недавно придбана Yahoo. Overture вважається одним з основних конкурентів Google на ринку контекстної реклами, розташовуваної в результатах пошуку. У раді директорів некомерційної організації, що здійснює проект, входять книговидавець Тім О'рейлі й один із засновників Lotus Мітч Кейпор.

Мета проекту, заявлена на офіційному сайті Nutch, цілком блага: "Розробка потужного безкоштовного програмного забезпечення для пошуку на базі програмного забезпечення з відкритими кодами". Пошукова система буде мати можливість індексувати мільярди сторінок на місяць і справлятися з тисячою запитів у секунду. Результати, зрозуміло, повинні бути дуже якісними.

Тім О'рейлі підкреслив, що в даний момент мова йде не про конкуренцію з Google, а про розробку альтернативного пошукового движка, принципи роботи якого завжди можна зрозуміти і перевірити. Точний алгоритм Google не відомий нікому за межами Google.

Зараз Nutch цілком написаний на Java. У його основу лягла бібліотека Lucene. Демонстраційна версія дозволяє здійснювати пошук по 100 мільйонам сторінок. В інтернеті вона поки не доступна через відсутність засобів на придбання необхідного "заліза".

В тому, що співтовариство Open Source зможе створити пошукові алгоритми, ні в чому не поступаються технологіям Google, особливих сумнівів немає. Однак, навіть якщо такі будуть розроблені, залишається неясним, як фінансувати покупку комп'ютерів для забезпечення матеріальної бази пошукового ресурсу. По деяких підрахунках, щоб суперничати з Google, буде потрібно не менше 8000 потужних серверів. Так що поки питань більше, ніж відповідей.


джерела : www.compulenta.ru, Clubic