bannerbannerbanner
Про GOOGLE

Анна Кроули Реддинг
Про GOOGLE

Полная версия

Глава 3. Давно забытый кошмар: поиск до изобретения Google

Сегодня, если ты наберешь «В чем значимость Уильяма Шекспира?» В Google, ты получишь около 16 700 000 результатов всего за 0,63 секунды. И все эти результаты упорядочены по значимости. Не так уж и сложно, не правда ли?

Не правда!

Приготовься. В этой поездке на машине времени будет трясти.

До Google люди жили в мире, где результаты поиска были бессмысленными. Вот ты входишь в поисковую систему. Вводишь какое-нибудь простое ключевое слово, например, «Шекспир», так как поисковая система не может обработать разговорный текст.

Возможно, ты хотел узнать, «где родился Шекспир?». Но все, что ты смог напечатать, – фамилию Уильяма.

Разговорный текст – это фраза или предложение, которое звучит так же, как бы ты его произнес. Это неформальное и естественное выражение твоих мыслей или вопросов.

Ты нажимаешь «ввод» и ждешь, пока страницы за страницами результатов загружаются без какого-либо порядка. Фактически то, что ты ищешь, может находится в самом последнем результате поиска – или где-то в середине. Мало того, спустя целый час поиска ты скорее всего с гневом осознаешь, что нужно было ввести другое ключевое слово (и повторить все заново). Ты пытаешься закричать, но сил нет даже на шепот.

В чем проблема? Поиск в Интернете основывался на ключевых словах. Поэтому, если ты искал информацию о лошадях, поиск выдавал тебе каждый сайт, на котором упоминалось слово «лошадь». И тебе приходилось сидеть и загружать каждый результат в надежде наткнуться на нужную информацию.

Это было похоже на поход в библиотеку с просьбой рассказать о лошадях. Библиотекарь берет каждую книгу, журнал и брошюру, в которых есть по крайней мере одно слово «лошадь». Затем он сбрасывает их в беспорядочно перемешанные кучи, в которых тебе предстоит рыться, пока ты наконец не найдешь то, что искал. Таким был поиск до изобретения Google. Не многим хватает мужества вспоминать о тех временах. Нам был необходим способ как-то организовывать эту информацию.

PageRank[5]

Математический мозг Сергея Брина был идеальным котелком для варки идей алгоритма, который бы анализировал ссылки и ранжировал веб-страницы. Это было похоже на фирменный рецепт блюда. Ларри и Сергей назвали этот особый соус PageRank.

Слово PageRank звучит знакомо? Ты угадал! Ларри и Сергей назвали его в честь Ларри, используя его фамилию, Пейдж.

Представь, что ты опубликовал веб-страницу, на которой ты восторгаешься фильмом «Звездные войны: Пробуждение силы» (что, кстати говоря, по праву). Как алгоритм сможет отличить твой сайт от, например, StarWars.com? Какой сайт уместнее? Какой авторитетнее? Какой лучше освещает тему? Ответ кроется в обратных ссылках. Со столь же огромной, как твоя любовь к кинокартине, вероятностью на твой фан-сайт все-таки ссылается не так много людей, как на StarWars.com. В конце концов, StarWars.com может похвастаться сенсациями, играми, видео, закулисными кадрами, анонсами и т. д. Между тем на твоем фан-сайте может быть размещен лишь один пост о том, какое впечатление на тебя произвел этот фильм. PageRank может определить, какой сайт важнее, исходя из количества входящих ссылок. А теперь настоящий вынос мозга. Важно не то, сколько ссылок ведут на твой сайт, а то, насколько важны сайты со ссылками на твой… что определяется количеством входящих ссылок на эти сайты. Затем, когда определенной странице присвоен рейтинг PageRank, Сергей также нашел способ проанализировать такие факторы, как ключевые слова, капитализация, размер шрифта, расстояние между словами на странице и многое другое. Эти ориентиры называются «сигналами». Анализ всех этих сигналов помог Сергею разработать алгоритм, который вырисовал довольно четкую картину релевантности веб-страницы.

Как сказал Ларри интервьюеру: «Мы преобразуем всю сеть в большое уравнение с несколькими сотнями миллионов переменных, которыми выступает PageRank всех веб-страниц; и миллиардами свободных членов, в качестве которых выступают ссылки». Другими словами, сеть была просто гигантской, сложной математической задачей. Той, которую решили Ларри и Сергей.

Когда изобретатели создают что-то новое, они подают патент на свое изобретение. Эта документация защищает изобретение, чтобы другие не могли его скопировать. Поскольку PageRank был создан студентами Стэнфорда на кампусе, патентом на PageRank владеет Стэнфордский университет. Стэнфорд лицензировал этот патент исключительно для Google в обмен на акции в компании. Когда университет продал эти 1,8 миллиона акций Google в 2005 году, они заработали 336 миллионов долларов. Неплохо! (Думаю, это компенсирует недостающие компьютеры.) С патентом можно ознакомиться здесь: https://www.google.com/patents/US6285999.

В 1996 году, когда Ларри и Сергей запустили BackRub для сканирования в Интернете и создания индекса ссылок, они затем использовали PageRank для организации и ранжирования всех этих веб-данных. Анализируя результаты, они поняли, что их проект был очень похож – ну очень похож – на поисковик, только с точными результатами. Эврика! Они сравнили результаты запроса с результатами самых популярных поисковых систем тех лет. Бесспорно, результаты PageRank оставляли всех остальных далеко позади.

Как и у любого пользователя сети, первый поиск Ларри на BackRub был… его собственное имя.

Ларри и Сергей поняли, что они только что случайно произвели революцию в веб-поиске.

Скриншот первоначальной страницы BackRub из Internet Archive WayBack Machine


Взлет

Шумиха вокруг BackRub разлетелась по кампусу как пожар. Студенты, в частности, были очень взволнованы: не каждый день возвращаешь назад часы своей жизни. Дни просеивания бессмысленных результатов поиска закончились. Это поражало воображение. Челюсти отваливались.

Впервые ты мог искать и быстро находить в Интернете нужную информацию – даже ту самую, что ты искал!

Уже вскоре BackRub ежедневно использовали десять тысяч человек.

Спрос на BackRub резко подскочил. Однако не только он один бурно развивался.

Сама сеть росла с безумной скоростью, втрое увеличившись в размере с 1996 по 1997 год.

Это означало, что Ларри и Сергею было нужно еще больше компьютеров и дискового хранилища для сканирования постоянно расширяющейся сети и хранения постоянно растущего количества ссылок.

Чтобы поспевать за спросом, они добавляли компьютеры, различные части и стойки – их раздутый самодельный сервер быстро заполонил весь их угол кабинета. На очереди была комната Ларри. Они и ее заполнили серверами. Сергей также пожертвовал своей комнатой. Теперь это был бизнес-офис BackRub.

Но по мере роста сети серверов Ларри и Сергея их электроснабжение не возрастало. Им нужен доступ к рубильнику, который находился в запертом подвале. Но отсутствие ключа (или разрешения) ставило их в безвыходное положение. Тогда Сергей обратился за помощью к одной из своих любимых книг: «Руководство Массачусетского технологического института по отпиранию замков». Несложно угадать, что произошло потом. Они проникли в подвал и поддали мощности своей компьютерной системе.

Проникновение в подвал также решило еще одну проблему. Вопрос с пропускной способностью. Одним лишь щелчком тумблера BackRub мог получить доступ к полной пропускной способности Стэнфорда в 45 Мбит/с вместо простых 10 Мбит/с, выделенных их зданию. Переключившись, они увеличили свою пропускную способность более чем в четыре раза.

Но сколько бы сил они ни вкладывали в проект, им всегда требовалось больше. Их инновационное домашнее задание регулярно оставляло Стэнфорд без подключения к Интернету. Они использовали более половины пропускной способности института. И BackRub не просто потреблял тонны электричества, серверного пространства и интернет-соединения, он также занимал каждый свободный ото сна час Ларри и Сергея.

Позвольте дать небольшой совет…

Когда Ларри и Сергей поступили в Стэнфорд, каждому из них был назначен научный руководитель, или профессор, который должен был помогать им на пути к докторской степени. Эти взаимоотношения очень важны: он отсеивает твои идеи, помогает решать проблемы и определиться с направлениями исследования, утверждает твою тему диссертации и любые другие вещи (не важно, хорошие, плохие или трудные), которые ты предлагаешь.

Руководителем Ларри назначили Терри Винограда, пионера человеко-машинного взаимодействия. Для Ларри Виноград не был незнакомцем. Наоборот, несколько лет назад, когда Ларри еще был маленьким мальчиком, его отец провел годичный творческий отпуск в Стэнфорде – с Ларри в прицепе. Некоторые сотрудники до сих пор помнят того любопытного семилетку. А Ларри с тех пор запомнил Терри Винограда.

Винограду нравилось, что у Ларри были большие мечты и вера в то, что он сможет воплотить их в реальность. Когда Ларри высказал свой интерес к развивающейся Всемирной сети, Виноград призвал его посвятить свою диссертацию именно этой теме.

В электронном письме 1996 года, которое Ларри отправил своему руководителю, он просил помочь ему получить еще больше дискового пространства. Скачивание сети было дорогим занятием, потому что требовало уйму места на диске. Ларри написал Винограду, что розничная цена на диск составляла тысячу долларов за 4 Гб. Он думал, что ему понадобится 8 Гб. На самом деле нужно было гораздо больше – первый сервер Google занимал 40 Гб!

 

Виноград также разруливал жалобы на ранних этапах. Владельцы сайтов могли заявить, что BackRub запрашивал их веб-страницы, и многие из них не понимали зачем, так что это им не нравилось.

Научного руководителя Сергея, Гектора Гарсия-Молина, возглавлявшего кафедру информатики, сразу поразил его талант.

Сергей также посвятил много времени, советуясь со стэнфордским профессором Радживом Мотвани. Хотя Мотвани не был его официальным научным руководителем, Сергей регулярно приходил к нему с техническими вопросами.

«Когда я заинтересовался сбором данных, Раджив помог скоординировать регулярные встречи для обсуждения этой темы, – писал Сергей спустя годы в своем блоге. – Хотя я был всего лишь одним из сотен аспирантов на кафедре, он всегда находил время и силы, чтобы мне помочь. Позже, когда мы с Ларри начали работать вместе над исследованиями, которые привели нас к созданию Google, Раджив поддерживал нас и направлял на пути, полном технических и организационных испытаний».

После того как Сергей выпустился из Стэнфорда, он и Мотвани поддерживали связь друг с другом. И когда Мотвани неожиданно скончался в 2009 году, в память о нем Google выделил 2,5 миллиона долларов профессуре Стэнфорда.

Научные руководители сыграли ключевую роль в придании формы образованию, исследованиям и инновациям Ларри и Сергея. Теперь им понадобится их помощь в принятии очень сложных решений.

Глава 4. #Правописание

В 1997 году мир был навсегда спасен от страшной судьбы: бэкраббинга всего на свете!


Эй, можешь забэкрабить сеансы в кино в пятницу вечером?

Эй, побэкрабь Барака Обаму.

Теперь, студенты, включите свои компьютеры и забэкрабьте первый День благодарения.


Ну и ну. Давай поблагодарим Ларри и Сергея за то, что они все-таки смирились с суровой действительностью: BackRub – ужасное название. Ларри понял, что у BackRub просто не было фишки или изюминки, как у других веб-компаний, таких как Yahoo! или Excite. Оно не цепляло. Было не свежо. Не было на острие. А также звучало жутковато в виде глагола.

Ларри и Сергей обратились за помощью к своим коллегам-аспирантам и приятелям по офису.

Сеансы мозгового штурма принесли много новых идей. Но когда их приятель Шон Андерсон упомянул термин «гуголплекс»[6], все сразу повернули головы.

Гугол (Googol) – это число 1 с сотней нулей, или 10 в 100-й степени. Это число было так названо девятилетним мальчиком Милтоном Сироттой. Дядя Милтона был выдающимся математиком и как-то спросил Милтона, как им стоит назвать столь большое число. Милтон посчитал, что слово «гугол» во всей своей нелепости подойдет идеально.

Гугол – это настолько огромное число, что Ларри и Сергей решили, что оно описывает огромные возможности PageRank лучше любого другого слова, о котором только можно подумать. В конце концов, чем больше становился веб, тем обширнее были результаты поиска. Каждая новая ссылка, появляясь в сети, несла с собой новые данные и ссылки, которые необходимо было собрать. С каждой новой страницей складывалась более четкая картина релевантности любой другой страницы.

Подобно тому, как добываются новые материалы, например, алмазы, можно раскопать большую базу данных с единственной целью – найти новую информацию. Или даже лучше: найти информацию, которую еще никто не находил. Вот он – алмаз среди добытых данных. И в этом случае данные – это ссылки, а алмаз – это информация о важности или достоверности какого-либо сайта, предоставляемая обратными ссылками.

Ларри и Сергей подумали, что у слова Googol были свой шарм и некая фишка, которой так не хватало BackRub. К тому же, подумали они, его было легко напечатать и еще легче запомнить. Итак, 15 сентября 1997 года Ларри и Сергей быстро зарегистрировали доменное имя. Проблема решена!

За исключением одной незначительной детали… Ну ладно, большой детали.

Они написали это слово с ошибкой! G-O-O-G-L-E.

Их приятельница Тамара Мунзнер указала на ошибку лишь на следующий день. Упс!

Но давайте не будем осуждать их слишком уж строго! Как оказалось, мы бы тоже ошиблись. В 2000 году Бритни Спирс возглавила поп-чарты с хитом «Oops!.. I Did It Again». Люди начали искать «Бритни Спирс» в Google. Что же в результате? Десятки за десятками орфографических ошибок в ее имени. Снова упс! Этот момент – длинный список орфографических ошибок – привлек внимание Google.

«Мы заметили, что многие люди заинтересовались Бритни Спирс, но не все из них могут правильно написать ее имя», – говорит Крейг Сильверштейн, первый сотрудник Google. Осознание этого подтолкнуло Google к развитию. Теперь поисковик будет не только предоставлять результаты поиска, но и начнет предлагать исправление орфографии.

Уставившись на слово Google, написанное на белой доске, Ларри и Сергей решили, что такое написание им нравится даже больше.

Теперь у их проекта было классное имя и множество пользователей. К тому же, вспоминая то самое грандиозное домашнее задание, технически они расширили знание человечества об их предмете исследования.

Но, с точки зрения домашней работы, они убивали проект. Оставался не решенным большой вопрос. Превратился ли Google из домашней работы в бизнес-проект? Должен ли Google стать компанией? Может ли он стать прибыльным предприятием? Такие размышления не были чужды аспирантам Стэнфорда. В кампусе рождались бизнес за бизнесом.

Быстрый рост и дикая популярность Google требовали ответа на эти вопросы – и быстро.

Ларри и Сергей не знали, как следует поступить. Парочка была обеспокоена тем, что, если Google действительно был бизнесом, им пришлось бы бросить обучение, чтобы вести дела.

И отказаться от университета, чтобы опробовать эту идею… вовсе не стало их решением. Отнюдь нет.

5PageRank – название алгоритма по упорядочиванию поисковых результатов. Названо в честь Ларри Пейджа. Дословно переводится как «ранг страниц» или «ранг Пейджа».
6Гуголплекс – число, равное 10 в степени 10 в степени 100. Другими словами, это 10 в степени гугол.
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17 
Рейтинг@Mail.ru