ПОЗНАВАТЕЛЬНОЕ Сила воли ведет к действию, а позитивные действия формируют позитивное отношение Как определить диапазон голоса - ваш вокал
Игровые автоматы с быстрым выводом Как цель узнает о ваших желаниях прежде, чем вы начнете действовать. Как компании прогнозируют привычки и манипулируют ими Целительная привычка Как самому избавиться от обидчивости Противоречивые взгляды на качества, присущие мужчинам Тренинг уверенности в себе Вкуснейший "Салат из свеклы с чесноком" Натюрморт и его изобразительные возможности Применение, как принимать мумие? Мумие для волос, лица, при переломах, при кровотечении и т.д. Как научиться брать на себя ответственность Зачем нужны границы в отношениях с детьми? Световозвращающие элементы на детской одежде Как победить свой возраст? Восемь уникальных способов, которые помогут достичь долголетия Как слышать голос Бога Классификация ожирения по ИМТ (ВОЗ) Глава 3. Завет мужчины с женщиной 
Оси и плоскости тела человека - Тело человека состоит из определенных топографических частей и участков, в которых расположены органы, мышцы, сосуды, нервы и т.д. Отёска стен и прирубка косяков - Когда на доме не достаёт окон и дверей, красивое высокое крыльцо ещё только в воображении, приходится подниматься с улицы в дом по трапу. Дифференциальные уравнения второго порядка (модель рынка с прогнозируемыми ценами) - В простых моделях рынка спрос и предложение обычно полагают зависящими только от текущей цены на товар. | Алгоритмы ранжирования сайтов. Поисковые системы в сети и интернет. Поисковые системы –это компьютерная система, предназначенная для поиска информации. Одно из наиболее известных применений поисковых систем —веб-сервисы для поиска текстовой или графической информации во Всемирной паутине. Существуют также системы, способные искать файлы на FTP-серверах, товары в интернет - магазинах, информацию в группах новостей Usenet. Структура поисковых систем Итак, любая поисковая система, как бы она ни называлась, имеет общие с другими поисковиками черты. У них у всех есть (в той или иной степень развитости) следующие системы: — программы, которые скачивают к себе в базу веб страницы. Их часто называют Spider (паук); — программы, которые с этих обнаруженных страниц переходят по ссылкам на другие Интернет-ресурсы (Crawler или «путешествующий» паук); — программы, которые анализируют скачанные страницы (Indexer или индексатор); — программа, которая выдает по запросу нужные результаты (Search engine results engine — система выдачи результатов). Есть еще много других роботов, но они нам сейчас не интересны и мы их рассматривать не будем. Общий принцип работы поисковых систем Если говорить коротко и упрощенно, то работают все поисковые системы так: Crawler по указанию Spider скачивает новые неизвестные страницы с сайта, они анализируются, определяются ссылки с этих страниц, по которым Spider опять уходит на поиски нового контента, обнаруживает их, дает команду Crawler на скачивание и далее на анализ и так до бесконечности. В найденных страницах анализируется содержание и они встраиваются в общий рейтинг (индекс поисковой системы). Надо знать, что поисковые боты (роботы) запрашивают серверы, на которых расположены сайты, есть ли на «подведомственных» сайтах что-нибудь новое. Если сервер, отвечает утвердительно, то боты начинают искать и скачивать новые страницы. Или измененные страницы, если Вы вносили изменения. Поэтому вносить изменения в уже опубликованные статьи не менее важно, чем писать новые: в глазах робота – это тоже новый контент. Отсюда, кстати, вытекает то, что надежность сервера, на котором Вы размещаете свой сайт, имеет первостепенное значение. Зато можно твердо утверждать, что чем реже Вы проводить публикации нового контента на своем сайте, тем реже к Вам будет приходить Spider. Мы можем и должны учитывать этот момент в своей деятельности для решения тех или вопросов. Ясно, что ссылка с социальной сети (особенно принадлежащей самому поисковику – Google+ или Я.ру) будет роботом поисковой системы обнаружена быстрее всего, но она не сможет передать такой же вес, как ссылка с самого авторитетного ресурса по Вашей теме. Поэтому, если Вам надо, чтобы Ваш сайт (или его страницу) как можно быстрее нашли поисковые системы, то Вам надо получить ссылки с информационных ресурсов, социальных сетей и т.п. А если Вы озабочены «пузомерками» (PR и тИЦ), то Вам нужны совсем другие ссылки. Для того, чтобы это Вам стало яснее и Вы не допускали стратегических (именно так!) ошибок, нам необходимо узнать, каким образом у поисковых систем выдача и вообще ранжирование страниц. Алгоритмы ранжирования сайтов. Для начала давай познакомимся с некоторыми алгоритмами, которые являются основополагающими для любой поисковой системы: — Алгоритм прямого поиска. Что это такое – вы помните, что читали замечательную историю в одной из книг. И вы начинаете по очереди искать. Взяли одну книгу – полистали – не нашли, взяли другую... Принцип понятен, но этот способ чрезвычайно долгий. Это тоже понятно. — Алгоритм обратного поиска. Для этого алгоритма создается из каждой страницы твоего блога – создается текстовый файл. В этом файле перечисляются в алфавитном порядке ВСЕ слова, которые ты использовал. Даже позиция этого слова в тексте указывается (координаты в тексте). Это достаточно быстрый способ, но уже поиск происходит с какой-то погрешностью. Здесь главное понимать, что алгоритм этот ищет не в интернете, не поиском по блогу. А в отдельно взятом текстовом файле, который создан был когда-то давно. Когда робот заходил к тебе. И эти файлы (обратные индексы) хранятся на серверах Яндекса. Так, это были базовые алгоритмы поиска. Т.е. как Яндекс просто находит нужные документы. С этим вроде бы проблем не должно быть. Но ведь документов Яндекс знает не один и даже не 100, а по последним данным из моих источников – Яндекс знает порядка 11 млрд. документов ( 10 727 736 489 страниц ). И среди всего этого количества нужно выбрать документы, подходящие под запрос. И что еще важнее – нужно как-то ранжировать их. Т.е. выстроить по степени важности, а точнее по степени полезности для читателя. |