Статистичні методи в SEO та розрахунок релевантності (рейтингу) в пошукових системах

Матеріал з Вікі-знання або навчання 2.0 в ТНТУ
Перейти до: навігація, пошук
Репозиторія
Презентація доповіді на тему Статистичні методи в SEO
є розміщеною в Репозиторії.
Невідредагована стаття
Цю статтю потрібно відредагувати.
Щоб вона відповідала ВИМОГАМ.



{{{img}}}
Імя Олеся
Прізвище Дутка
По-батькові Орестівна
Факультет ФІС
Група СНм-51
Залікова книжка СН-10-080



SEO (Search Engine Optimization) - сукупність різних методів, які сприяють високому ранжуванню сайтів в пошукових машинах. Існують такі три класи методів пошукової оптимізації, а саме: білі методи, чорні методи і сірі методи.

Зміст

Методи SEO оптимізації

Білі методи
SEO оптимізація

Це ті методи, які дозволяються ПС і не порушують ніяких їхніх правил. Ними не можна «обманути» пошукову машину, щоб отримати завищену позицію в результаті пошуку. До цих методів належать:

  1. Оптимізація HTML-коду, тобто використовувати ключові слова (слова, які найбільше характеризують сайт) в текстах статтей на сторінках сайту, в заголовку сайта (тег <title>), в заголовках статтей (тег <h1>…<hn>), в гіперсилках (тег <a>) і т.д.
  2. Зовнішня ссилочна маса сайту, тобто чим більше зовнішніх ссилок на сайт, тим більша ймовірність отримати більше відвідувань. Крім того слід зауважити, що сторінки на які ведуть багато різних ссилок, рахуються більш важливішими для ПС. Для цього в пошукових системах існують різні показники, найголовніші з них: «Індекс цитованості» або ТИЦ (показник Яндекс), PageRank або PR (показник Google). Решта ПС використовують дещо інші алгоритми вичислення популярності сайтів.
  3. Обмін ссилками або статтями між різними сайтами, один із найбільш ефективних і надійних способів просування сайту, тим більше, що пошукові системи відносяться до цим методів дуже лояльно. Щоб отримати максимальну віддачу, потрібно проводити обмін з тими сайтами, які найближчі по тематиці до Вашого сайту.

Чорні методи
Іншими словами, це методи «обману» пошукових систем і їх відвідувачів, для отримання вищих показників сайту і вищих позицій в результатах пошуку. До таких методів належать:

  1. Маніпуляція з текстом сайту або ключовими словами, робиться для того, щоб заманити чим більше користувачів з пошуку, тим сами отримати додатковий трафік на сайт.
  2. Дорвеї – це спеціальна html-сторінка, яка зроблена під окремий запит користувача з вибраними ключовими словами. Коли клікаєш по цій ссилці, користувач переходить не на вказану сторінку, а на сам розкручуваний сайт. Таким способом можна добитися високих позицій в ПС, але ненадовго, такі сайти, як правило, незабаром влітають в бан пошукових систем.
  3. Клоакінг – це метод, при якому користувач бачить один зміст читаємої сторінки, а ПС бачать інших зміст тої ж сторінки, тим самим забеспечується високі позиції в пошуку.
  4. Спам, тобто коли ссилка не відповідає змісту або тематиці сайту, і ставиться тільки для того, щоб пошукова система її проіндексувала. В результаті збільшується ссилочна маса сайта і підвищуються показники.

Сірі методи
Відповідно це методи , які не можна віднести ні до білих, ні до чорних методів. Прикладом такого методу являється массовий обмін ссилок. Якщо можна було б довести, що цей метод використовується для підвищення показників сайта, то це було би порушення правил пошукових систем. Але цього зробити не можливо, тому їх не можна віднести до чорних методів, відповідно із зрозумілих причинам не можна віднести і до білих.

Основні методи статистичного аналізу рейтингу

     1. Google Page Rank
Google Page Rank (іноді просто PR) – алгоритм розрахунку авторитетності сторінки, що використовується пошуковою системою Google. PR – числова величина, що характеризує «важливість» сторінки в Google. Чим більше посилань на сторінку, тим вона стає «важливішою». Крім того, «вагу» сторінки А визначає важливість посилання, яке передається зі сторінки В. PR є одним із допоміжних факторів при рангуванні сайтів за результатами пошуку.
     2. ТІЦ
ТІЦ (тематичний індекс цитування) – в пошуковій системі визначає «авторитетність» Інтернет-ресурсів з врахуванням якісної характеристики посилань на них з інших сайтів. Якісну характеристику називають «вагою» посилання. Обчислюють її за спеціально виведеним алгоритмом. Велику роль відіграє тематична близькість ресурсу і сайтів, що посилаються на нього. Основним завданням тематичного індексу цитування є забезпечити релевантність розміщених ресурсів в рубриках пошуковика. ТІЦ не є строго кількісним показником. Він надає лише приблизні значення, які допомагають визначити «важливість» ресурсів кожної тематичної ділянки. ТІЦ обчислюється для Інтернет-ресурсів. При визначенні ТІЦ беруться до уваги посилання тільки тих ресурсів, які пошукова система проіндексувала і за якими вона шукає запит. Його можна виміряти для всіх ресурсів, на які будь-хто посилався хоча б раз. При підрахунку ТІЦ сайту не враховуються посилання з веб-бордів, форумів, мережевих конференцій, немодерованих каталогів та інших ресурсів, в які будь-хто може додавати посилання без контролю з боку власника ресурсу. Також не враховуються посилання з сайтів, розміщених на безкоштовних хостінгах. Такі посилання мають нульове значення. ТІЦ перераховують в середньому двічі на місяць. За цей час одні сайти з’являються, інші зникають. Відповідно, «вага» посилань змінюється і змінюється величина ТІЦ.

Спосіб обрахунку PR

Сама назва визначає алгоритм розрахунку цитованості, розроблений і використовується by Sergey Brin & Larry Page, розробниками пошукової системи Google. Порядок ранжування в Google працює наступним чином:

  1. Знайти всі сторінки, відповідні до ключових слів пошуку.
  2. Відранжувати відповідно « факторів сторінки », таким, як ключові слова.
  3. Врахувати текст посилань на сторінки.
  4. Відкоригувати результати даними PageRank.

Теорія Google говорить, що якщо Сторінка A містить посилання на сторінку B, то Сторінка А вважає, що Сторінка B - важлива сторінка. Текст посилання не використовується в PageRank. PageRank також впливає на важливість посилань на сторінку. Якщо на сторінку вказують багато важливих посилань, то її посилання на інші сторінки також стають більш важливими. Формула, яка визначає вагу PageRank для сторінки:

LaTeX:  PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn)),

     де PR(A) — це вага PageRank сторінки A (та вага,яку нам необхідно обрахувати),
     D — коефіцієнт затухання, який переважно рівний 0,85,
     PR(T1) — вага PageRank сторінки, що вказує на сторінку A,
     C(T1) — число посилань з цієї сторінки,
     PR(Tn)/C(Tn) – означає, що ми робимо це для кожної сторінки яка, вказує на сторінку A.
Google вираховує загальну кількість посилань вхідних, так і вихідних. Простішими словами можна це пояснити так:

PageRank сторінки = 0.15 + 0.85 * ("частку" PageRank кожної сторінки)

     0.85 це коефіцієнт D
     0.15 вираховується по формулі "T1 - TN"
     "Частка" - це сторінка PageRank, поділена на кількість вихідних посилань на сторінці.
Щоб обчислити вагу PageRank сторінки A нам знадобиться знати ваги PageRank всіх сторінок, що вказують на сторінку A. Їх ваги PageRank будуть частково залежати від сторінки A, що вказує на них, або якихось інших сторінок, що містять посилання на них. Що вона нам говорить, так це одну дуже важливу річ про вагу PageRank будь-якої сторінки.
Вага PageRank, рухаючись на сторінку A зі сторінки B, що вказує на неї, зменшується з кожним посиланням куди-небудь. Це означає, що вага сторінки, по суті, це міра її голосу; сторінка може розділити цей голос між одним, двома або багатьма посиланнями, але загальна голосуюча сила буде завжди тією ж самою.

Перелік літературних джерел

  1. Делаем SMOчный сайт
  2. Растолкованный PageRank
  3. PageRank, ТИЦ и ВИЦ
  4. Що впливає на наш вибір?


SeminarSpeech.png
Студент: Користувач:Дутка Олеся Орестівна (Olesya)
Виступ відбувся: 24 лютого 2011
Тема: Редагування Статистичні методи в SEO та розрахунок релевантності (рейтингу) в пошукових системах
Особисті інструменти
Google AdSense
реклама