Обидва ці поняття застосовуються у відомих програмах перевіряючих унікальність тексту (Advego Plagiatus, Etxt, і т.д.). Це програми, які перевіряють тексти на унікальність змісту (контенту). Тобто, говорячи простою мовою, перевіряє скопійований чи текст з сайтів або придуманий.
Розмір шингли - це кількість слів, за якими здійснюється перевірка на наявність збігів на інших сайтах. Тобто наприклад якщо розмір шингли буде 1, то 100% знайдеться хоч один збіг, якщо звичайно замість слова не написана якась Билибирда. Якщо дорівнює двом, то теж великий шанс на збіги, але вже менше.
Наприклад, є пропозиція:
Собака побігла гуляти по розмокшій від дощу грунті.
Якщо розмір шингли дорівнює 1, то програма перевірки унікальності почне шукати збіги зі словом Собака і 100% їх знайде.
Якщо шингл дорівнює 2, то буде шукати збіги з фразою Собака побігла і теж 100% знайде.
Якщо, припустимо, розмір шингли буде 5, то будуть шукатися такі фрази:
Собака побігла гуляти по розмокшій
Тут може знайде, а може і ні, все залежить від того, чи написав хтось десь таку фразу чи ні.
Тобто чим більше розмір шингли, тим менше строгість перевірки, так як менша ймовірність збігу з уже існуючим контентом.
Розмір фрази - це кількість слів, що посилаються програмою в пошуковик для перевірки цієї фрази на унікальність. Програма перевірки уенікальності тексту як би питає у пошукача, не написана дана фраза на якомусь із сайтів і отримує від нього відповідь.
Особисто я особливо не бачу різниці в сенсі розміру шингли і розміру фрази.
Поділитися з друзями: