Аппараттық және бағдарламалық қамтамасыз етуді орнату

Іздеу жүйелерінде іздеу қалай жүзеге асырылады. Іздеу жүйелері қалай жұмыс істейді - үзінділер, кері іздеу алгоритмі, бетті индекстеу және Яндекс мүмкіндіктері

Сәлем құрметті оқырмандар!

Ғаламдық интернет кеңістігіндегі іздеу жүйелері қазіргі уақыттажеткілікті. Олардың әрқайсысында сайттарды индекстеу және рейтингтеу үшін өз алгоритмдері бар, бірақ жалпы алғанда, іздеу жүйелерінің жұмыс істеу принципі айтарлықтай ұқсас.

Оның қалай жұмыс істейтінін білу іздеу жүйесіқарқынды дамып келе жатқан бәсекелестік жағдайында олар коммерциялық ғана емес, сонымен қатар ақпараттық сайттар мен блогтарды алға жылжытуда маңызды артықшылық болып табылады. Бұл білім веб-сайтты оңтайландырудың тиімді стратегиясын құруға және аз күш жұмсай отырып, алға қойылған сұрау топтары үшін ТОП іздеу нәтижелеріне кіруге көмектеседі.

Іздеу жүйесінің принциптері

Оңтайландырушының мақсаты іздеу алгоритмдері үшін алға жылжытылған беттерді «реттеу» және сол арқылы осы беттерге белгілі сұраулар үшін жоғары орындарға жетуге көмектесу болып табылады. Бірақ сайтты немесе блогты оңтайландыру бойынша жұмысты бастамас бұрын, оңтайландырушы қабылдаған әрекеттерге қалай әрекет ететінін түсіну үшін іздеу жүйелерінің жұмыс ерекшеліктерін үстірт түсіну керек.

Әрине, іздеу нәтижелерін қалыптастырудың егжей-тегжейлі мәліметтері іздеу жүйелері ашпайтын ақпарат болып табылады. Дегенмен, дұрыс күш салу үшін іздеу жүйелері жұмыс істейтін негізгі принциптерді түсіну жеткілікті.

Ақпаратты іздеу әдістері

Қазіргі таңда іздеу жүйелері қолданатын екі негізгі әдіс ақпаратты табу тәсілдерімен ерекшеленеді.

  1. Тікелей іздеу алгоритмі, ол іздеу жүйесінің деректер базасында сақталған құжаттардың әрқайсысын негізгі сөз тіркесімен (пайдаланушы сұранысы) сәйкестендіруді қамтиды, бұл барлық қажетті ақпаратты табуға мүмкіндік беретін жеткілікті сенімді әдіс. Бұл әдістің кемшілігі - үлкен деректер жиыны арқылы іздеу кезінде жауап табу үшін қажетті уақыт өте ұзақ.
  2. Кері индекс алгоритмі, қашан негізгі сөз тіркесіол бар құжаттардың тізімі салыстырылады, ондаған және жүздеген миллион беттерді қамтитын мәліметтер базасымен әрекеттесу кезінде ыңғайлы. Бұл тәсілмен іздеу барлық құжаттарда емес, тек бойынша жүргізіледі арнайы файлдар, ол сайт беттеріндегі сөздер тізімдерін қамтиды. Мұндай тізімдегі әрбір сөзге ол орын алатын орындардың координаталары және басқа параметрлері көрсетіледі. Дәл осы әдіс бүгінде Yandex және Google сияқты танымал іздеу жүйелерінің жұмысында қолданылады.

Бұл жерде айта кететін жайт, пайдаланушы браузердің іздеу жолағына кірген кезде іздеу тікелей Интернетте емес, алдын ала жинақталған, сақталған және жаңартылған түрде орындалады. осы сәтіздеу жүйелері (сайт беттері) өңдейтін ақпарат блоктарын қамтитын мәліметтер базасы. Іздеу нәтижелерін жылдам құру кері индекстермен жұмыс істеудің арқасында мүмкін болады.

Беттердің мәтіндік мазмұны (тікелей индекстер) іздеу жүйелерімен де сақталады және сұрауға ең сәйкес келетін мәтін фрагменттерінен үзінділерді автоматты түрде жасауда қолданылады.

Рейтингтің математикалық моделі

Іздеуді жылдамдату және пайдаланушының сұранысына жақсы сәйкес келетін мәселені генерациялау процесін жеңілдету үшін белгілі бір математикалық модель қолданылады. Мұның міндеті математикалық модель- табу қалаған беттеркері индекстердің ағымдағы деректер базасында олардың сұранысқа сәйкестік дәрежесін бағалау және өзектілігінің кему тәртібімен бөлу.

Парақта дұрыс сөз тіркесін табу жеткіліксіз. Іздеу жүйелері анықтаған кезде пайдаланушы сұранысына қатысты құжаттың салмағын есептеу қолданылады. Әрбір сұрау үшін бұл параметр келесі деректер негізінде есептеледі: талданатын бетте пайдалану жиілігі және іздеу жүйесі дерекқорының басқа құжаттарында бір сөздің қаншалықты сирек кездесетінін көрсететін коэффициент. Осы екі мәннің өнімі құжаттың салмағына сәйкес келеді.

Әрине, ұсынылған алгоритм өте жеңілдетілген, өйткені іздеу жүйелерінде есептеулерде қолданылатын бірқатар басқа қосымша коэффициенттер бар, бірақ мағынасы өзгермейді. Көбірек жалғыз сөзПайдаланушының сұранысы кез келген құжатта орын алса, соңғысының салмағы соғұрлым жоғары болады. Сонымен қатар, әрбір сұрау үшін әртүрлі болатын белгілі бір шектеулер асып кетсе, беттің мәтіндік мазмұны спам болып саналады.

Іздеу жүйесінің негізгі функциялары

Барлығы қолданыстағы жүйелеріздеу жүйелері бірнеше маңызды функцияларды орындауға арналған: ақпаратты іздеу, оны индекстеу, сапаны бағалау, дұрыс рейтингтеу және іздеу нәтижелерін қалыптастыру. Кез келген іздеу жүйесінің негізгі міндеті - пайдаланушыға ол іздеген ақпаратты, нақты сұранысқа ең дәл жауап беру.

Көптеген пайдаланушылар Интернеттегі іздеу жүйелерінің қалай жұмыс істейтінін білмейтіндіктен, пайдаланушыларды «дұрыс» іздеуге үйрету мүмкіндіктері өте шектеулі (мысалы, іздеу кеңестері), әзірлеушілер іздеудің өзін жақсартуға мәжбүр. Соңғысы қажетті ақпаратты қаншалықты «дұрыс» тұжырымдалғанына қарамастан табуға мүмкіндік беретін іздеу жүйелерінің алгоритмдері мен жұмыс принциптерін құруды білдіреді. іздеу сұрауы.

Сканерлеу

Бұл қазірдің өзінде индекстелген құжаттардағы өзгерістерді бақылау және пайдаланушы сұрауларын шығару нәтижелерінде ұсынылуы мүмкін жаңа беттерді іздеу. Іздеу жүйелері өрмекшілер немесе іздеу роботтары деп аталатын арнайы бағдарламалар арқылы Интернеттегі ресурстарды сканерлейді.

Интернет ресурстарын сканерлеу және деректерді жинау іздеу боттары арқылы автоматты түрде жүзеге асырылады. Сайтқа бірінші рет кіріп, оны іздеу дерекқорына қосқаннан кейін роботтар мазмұндағы өзгерістерді қадағалау және жазу үшін осы сайтқа мерзімді түрде кіре бастайды.

Интернеттегі дамушы ресурстардың саны көп болғандықтан және күн сайын жаңа сайттар пайда болады, сипатталған процесс бір минутқа тоқтамайды. Интернеттегі іздеу жүйелерінің жұмысының бұл принципі оларға желіде қолжетімді сайттар және олардың мазмұны туралы үнемі өзекті ақпаратқа ие болуға мүмкіндік береді.

Іздеу роботының негізгі міндеті - жаңа деректерді іздеу және одан әрі өңдеу үшін іздеу жүйесіне беру.

Индекстеу

Іздеу жүйесі деректерді тек өзінің дерекқорында ұсынылған сайттардан таба алады - басқаша айтқанда, индекстелген. Бұл қадамда іздеу жүйесі табылған ақпаратты мәліметтер базасына енгізу керек пе, егер енгізілсе, қай бөлімге енгізу керектігін анықтауы керек. Бұл процесс автоматты түрде де орындалады.

Google желіде қол жетімді барлық дерлік ақпаратты индекстейді деп саналады, ал Яндекс мазмұнды индекстеуді тезірек емес, таңдаулы түрде қолданады. Рунеттің екі іздеу гиганты да пайдаланушының игілігі үшін жұмыс істейді, бірақ жалпы принциптер Google және Yandex іздеу жүйелерінің жұмысы біршама ерекшеленеді, өйткені олар әр жүйені құрайтын бірегей бағдарламалық шешімдерге негізделген.

Іздеу жүйелері үшін ортақ мәселе барлық жаңа ресурстарды индекстеу процесі жүйеге белгілі сайттардағы жаңа мазмұнды индекстеуден ұзағырақ уақыт алады. Іздеу жүйелері жоғары сенімді сайттарда пайда болатын ақпарат индекске бірден дерлік кіреді.

Диапазон

Рейтинг – индекстелген деректердің маңыздылығын іздеу жүйесінің алгоритмдері бойынша бағалау және оларды осы іздеу жүйесіне тән факторларға сәйкес теңестіру. Алынған ақпарат пайдаланушы сұрауларының барлық ауқымы үшін іздеу нәтижелерін жасау үшін өңделеді. Жоғарыдағы іздеу нәтижелерінде қандай ақпарат ұсынылатыны және төменде қайсысы таңдалған іздеу жүйесі мен оның алгоритмдері қалай жұмыс істейтінімен толығымен анықталады.

Іздеу жүйесінің базасында орналасқан сайттар тақырыптар мен сұраныс топтары бойынша таратылады. Сұраныстардың әрбір тобы үшін одан әрі түзетуге жататын алдын ала шығарылым қалыптасады. Көптеген сайттардың позициялары шығарылымның әрбір жаңартылуынан кейін өзгереді - Google-да, Яндекс іздеуінде күн сайын болатын рейтингті жаңарту - бірнеше күнде бір рет.

Адам шығару сапасы үшін күресте көмекші ретінде

Шындығында, тіпті Яндекс және Google сияқты ең озық іздеу жүйелері де қазіргі уақытта қабылданған сапа стандарттарына сәйкес келетін нәтижелерді жасау үшін адам көмегіне мұқтаж. Қайда іздеу алгоритміжеткілікті түрде жұмыс істемейді, оның нәтижелері қолмен реттеледі - бет мазмұнын әртүрлі критерийлер бойынша бағалау арқылы.

Арнайы дайындалған көптеген адамдар армиясы әртүрлі елдер– іздеу жүйелерінің модераторлары (бағалаушылары) – олар күн сайын сайт беттерінің пайдаланушы сұрауларына сәйкестігін тексеру, спам және тыйым салынған мазмұнды (мәтіндер, суреттер, бейнелер) сүзгілеу бойынша үлкен жұмыс істеуі керек. Бағалаушылардың жұмысы эмиссияны таза етуге мүмкіндік береді және өздігінен білім алатын іздеу алгоритмдерін одан әрі дамытуға ықпал етеді.

Қорытынды

Интернеттің дамуымен және мазмұнды көрсетудің стандарттары мен формаларының бірте-бірте өзгеруімен іздеу тәсілі де өзгеруде, ақпаратты индекстеу және рейтингтеу процестері, қолданылатын алгоритмдер жетілдіріліп, жаңа рейтингтік факторлар пайда болуда. Мұның бәрі іздеу жүйелеріне пайдаланушы сұраныстары үшін ең жоғары сапалы және барабар нәтижелерді жасауға мүмкіндік береді, бірақ сонымен бірге веб-шеберлердің және веб-сайтты жылжыту бойынша мамандардың өмірін қиындатады.

Мақаланың астындағы түсініктемелерде мен Runet-тің негізгі іздеу жүйелерінің қайсысы - Яндекс немесе Google, сіздің ойыңызша, пайдаланушыға жақсырақ іздеуді қамтамасыз ететін жақсы жұмыс істейтіні туралы айтуды ұсынамын.

Интернет көптеген пайдаланушыларға өздері енгізген сұрауларға (сұрақтарға) жауап алу үшін қажет.

Егер іздеу жүйелері болмаса, пайдаланушылар өздеріне қажетті сайттарды іздеп, оларды есте сақтап, жазып алулары керек еді. Көптеген жағдайларда қолайлы нәрсені «қолмен» табу өте қиын, ал көбінесе мүмкін емес.

Біз үшін бұл күнделікті жұмыс сайттардағы ақпаратты іздеу, сақтау және сұрыптау бойынша жұмыс істейді.

Белгілі Runet іздеу жүйелерінен бастайық.

Орыс тіліндегі интернет іздеу жүйелері

1) Отандық іздеу жүйесінен бастайық. Яндекс Ресейде ғана емес, Беларусь пен Қазақстанда, Украинада, Түркияда жұмыс істейді. Сондай-ақ Яндекс қосулы ағылшын тілі.

2) Google іздеу жүйесі бізге Америкадан келді, орыс тілінде локализациясы бар:

3) Отандық іздеу жүйесі Mile ru, ол бір уақытта ВКонтакте, Одноклассники әлеуметтік желісін, сонымен қатар My World, әйгілі Answers Mail.ru және басқа жобаларды ұсынады.

4) Интеллектуалды іздеу жүйесі

Нигма (Нигма) http://www.nigma.ru/

2017 жылдың 19 қыркүйегінен бастап «зияткерлік» нигма жұмыс істемейді. Ол өзінің жасаушылары үшін қаржылық қызығушылықты тоқтатты, олар CocCoc деп аталатын басқа іздеу жүйесіне ауысты.

5) Белгілі Ростелеком компаниясы Sputnik іздеу жүйесін жасады.

Арнайы балаларға арналған Sputnik іздеу жүйесі бар, ол туралы мен жаздым.

6) Rambler алғашқы отандық іздеу жүйелерінің бірі болды:

Әлемде басқа танымал іздеу жүйелері бар:

  • Bing,
  • Yahoo!
  • Байду,
  • экозия,

Іздеу жүйесінің қалай жұмыс істейтінін анықтауға тырысайық, атап айтқанда, сайттар қалай индекстеледі, индекстеу нәтижелерін талдау және іздеу нәтижелерін қалыптастыру. Іздеу жүйелерінің жұмыс істеу принциптері шамамен бірдей: Интернетте ақпаратты іздеу, оны сақтау және пайдаланушы сұраныстарына жауап беру үшін оны сұрыптау. Бірақ іздеу жүйелері қолданатын алгоритмдер өте әртүрлі болуы мүмкін. Бұл алгоритмдер құпия сақталады және оны ашуға тыйым салынады.

Бірдей сұрауды енгізу іздеу жолдары әртүрлі іздеу жүйелері, әртүрлі жауаптар ала аласыз. Себебі, барлық іздеу жүйелері өздерінің алгоритмдерін пайдаланады.

Іздеу жүйелерінің мақсаты

Ең алдымен, іздеу жүйелері коммерциялық ұйымдар екенін білу керек. Олардың мақсаты – пайда табу. пайда табуға болады контекстік жарнама, жарнаманың басқа түрлері, қажетті сайттарды мәселенің жоғарғы жолдарына жылжытумен. Жалпы, көптеген жолдар бар.

Бұл оның аудиториясының көлеміне байланысты, яғни бұл іздеу жүйесін қанша адам пайдаланады. Аудитория неғұрлым көп болса, жарнама соғұрлым көп адамға көрсетіледі. Тиісінше, бұл жарнама қымбатырақ болады. Іздеу жүйелері аудиторияны көбейте алады меншікті жарнама, сонымен қатар олардың қызметтерінің сапасын, алгоритмін және іздеу ыңғайлылығын жақсарту арқылы пайдаланушыларды тарту.

Мұнда ең маңызды және қиын нәрсе - пайдаланушы сұрауларының көпшілігі үшін сәйкес нәтижелерді қамтамасыз ететін толыққанды жұмыс істейтін іздеу алгоритмін жасау.

Іздеу жүйесінің жұмысы және веб-шеберлердің әрекеттері

Әрбір іздеу жүйесінің өзіндік алгоритмі бар, ол ақпаратты талдау және пайдаланушы сұрауына жауап ретінде нәтижелерді құрастыру кезінде әртүрлі факторлардың үлкен санын ескеруі керек:

  • белгілі бір сайттың жасы,
  • сайт доменінің сипаттамалары,
  • сайттағы мазмұнның сапасы және оның түрлері,
  • сайтты шарлау және құрылым мүмкіндіктері,
  • ыңғайлылық (пайдаланушыға ыңғайлылық),
  • мінез-құлық факторлары (іздеу жүйесі пайдаланушының сайттан іздегенін тапқанын немесе пайдаланушы іздеу жүйесіне қайта оралғанын және сол сұрауға жауапты қайтадан сол жерден іздейтінін анықтай алады)
  • және т.б.

Мұның бәрі пайдаланушының сұранысы бойынша шығарылымның пайдаланушының қажеттіліктерін қанағаттандыратын мүмкіндігінше өзекті болуын қамтамасыз ету үшін қажет. Сонымен қатар іздеу жүйесінің алгоритмдері үнемі өзгеріп, жетілдіріліп отырады. Олар айтқандай, кемелдікте шек жоқ.

Екінші жағынан, веб-шеберлер мен SEO-лер үнемі өз сайттарын жылжытудың жаңа әдістерін ойлап табады, бұл әрқашан әділ бола бермейді. Іздеу жүйесінің алгоритмін әзірлеушілердің міндеті - адал емес оптимизаторлардың «жаман» сайттарының ТОП-та пайда болуына жол бермейтін өзгерістер енгізу.

Іздеу жүйесі қалай жұмыс істейді?

Енді іздеу жүйесінің тікелей жұмысы қалай өтетіні туралы. Ол кем дегенде үш кезеңнен тұрады:

  • сканерлеу,
  • индекстеу,
  • ауқымы.

Интернеттегі сайттардың саны жай ғана астрономиялық. Ал әрбір сайт – оқырмандар (нақты адамдар) үшін жасалған ақпараттық, ақпараттық контент.

Сканерлеу

Бұл жаңа ақпаратты жинау, сілтемелерді талдау және пайдаланушының сұрауларына жауап беру үшін пайдалануға болатын жаңа мазмұнды табу үшін іздеу жүйесі арқылы Интернеттің роумингі. Сканерлеу үшін іздеу жүйелерінде арнайы роботтар бар, олар іздеу роботтары немесе өрмекшілер деп аталады.

Іздеу роботтары веб-сайттарға автоматты түрде кіріп, олардан ақпарат жинайтын бағдарламалар. Тексеру негізгі болуы мүмкін (робот жаңа сайтқа бірінші рет кіреді). Сайттан бастапқы ақпаратты жинап, оны іздеу жүйесінің деректер қорына енгізгеннен кейін робот белгілі бір жүйелілікпен оның беттеріне кіре бастайды. Егер қандай да бір өзгерістер болса (жаңа мазмұн қосылды, ескі мазмұн жойылды), онда бұл өзгерістердің барлығы іздеу жүйесі арқылы түзетіледі.

Іздеу өрмекшісінің негізгі міндеті - жаңа ақпаратты табу және оны өңдеудің келесі кезеңі үшін, яғни индекстеу үшін іздеу жүйесіне беру.

Индекстеу

Іздеу жүйесі ақпаратты оның дерекқорына енгізілген сайттар арасында ғана іздей алады (ол арқылы индекстелген). Егер сканерлеу белгілі бір сайтта бар ақпаратты іздеу және жинау процесі болса, индекстеу бұл ақпаратты іздеу жүйесінің деректер қорына енгізу процесі. Бұл кезеңде іздеу жүйесі осы немесе басқа ақпаратты өзінің деректер қорына енгізу керек пе және оны қайда, мәліметтер қорының қай бөліміне енгізу керектігін автоматты түрде шешеді. Мысалы, Google Интернетте роботтары тапқан барлық дерлік ақпаратты индекстейді, ал Яндекс неғұрлым талғампаз және бәрін индекстемейді.

Жаңа сайттар үшін индекстеу кезеңі ұзақ болуы мүмкін, сондықтан іздеу жүйелерінен келушілер жаңа сайттарды ұзақ күте алады. А жаңа ақпарат, ескі, жарнамаланған сайттарда пайда болатын, бірден дерлік индекстелуі мүмкін және бірден дерлік «индекске», яғни іздеу жүйелерінің дерекқорына түседі.

Диапазон

Рейтинг - бұл бұрын индекстелген және белгілі бір іздеу жүйесінің деректер базасына енгізілген ақпаратты рейтингке сәйкес теңестіру, яғни іздеу жүйесі өз пайдаланушыларына бірінші кезекте қандай ақпаратты көрсететінін және қандай ақпарат орналастырылатынын « дәрежесі» төмен. Рейтингті оның клиентінің – пайдаланушының іздеу жүйесі қызмет көрсету сатысына жатқызуға болады.

Іздеу жүйесінің серверлерінде алынған ақпарат өңделеді және сұраулардың барлық түрлерінің үлкен ауқымы үшін мәселе жасалады. Бұл жерде іздеу жүйесінің алгоритмдері пайда болады. Деректер базасында тізімделген барлық сайттар тақырыптар бойынша жіктеледі, тақырыптар сұраныс топтарына бөлінеді. Сұраныстар тобының әрқайсысы үшін алдын ала шығарылым құрастырылуы мүмкін, ол кейіннен түзетіледі.

Неліктен маркетолог негізгі принциптерді білуі керек іздеу жүйесін оңтайландыру? Бәрі оңай: органикалық трафиккіріс ағынының тамаша көзі болып табылады мақсатты аудиториякорпоративтік веб-сайтыңызға және тіпті бастапқы беттерге арналған.

SEO тақырыбына арналған білім беру жазбаларымен танысыңыз.

Іздеу жүйесі дегеніміз не?

Іздеу жүйесі үлкен базақұжаттар (мазмұн). Іздеу роботтары ресурстарды айналып өтіп, әртүрлі мазмұн түрлерін индекстейді, дәл осы сақталған құжаттар іздеуде рейтингке ие.

Шын мәнінде, Яндекс - Рунеттің (сонымен бірге Түркия және бірнеше ағылшын тіліндегі сайттардың) «төлімі», ал Google - ғаламдық Интернет.

Іздеу индексі - бұл құжаттар туралы және олардағы кілт сөздердің орналасуы туралы ақпаратты қамтитын деректер құрылымы.

Жұмыс принципі бойынша іздеу жүйелері бір-біріне ұқсас, айырмашылықтар машиналық оқытуға негізделген рейтингтік формулаларда (іздеу нәтижелерінде сайттарға тапсырыс беру) жатыр.

Күн сайын миллиондаған пайдаланушылар іздеу жүйелеріне сұраулар жібереді.

«Жазу үшін реферат»:

«Сатып алу»:

Бірақ ең қызықты ...

Іздеу жүйесі қалай ұйымдастырылған?

Пайдаланушыларға жылдам жауап беру үшін іздеу архитектурасы 2 бөлікке бөлінді:

  • негізгі іздеу,
  • метаіздеу.

Негізгі іздеу

Негізгі іздеу – индекстің оның бөлігін іздейтін және сұранысқа сәйкес келетін барлық құжаттарды беретін бағдарлама.

Metasearch - бұл іздеу сұрауын өңдейтін, пайдаланушының аймақтылығын анықтайтын бағдарлама, егер сұраныс танымал болса, онда ол дайын іздеу опциясын береді, ал егер сұрау жаңа болса, негізгі іздеуді таңдап, оған пәрмен береді. құжаттарды таңдап, содан кейін табылған құжаттарды машиналық оқытуды пайдалана отырып дәрежелейді және пайдаланушыны қамтамасыз етеді.

Іздеу сұрауының классификациясы

Пайдаланушыға сәйкес жауап беру үшін іздеу жүйесі алдымен оған не қажет екенін түсінуге тырысады. Іздеу сұрауы талданады және пайдаланушы параллельді түрде талданады.

Іздеу сұраулары параметрлер бойынша талданады:

  • Ұзындығы;
  • анықтау;
  • танымалдығы;
  • бәсекеге қабілеттілік;
  • синтаксис;
  • география.

Сұраныс түрі:

  • навигация;
  • ақпараттық;
  • транзакциялық;
  • мультимедиа;
  • жалпы;
  • ресми.

Сұрауды талдау және классификациялаудан кейін рейтинг функциясы таңдалады.

Сұраныс түрлерін белгілеу құпия ақпарат болып табылады және ұсынылған опциялар іздеу жүйесін жылжыту мамандарының болжамы болып табылады.

Егер пайдаланушы жалпы сұрауды орнатса, іздеу жүйесі қайтарылады әртүрлі түрлеріқұжаттар. Ал жалпы сұраныс бойынша сайттың коммерциялық бетін ТОП-10-ға жылжыту арқылы сіз 10 орынның бірін емес, орын санын алуды талап етесіз деп түсіну керек.
рейтинг формуласымен ерекшеленетін коммерциялық беттер үшін. Сондықтан мұндай сұраулар бойынша бірінші орынға ие болу ықтималдығы төмен.

Machine Learning MatrixNet – бұл 2009 жылы Яндекс ұсынған алгоритм, ол белгілі бір сұраулар үшін құжаттарды саралау функциясын таңдайды.

MatrixNet тек Яндекс іздеуінде ғана емес, ғылыми мақсатта да қолданылады. Мысалы, Еуропалық ядролық зерттеулер орталығында ол деректердің үлкен көлемдерінде сирек кездесетін оқиғалар үшін қолданылады (олар Хиггс бозоны іздейді).

Рейтингтік формуланың тиімділігін бағалау үшін бастапқы деректерді бағалаушылар бөлімі жинайды. Бұл келесі критерийлер бойынша эксперименттік формула бойынша тораптар үлгісін бағалайтын арнайы дайындалған адамдар.

Сайт сапасын бағалау

Витальный - ресми сайт (Сбербанк, LPgenerator). Іздеу сұрауы ресми веб-сайтқа, әлеуметтік желілердегі топтарға, беделді ресурстар туралы ақпаратқа сәйкес келеді.

Пайдалы (5 балл) – сұраныс бойынша кеңейтілген ақпаратты беретін сайт.

Мысалы – сұраныс: баннер матасы.

«Пайдалы» рейтингке сәйкес сайт келесі ақпаратты қамтуы керек:

  • баннер матасы дегеніміз не;
  • техникалық сипаттама;
  • фотосуреттер;
  • түрлері;
  • бағалар тізімі;
  • басқа нәрсе.

Үздік сұрау мысалдары:

Сәйкес+ (4 ұпай) - Бұл ұпай беттің іздеу сұрауына сәйкес келетінін білдіреді.

Сәйкес- (3 ұпай) - бет іздеу сұрауына дәл сәйкес келмейді.

Айталық, «Галактика сеанстарының сақшылары» деген іздеуде көрсетілімсіз фильм туралы бет, өткен сеанс беті, youtube желісіндегі трейлер беті көрсетіледі.

Маңызды емес (2 ұпай) - бет сұрауға сәйкес келмейді.
Мысалы: қонақүйдің атауы басқа қонақүйдің атауын көрсетеді.

Жалпы немесе ақпараттық сұрауға арналған ресурсты жылжыту үшін «пайдалы» рейтингке сәйкес бетті жасау керек.

Түсінікті сұраулар үшін «тиісті+» ұпайға жету жеткілікті.

Өзектілікке бетті іздеу сұрауларымен мәтіндік және сілтеме сәйкестендіру арқылы қол жеткізіледі.

қорытындылар

  1. Барлық сұраулар коммерциялық бастапқы бетті алға жылжыта алмайды;
  2. Барлық ақпараттық сұрауларды коммерциялық сайтты жылжыту үшін пайдалануға болмайды;
  3. Жалпы сұранысты алға жылжыту арқылы пайдалы бетті жасаңыз.

Сайттың жоғарғы жағына жетпеуінің жалпы себебі - жарнамаланған бет мазмұнының іздеу сұрауына сәйкес келмеуі.

Бұл туралы келесі мақалада айтатын боламыз «Веб-сайтты негізгі оңтайландыруға арналған бақылау тізімі».

Анықтау бойынша, Интернет іздеу жүйесі - бұл бізге ақпаратты табуға көмектесетін ақпаратты іздеу жүйесі Дүниежүзілік өрмек. Бұл жаһандық ақпарат алмасуды жеңілдетеді. Бірақ интернет – құрылымдалмаған мәліметтер базасы. Ол экспоненциалды түрде өсуде және ақпараттың үлкен қоймасына айналды. Интернеттен ақпарат табу қиын жұмыс. Бұл мұхит туралы ақпаратты басқару, сүзу және шығару үшін құрал қажет. Іздеу жүйесі осы мақсатқа қызмет етеді.

Іздеу жүйесі қалай жұмыс істейді?

Интернет іздеу жүйелері - бұл Интернетте ақпаратты іздейтін және шығаратын қозғалтқыштар. Олардың көпшілігі тексеріп шығушы индекстеуіш архитектурасын пайдаланады. Олар трек модульдеріне байланысты. Өрмекшілер деп те аталатын Crawlers - веб-беттерді тексеретін шағын бағдарламалар.

Тексерушілер URL мекенжайларының бастапқы жинағына кіреді. Олар тексеріп шыққан беттерде пайда болатын URL мекенжайларын өңдейді және бұл ақпаратты тексеріп шығушы модуліне жібереді. Тексеріп шығушы келесі беттерге кіруді шешеді және сол URL мекенжайларын тексеріп шығушыларға береді.

Әртүрлі іздеу жүйелері қарастыратын тақырыптар олар қолданатын алгоритмдерге байланысты өзгереді. Кейбір іздеу жүйелері белгілі бір тақырып бойынша сайттарды іздеуге бағдарламаланған, ал басқаларының тексеріп шығушылары мүмкіндігінше көп жерлерге бара алады.

Индекстеу модулі өзі кірген әрбір беттен ақпаратты шығарады және URL мекенжайын дерекқорға қосады. Бұл ақпарат беттерін көрсететін URL мекенжайларының тізімінен үлкен іздеу кестесіне әкеледі. Кесте тексеріп шығу кезінде жабылған беттерді көрсетеді.

Талдау модулі іздеу жүйесі архитектурасының тағы бір маңызды бөлігі болып табылады. Ол пайдалылық индексін жасайды. Индекс утилитасы берілген ұзындықтағы беттерге немесе олардағы суреттердің белгілі бір санын қамтитын беттерге рұқсат бере алады.

Тексеру және индекстеу процесінде іздеу жүйесі өзі шығарған беттерді сақтайды. Олар парақтың қоймасында уақытша сақталады. Іздеу жүйелері бұрыннан барған беттерді іздеуді жылдамдату үшін кірген беттердің кэшін сақтайды.

Іздеу жүйесінің сұрау модулі пайдаланушылардан іздеу сұрауларын кілт сөздер түрінде қабылдайды. Реттеу модулі нәтижелерді сұрыптайды.

Тексеріп шығушы индекстеуіш архитектурасында көптеген нұсқалар бар. Олар өзгереді бөлінген архитектураіздеу жүйесі. Бұл архитектуралар коллекторлар мен брокерлерден тұрады. Коллекторлар веб-серверлерден индекстеу ақпаратын жинайды, ал брокерлер индекстеу механизмін және сұрау интерфейсін қамтамасыз етеді. Брокерлер коллекторлардан және басқа брокерлерден алынған ақпарат негізінде жаңартуды индекстейді. Олар ақпаратты сүзе алады. Бүгінгі таңда көптеген іздеу жүйелері архитектураның осы түрін пайдаланады.

Іздеу жүйелері және бет рейтингтері

Іздеу жүйесінде сұрау жасаған кезде нәтижелер белгілі бір ретпен көрсетіледі. Көпшілігіміз ең жоғары тапсырыс беттеріне кіріп, соңғыларын елемейміз. Себебі, біз ең жоғарғы бірнеше беттер біздің сұрауымызға көбірек сәйкес келеді деп ойлаймыз. Сондықтан әркім өз беттерін іздеу жүйесінің үздік он нәтижелерінде рейтингтеуге мүдделі.

Іздеу жүйесінің сұрау интерфейсінде тізімделген сөздер іздеу жүйелері сұраған кілт сөздер болып табылады. Олар сұралған кілт сөздерге қатысты беттердің тізімі. Бұл процесс барысында іздеу жүйелері сол кілт сөздер жиі кездесетін беттерді шығарып алады. Олар кілт сөздер арасындағы қатынасты іздейді. Сондай-ақ кілт сөздердің орны, оларды қамтитын беттің дәрежесі де қарастырылады. Бет атауларында немесе URL мекенжайларында пайда болатын кілт сөздерге көбірек салмақ беріледі. Сілтемелері бар беттер оларды одан да танымал етеді. Көптеген басқа сайттар бетке сілтеме жасаса, ол құнды және маңыздырақ болып көрінеді.

Әрбір іздеу жүйесі қолданатын рейтинг алгоритмі бар. Алгоритм – пайдаланушы сұрауы бойынша сәйкес беттерді қамтамасыз ету үшін жасалған компьютерленген формула. Әрбір іздеу жүйесінде іздеу сұрауларына сәйкес жауаптарды анықтау үшін қозғалтқыштың дерекқорындағы беттерді талдайтын әртүрлі рейтинг алгоритмі болуы мүмкін. Іздеу жүйелері әртүрлі ақпаратты әртүрлі тәсілдермен индекстейді. Бұл екі түрлі іздеу жүйесіне жеткізілетін белгілі бір сұрау беттерді әкеле алатындығына әкеледі әртүрлі тапсырыстарнемесе үзінді әртүрлі беттер. Веб-сайттың танымалдылығы өзектілікті анықтайтын фактор болып табылады. Сайттың шерту арқылы танымалдығы оның дәрежесін анықтайтын тағы бір фактор болып табылады. Бұл сайтқа қаншалықты жиі кіретінін көрсететін көрсеткіш.

Веб-шеберлер өз сайтының SERP жүйесіндегі орнын көтеру үшін іздеу жүйесінің алгоритмдерін алдауға тырысады. Сайт беттерін кілт сөздермен толтыру немесе іздеу жүйесінің рейтингтік стратегияларын алдау үшін мета тегтерді пайдалану. Бірақ іздеу жүйелері жеткілікті ақылды! Олар веб-шеберлердің айла-шарғылары іздеу нәтижелеріне әсер етпеуі үшін алгоритмдерін жетілдіреді.

Тізімдегі алғашқы бірнеше беттерден кейінгі беттер де дәл сіз іздеген ақпаратты қамтуы мүмкін екенін түсінуіңіз керек. Бірақ жақсы іздеу жүйелері сізге әрқашан жоғары дәрежеде сәйкес келетін беттерді әкелетініне сенімді болыңыз!

Бұл не

DuckDuckGo - өте танымал ашық бастапқы іздеу жүйесі. бастапқы код. Серверлер АҚШ-та орналасқан. Өз роботынан басқа, іздеу жүйесі басқа көздердің нәтижелерін пайдаланады: Yahoo, Bing, Wikipedia.

Жақсырақ

DuckDuckGo өзін соңғы құпиялылық пен құпиялылықты іздеу ретінде орналастырады. Жүйе пайдаланушы туралы ешқандай деректерді жинамайды, журналдарды сақтамайды (іздеу тарихы жоқ), пайдалану печеньебарынша шектелген.

DuckDuckGo пайдаланушылардан жеке ақпаратты жинамайды немесе бөліспейді. Бұл біздің құпиялылық саясатымыз.

Габриэль Вайнберг, DuckDuckGo негізін қалаушы

Бұл не үшін керек

Барлық негізгі іздеу жүйелері монитор алдындағы адам туралы деректер негізінде іздеу нәтижелерін жекелендіруге тырысады. Бұл құбылыс «сүзгі көпіршігі» деп аталады: пайдаланушы өз қалауларына сәйкес келетін немесе жүйе осылай деп санайтын нәтижелерді ғана көреді.

Сіздің Интернеттегі бұрынғы мінез-құлқыңызға байланысты емес объективті суретті қалыптастырады және сіздің сұрауларыңыз негізінде Google және Yandex тақырыптық жарнамасынан құтылады. DuckDuckGo ақпаратты табуды жеңілдетеді шет тілдері, ал Google және Яндекс әдепкі бойынша орыс тілді сайттарды қалайды, тіпті сұрау басқа тілде енгізілсе де.


Бұл не

Evil емес - анонимді Tor желісін іздейтін жүйе. Оны пайдалану үшін, мысалы, мамандандырылған іске қосу арқылы осы желіге өту керек.

not Evil бұл тек қана іздеу жүйесі емес. LOOK (Tor браузерінде әдепкі іздеу, кәдімгі Интернеттен қолжетімді) немесе TORCH (Tor желісіндегі ең көне іздеу жүйелерінің бірі) және басқалары бар. Біз Google-ді қатесіз тұспалдағандықтан, жамандық емес деп шештік (тек бастапқы бетке қараңыз).

Жақсырақ

Іздеуде қайда google, «Яндекс» және басқа іздеу жүйелері негізінен жабық.

Бұл не үшін керек

Tor желісінде заңға бағынатын Интернетте табылмайтын көптеген ресурстар бар. Веб мазмұнына билік тарапынан бақылау күшейген сайын олардың саны арта бермек. Tor - бұл әлеуметтік желілері, торрент трекерлері, медиалары, базарлары, блогтары, кітапханалары және т.б. бар Интернеттегі желі түрі.

3. YaCy

Бұл не

YaCy - орталықтандырылмаған іздеу жүйесі, ол P2P желілері принципі бойынша жұмыс істейді. Негізгі бағдарламалық модуль орнатылған әрбір компьютер Интернетті өздігінен сканерлейді, яғни ол іздеу роботының аналогы болып табылады. Алынған нәтижелер YaCy барлық қатысушылары пайдаланатын жалпы мәліметтер базасында жиналады.

Жақсырақ

Бұл жақсы немесе нашар екенін айту қиын, өйткені YaCy - іздеуді ұйымдастыруға мүлдем басқа көзқарас. Бір сервер мен иелік ететін компанияның болмауы нәтижелерді ешкімнің қалауынан толығымен тәуелсіз етеді. Әрбір түйіннің автономиясы цензураны жоққа шығарады. YaCy терең веб пен индекстелмеген қоғамдық желілерді іздеуге қабілетті.

Бұл не үшін керек

Егер сіз мемлекеттік органдар мен ірі корпорациялар әсер етпейтін ашық бастапқы бағдарламалық қамтамасыз етуді және тегін Интернетті жақтаушы болсаңыз, онда YaCy сіздің таңдауыңыз. Оны корпоративтік немесе басқа автономды желі ішінде іздеуді ұйымдастыру үшін де пайдалануға болады. YaCy күнделікті өмірде өте пайдалы болмаса да, іздеу процесі тұрғысынан Google-ға лайықты балама болып табылады.

4. Pipl

Бұл не

Pipl - белгілі бір адам туралы ақпаратты іздеуге арналған жүйе.

Жақсырақ

Pipl авторлары олардың мамандандырылған алгоритмдері «тұрақты» іздеу жүйелеріне қарағанда тиімдірек іздеуді талап етеді. Атап айтқанда, профильдерге басымдық беріледі әлеуметтік желілер, түсініктемелер, қатысушылар тізімдері және адамдар туралы ақпарат жарияланатын әртүрлі мәліметтер базасы, мысалы, сот шешімдерінің деректер базасы. Пиплдің осы саладағы көшбасшылығын Lifehacker.com, TechCrunch және басқа басылымдар растайды.

Бұл не үшін керек

Егер сізге АҚШ-та тұратын адам туралы ақпаратты табу қажет болса, онда Pipl Google-ге қарағанда әлдеқайда тиімдірек болады. Ресейлік соттардың деректер базасы іздеу жүйесіне қолжетімсіз сияқты. Сондықтан ол Ресей азаматтарымен онша жақсы араласпайды.

Бұл не

FindSounds - басқа мамандандырылған іздеу жүйесі. Ашық көздерден әртүрлі дыбыстарды іздейді: үй, табиғат, көлік, адамдар және т.б. Қызмет орыс тіліндегі сұрауларды қолдамайды, бірақ сіз іздеуге болатын орыс тіліндегі тегтердің әсерлі тізімі бар.

Жақсырақ

Тек дыбыстарды шығаруда және басқа ештеңе жоқ. Параметрлерде қажетті пішім мен дыбыс сапасын орнатуға болады. Барлық табылған дыбыстарды жүктеп алуға болады. Үлгі іздеу бар.

Бұл не үшін керек

Егер сізге мушкет атылған дыбысты, сорғыш тоқылдақтың соққысын немесе Гомер Симпсонның айғайын жылдам табу керек болса, онда бұл қызмет сізге арналған. Біз мұны орыс тіліндегі қолжетімді сұраулардан ғана таңдадық. Ағылшын тілінде спектр одан да кең.

Шынымен, мамандандырылған қызмет арнайы аудиторияны білдіреді. Бірақ бұл сізге де пайдалы бола ма?

Бұл не

Wolfram|Alpha – есептеуіш іздеу жүйесі. Құрамындағы мақалаларға сілтемелердің орнына түйінді сөздер, ол пайдаланушының сұрауына дайын жауап береді. Мысалы, іздеу формасына ағылшын тілінде «Нью-Йорк пен Сан-Франциско тұрғындарын салыстырыңыз» деп енгізсеңіз, Wolfram|Alpha салыстырумен бірге кестелер мен графиктерді бірден көрсетеді.

Жақсырақ

Бұл қызмет фактілерді табу және деректерді есептеу үшін басқаларға қарағанда жақсырақ. Wolfram|Alpha ғылым, мәдениет және ойын-сауықты қоса алғанда, әртүрлі салалардан Интернетте қолжетімді білімді жинайды және ұйымдастырады. Егер бұл дерекқорда іздеу сұрауына дайын жауап болса, жүйе оны көрсетеді, егер жоқ болса, ол есептейді және нәтижені көрсетеді. Бұл жағдайда пайдаланушы тек көреді және басқа ештеңе жоқ.

Бұл не үшін керек

Егер сіз, мысалы, студент, талдаушы, журналист немесе зерттеуші болсаңыз, әрекеттеріңізге қатысты деректерді табу және есептеу үшін Wolfram|Alpha қолданбасын пайдалана аласыз. Қызмет барлық сұрауларды түсінбейді, бірақ үнемі дамып, ақылдырақ болып келеді.

Бұл не

Dogpile метаіздеу механизмі нәтижелердің құрама жәшігін көрсетеді іздеу нәтижелері Google, Yahoo және басқа да танымал жүйелер.

Жақсырақ

Біріншіден, Dogpile азырақ жарнамаларды көрсетеді. Екіншіден, қызмет табу және көрсету үшін арнайы алгоритмді пайдаланады жоғарғы ұпайларәртүрлі іздеу жүйелерінен. Dogpile әзірлеушілерінің айтуынша, олардың жүйесі бүкіл Интернеттегі ең толық мәселені жасайды.

Бұл не үшін керек

Google немесе басқа стандартты іздеу жүйесінде ақпаратты таба алмасаңыз, Dogpile көмегімен оны бірден бірнеше іздеу жүйесінен іздеңіз.

Бұл не

BoardReader – форумдарға, сұрақ-жауап қызметтеріне және басқа қауымдастықтарға арналған мәтіндік іздеу жүйесі.

Жақсырақ

Қызмет іздеу өрісін әлеуметтік сайттарға дейін тарылтуға мүмкіндік береді. Арнайы сүзгілердің арқасында критерийлеріңізге сәйкес келетін жазбалар мен пікірлерді жылдам таба аласыз: тіл, жарияланған күні және сайт атауы.

Бұл не үшін керек

BoardReader белгілі бір мәселелер бойынша БАҚ пікіріне қызығушылық танытатын PR мамандары мен басқа БАҚ мамандары үшін пайдалы болуы мүмкін.

Қорытындылай келе

Баламалы іздеу жүйелерінің өмірі жиі өткінші. Лайфхаккер Яндекс компаниясының украиналық филиалының бұрынғы бас директоры Сергей Петренкодан мұндай жобалардың ұзақ мерзімді перспективалары туралы сұрады.


Сергей Петренко

Яндекс.Украинаның бұрынғы бас директоры.

Баламалы іздеу жүйелерінің тағдырына келетін болсақ, бұл қарапайым: шағын аудиториясы бар өте тауашалық жобалар болуы, сондықтан айқын коммерциялық перспективалары жоқ немесе, керісінше, олардың болмауының толық анықтығы.

Егер сіз мақаладағы мысалдарды қарасаңыз, мұндай іздеу жүйелерінің тар, бірақ сұранысқа ие тауашаға маманданғанын көре аласыз, мүмкін бұл әлі күнге дейін Google немесе Яндекс радарларында байқалу үшін жеткілікті өспеген. немесе әдеттегі іздеуде әлі қолданылмайтын бастапқы гипотезаны рейтингте сынап жатыр.

Мысалы, егер Tor іздеуі кенеттен сұранысқа ие болып шықса, яғни Google аудиториясының кем дегенде пайызы сол жерден нәтижелерді қажет ететін болса, онда, әрине, қарапайым іздеу жүйелері мәселені шешуге кіріседі. оларды тауып, пайдаланушыға көрсетіңіз. Егер аудиторияның мінез-құлқы сұраулардың айтарлықтай санындағы пайдаланушылардың айтарлықтай үлесі пайдаланушыға байланысты факторларды есепке алмағанда, сәйкес нәтижелерге, деректерге ие болып көрінетінін көрсетсе, Яндекс немесе Google мұндай нәтижелерді бере бастайды.

Осы мақаланың контекстіндегі «жақсы болу» «бәрінен жақсы болу» дегенді білдірмейді. Иә, көптеген аспектілерде біздің кейіпкерлер Яндекстен алыс (тіпті Bing-тен де алыс). Бірақ бұл қызметтердің әрқайсысы пайдаланушыға іздеу индустриясының алыптары ұсына алмайтын нәрсені береді. Әрине, сіз де осындай жобаларды білесіз. Бізбен бөлісіңіз - талқылайық.

Мақала ұнады ма? Достарыңызбен бөлісіңіз!
Бұл мақала пайдалы болды ма?
Иә
Жоқ
Пікіріңізге рахмет!
Бірдеңе дұрыс болмады және сіздің дауысыңыз есептелмеді.
Рақмет сізге. Сіздің хабарламаңыз жіберілді
Мәтіннен қате таптыңыз ба?
Оны таңдаңыз, басыңыз Ctrl+Enterжәне біз оны түзетеміз!