Яндекс.АГС

Как видится работа всяческих «обучаемых» алгоритмов. Людям дают на оценку ограниченное количество документов/сайтов… потом дают это всё некой программе, которая пытается выделить самые примитивные (доступные роботу) признаки СПАМа и не‑СПАМа, потом по этим же признакам фильтруют все или многие сайты/документы.

Какова вероятность того, что документ/сайт, не являющийся СПАМом — окажется зафильтрован? Сами поисковики на эту тему “благоразумно” отмалчиваются и не станут этого разглашать — под самыми благовидными предлогами. Но эта точность зависит от многих обстоятельств, включая стадность/изобретательность спамеров и затраты на обучение фильтра — а это работа людей, которую надо оплачивать.

яндексоиды козлы

Можно делать косвенные оценки: сколько % СПАМа всё же проникает в выдачу? Около 5 — только явного, не считая “уникализацию текстов”. Можно предположить, что приблизительно таким же оказывается % ошибочно зафильтрованных. Но уж не могут борцы со СПАМом гарантировать на порядок бо́льшую точность. И нельзя заранее исключить вероятность непредсказуемых последствий «машинного обучения».

последствия

Есть заметный % сайтов, похороненных яндексовскими изобретениями. Их владельцы/авторы молча умрут вместе с ними? А вот и нет, они… будут выяснять методы обхода фильтров, консультироваться у осведомлённых спамеров — выплёскивая эту инфу на начинающих. Вот и получат поисковики нечто противоположное тому, чего якобы хотели.

Конечно же яндексоиды продолжают повторять мантры: «делайте сайты для людей»… а те, кто вообще задумывается про всякие фильтры — он значит делает сайты для поисковиков. Но эта отмазка в устах почти монополиста выглядит скорее нежеланием решать проблему собственной ошибочности. (например эта страничка — и для людей, и для поисковиков… пусть попробуют счесть её СПАМом)

Первопричиной поискового СПАМа являются сами поисковики с их слишком искусственными методами. Побороть мафию можно — став главным мафиози… т. е. “победа” опять окажется лишь видимостью (как всегда побеждающей).

А вот ликвидировать причину “выгодности” СПАМа — создатели искалок почти не пытаются, им проще объявить виноватыми спамеров и продолжить свой, пока ещё выгодный бизнес. Но будущая ответственность‑то накапливается… и от неё не удастся отвертеться. И в тупик ведёт довод: «Если со СПАМом бороться “мягче” — наш поиск умрёт!»