<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
	<channel>
		<title><![CDATA[Неофициальный форум DLNA Home Media Server &mdash; Защита сайтов от парсинга.]]></title>
		<link>https://hms.lostcut.net/viewtopic.php?id=902</link>
		<atom:link href="https://hms.lostcut.net/extern.php?action=feed&amp;tid=902&amp;type=rss" rel="self" type="application/rss+xml" />
		<description><![CDATA[Недавние сообщения в теме «Защита сайтов от парсинга.».]]></description>
		<lastBuildDate>Sat, 19 Jul 2025 11:31:04 +0000</lastBuildDate>
		<generator>PunBB</generator>
		<item>
			<title><![CDATA[Защита сайтов от парсинга.]]></title>
			<link>https://hms.lostcut.net/viewtopic.php?pid=18484#p18484</link>
			<description><![CDATA[<p>Столкнулся с проверкой на бота - называется Анубис. Исходный код <a href="https://github.com/TecharoHQ/anubis">https://github.com/TecharoHQ/anubis</a><br />Полюбоваться на работу можно invidious.f5.si или invidious.nerdvpn.de<br />Осталось разобраться как обойти на php эти грабли.</p><p>вот, что пишут разработчики:<br />Anubis — это компромисс. Anubis использует схему Proof-of-Work, похожую на Hashcash, предлагаемую схему Proof-of-Work для борьбы со спамом в электронной почте. Идея заключается в том, что на отдельных уровнях дополнительная нагрузка игнорируется, но на уровне массового парсинга она накапливается и значительно удорожает сбор данных.</p><p>В конечном счете, это хак, чья настоящая цель — предоставить «достаточно хорошее» решение-заполнитель, чтобы можно было потратить больше времени на идентификацию и идентификацию headless-браузеров (например, по тому, как они выполняют рендеринг шрифтов), чтобы не отображать страницу с подтверждением работы пользователям, которые с гораздо большей вероятностью являются законными пользователями.</p><p>Обратите внимание, что Anubis требует использования современных функций JavaScript, которые такие плагины, как JShelter, отключают. Пожалуйста, отключите JShelter и другие подобные плагины для этого домена.</p>]]></description>
			<author><![CDATA[null@example.com (smsbox3)]]></author>
			<pubDate>Sat, 19 Jul 2025 11:31:04 +0000</pubDate>
			<guid>https://hms.lostcut.net/viewtopic.php?pid=18484#p18484</guid>
		</item>
	</channel>
</rss>
