Spam bejelentés

április 16, 2007

Google találati listáiban talált webszemét bejelentése

Ha valaki Web spamra bukkan a Google kereső Találati rangsoraiban, lehetősége van azt bejelenteni a Google-nek. Ezt vagy azonosítás nélkül, névtelenül lehet megtenni a http://www.google.com/contact/spamreport.html címen elérhető –sajnos csak angol nyelvű- űrlap kitöltésével, vagy a Google Webmaster Tools felhasználói felületére belépve a jobboldalt található „Tools” feliratú kibomló menüben található linkre kattintva.

A két űrlap azonos: először meg kell adni használt Kereső-kifejezést, majd a kérdéses találati rangsor webcímét (a böngésző címsorából bemásolva), ahol a webszemét (vagy a Google saját iránymutatásai webmestereknek dokumentumban foglaltakat be nem tartó weboldal) megjelent továbbá a bejelenteni kívánt weboldal URL-jét. Az eztán következő ‘s description (Az oldalon található információ nincs köszönőviszonyban a Google által kijelzett kivonattal)

  • Cloaked page (Cloaking technikát használó oldalak)
  • Deceptive redirects (Megtévesztő átirányítást használó oldalak)
  • Doorway pages (Doorway oldalak)
  • Duplicate site or pages (Duplikált webhelyek vagy weblapok)
  • Other (specify) (egyébb, a következőekben részletezett)

A Google állítása szerint jelenleg minden, a Webmaster Tools felületén át jelentett oldalt megvizsgálnak, míg az azonosítatlan bejelentésre szolgáló űrlapon át jelentett ügyek közül a hatásuk tekintetében igyekeznek súlyozni, bár ezek közül is átnézik a legtöbbet.

Mi történik az autentikált bejelentőlapon jelentett esetekkel?

A bejelentett esetet elemzik, és felhasználják a spam-észlelő algoritmusok fejlesztésénél. A Google célja az, hogy a jövőben a bejelentett oldalnál alkalmazotthoz hasonló manipulációkat automatikusan azonosítsák, és kihagyják a rangsorból az ilyen trükköket használó oldalakat.

Mért van az, hogy a spam bejelentés olykor nem jár azonnali következményekkel?

A Google nemcsak algoritmusok segítségével általánosságban tesz a webszemét ellen, hanem egyedi esetekben is eljárhat. Néha azonban ezek az intézkedések nem járnak látható eredménnyel, mely az alábbi okok miatt fordulhat elő:

  • Olykor a Google már a bejelentés előtt is névértékén kezeli a bejelentett webszemetet, például a túlzásba vitt Linkcsere észlelése esetén a bejövő linkeket csak erősen csökkentett névértéken kezelik, vagy a Rangsorolást alapjában nem befolyásoló kulcsszó-kitömést sem veszik figyelembe.
  • Nemcsak a Google adatbázisából való kizárás lehet a következménye a Spam bejelentésének, előfordulhat, hogy a webmester csak „sárga lapot” kap, például átmenetileg eltűnnek weblapjai a kereső indexéből.
  • Az idő szerepe itt sem el elhanyagolható: például az algoritmusok és ennek következtében az újraszámolt PageRank értékek aktualizálása sok időt vehet igénybe.
  • Elképzelhető, hogy a jelentett esetet a Google általánosabb szinten tervezi kezelni, ezért az egyedi esetekben külön nem lép.
  • Végül az is elképzelhető, hogy egyszerűen nem volt jogos a bejelentés, és a jelentett oldal nem web szemét, és megfelel a Google iránymutatásainak is.

Kap-e visszajelzést a felhasználó a jelentésről

Jelenleg nem, a jövőben elképzelhető erre valamilyen kommunikációs csatorna létrehozása

Forrás és további részletek: http://googlewebmastercentral.blogspot.com/2007/03/update-on-spam-reporting.html

A „Spam bejelentés” című bejegyzést 2007. 04. 16. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2014. 05. 26., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások

Ember, vagy „MI”

2007. 04. 16. 16:16 · Névtelen hozzászóló →

Kérdésem a következő lenne.

Ezeket a bejelentéseket emberek vizsgálják, vagy program?Kérdésem abból adódik, hogy pl.: a rejtett szöveg, eléggé határeset, mivel egy szöveget úgy is el lehet rejteni, hogy annak oka nem a keresők megtévesztése, hanem helytakarékosság. Az ilyen megoldásoknál biztosan szóba jön a js, amit ugye nem feltétlenül értelmez a google spider (valamint más keresők sem), így az statikusan rejtett tartalomnak látszhat, kvázi egy teljesen tisztességes, ‘uram bocsá’ hasznos oldal is kikerülhet az indexből…

Buster

2007. 04. 16. 16:28 · Névtelen hozzászóló →

Vajon milyen „szőröt” alkalmaznak erre a keresők, egyáltalán alkalmaznak-e???(Bocs, hogy kettés szedtem a hozzászólást.)

Ember, vagy „MI”

2007. 04. 17. 04:47 · OldalGazda →

Szerintem is-is. Maga a bejelentőlap létezése egyfajta elismerése annak, hogy a bejelentőlapon szereplő trükköket nem tudja teljes mértékben automatikusan kiszűrni a Google kereső, ezért emberi közreműködés szükséges az adott trükk felismeréséhez, értékeléséhez, majd a jelenség általános ismérveinek azonosításához (ez utóbbi nélkülözhetetlen a trükköt a jövőben felismerő algoritmus megírásához.)

Vannak olyan szűrők, amik az egyszerű eseteket érzékelik (pl. a html-ben a background és a font color szín ugyanaz), azonban pl. a JavaScript és a Stíluslapok használatával előállított elrejtéseket lehetetlen teljes mértékben detektálni, mert ahhoz sokszor le kellene renderelni az oldalt, ez pedig rendkívül sok erőforrást igényelne.

semmi sem változott

2007. 04. 17. 06:29 · Névtelen hozzászóló →

Ez már évek óta működik, de azért valószínüleg fenntartásokkal kezelik az ilyen bejelentéseket, különben mindenki kilőné vele a konkurenciáját…

ManiAc

Konkurencia-kilövés

2007. 04. 17. 06:58 · Névtelen hozzászóló →

„mindenki kilőné vele a konkurenciáját”

Ha tényleg megvizsgálják a bejelentett oldalt, egyértelműen kiderül, hogy van-e csalás vagy sem. Onnantól meg mindegy, hogy a konkurencia jelentette-e be. (Amúgy azt hiszem, nyilvánvaló, hogy a bejelentések túlnyomó többségét a konkurencia teszi meg, mert neki áll érdekében.)

Mostanában írták, hogy a Webmaster Tools űrlapján tett bejelentéseket egytől-egyig kivizsgálják, a nyílt űrlapon beküldötteket viszont csak esetlegesen.

Pro és kontra

2007. 04. 17. 07:42 · Névtelen hozzászóló →

Ez az egész annyira nonszensz. Előfordulhat, hogy az előbb említett módon tisztességesen „elrejtett” tartalom miatt kitiltanak egy oldalt, ellenben sok helyen látni olyat, hogy a hajtás felett van egy „üdvözöljük az oldalunkon, stb. stb. belépés–>”, majd egy kis görgetéssel meglátjuk a 180 sornyi, kulcsszavakkal teletűzdelt, nem a látogatóknak készült szövegezést, mondjuk két árnyalattal sötétebb (még látható!) szöveggel, ami ugye semmiképp sem rejtett szöveg. Szerintetek melyik a tisztességtelen? A technika hogyan lesz képes ezt mérlegre tenni???Buster

nekem más a bajom

2014. 05. 26. 07:57 · Névtelen hozzászóló →

A mi problémánk az, hogy a cégünk leveleit a gmail spamként kezeli, vagy valami más baja van vele, ezért azok nem érkeznek meg a címzettekhez. Nem tudom, hogy mit lehetne ez ellen tenni, mi ugyanis konkrét ügyfeleinkkel levelezünk, nem levélszemetet küldünk szét. Örülnék, ha a gmail csapata ezt valahogy megoldaná. Weltimpex Zrt.