Címke: spam

Egyszercsak megdöbbenve láttam, hogy a Facebook hírfolyamomban furcsa reklámok kezdtek előtűnni. Először csak azt láttam, hogy a szokásos reklámelhelyezéseket egyre több, meglepően gusztustalan és prosztó hirdetés foglalja el, majd a furcsaságok sora folytatódott azzal, hogy ott is ezek a reklámok jelentek meg, ahol normálisan a saját oldalaim promotálására buzdító Facebook mintahirdetések szoktak.

Vírusos a gépem?

Először arra gyanakodtam, hogy vírusos lett a gépem – amin azért eléggé elcsodálkoztam volna. Mivel más böngészőkben nem jöttek elő ezek a gusztustalan reklámok, ezért gyanúm a Chrome böngészőre terelődött. Nehezen hihetőnek tűnt az is, hogy magát a Chrome-ot törték volna meg azért, hogy nemkívánatos reklámokkal árasszanak el, így elkezdtem kikapcsolgatni a kiegészítőket, míg meg nem találtam, hogy melyiket kell inaktiválni ahhoz, hogy megszűnjön a probléma: a Live HTTP Headers kiegészítő volt a ludas – miután rákerestem, nyilvánvalóvá vált, hogy másnak is feltűnt már ez:

"Live HTTP Headers" extension hijacked from chrome

Hogyan működik a parazita reklámozás?

Korábban volt már rá példa, hogy egy windows-os böngészőm jobb alsó sarkába levakarhatatlanul odaköltözött egy mindent letakaró reklámfelület, ahová AdSense-ből származó hirdetések jelentek meg – ekkor elég egyértelmű volt, hogy valaki valamilyen malware, vagyis adware kéretlen reklámokkal bombáz azzal, hogy kihasználta az operációs rendszer és/vagy a böngésző biztonsági réseit, így feltelepítette a folyamatos reklámmegjelenítésért felelős kódot.

Ezzel szemben ez a mostani parazita reklám sokkal kifinomultabb volt, mivel nem minden weblapon jelent meg, és ahol megjelent, ott is csak a normál hirdetési felületeken megjelenő hirdetéseket cserélte le a saját hirdetésekre. Jól látszik a videón, ill. a képernyőképen, hogy nem is minden hirdetési egységet cseréltek le. Ha kicsit még visszafogottabban csinálták volna, talán még most sem tűnt volna fel a turpisság, vagy legalábbis csak azt gondoltam volna, hogy lám, a Facebook már hulladék hirdetéseket is megjelenít.

Ahogy a videón is látható, miután ezekre az animgif-es gusztustalan képekre kattintottam, egy olyan lapra érkeztem, ami megjelenésében egy online életmódmagazint / bulvár portált imitált. A turpisság csak az, hogy bárhova is kattintottam, ugyanoda jutottam: egy fogyókúrás szert áruló érkezési oldalra.

Tehát beinjektáltak egy kódot, ami lecserélte a normális hirdetéseket a „csúnya” hirdetéskiszolgáló szerver által feltöltött hirdetésekkel. Nyilván voltak olyan, szürke zónában működő vállalkozások, akik körülbelül tudták, hogy milyen módszerekkel éri el a megjelenéseket az „illegális” hirdetéskiszolgáló, és így is hajlandóak voltak fizetni a hirdetésmegjelenítésért. Ahogy látható, az érkezési oldalaikon sem riadtak vissza az unorthodox megoldásoktól.

A történet vége

Ma már, ha akarnám, sem tudnám aktiválni a kiegészítőt, a Google Chrome ugyanis letiltotta, sőt eltüntette a kiegészítő korábbi, hivatalos aloldalát is. Nekem meg találnom kellett egy másik kiegészítőt, ami segít megjeleníteni a HTTP fejléceket a böngészőmben...

Google találati listáiban talált webszemét bejelentése

Ha valaki Web spamra bukkan a Google kereső Találati rangsoraiban, lehetősége van azt bejelenteni a Google-nek. Ezt vagy azonosítás nélkül, névtelenül lehet megtenni a http://www.google.com/contact/spamreport.html címen elérhető –sajnos csak angol nyelvű- űrlap kitöltésével, vagy a Google Webmaster Tools felhasználói felületére belépve a jobboldalt található "Tools" feliratú kibomló menüben található linkre kattintva.

A két űrlap azonos: először meg kell adni használt Kereső-kifejezést, majd a kérdéses találati rangsor webcímét (a böngésző címsorából bemásolva), ahol a webszemét (vagy a Google saját iránymutatásai webmestereknek dokumentumban foglaltakat be nem tartó weboldal) megjelent továbbá a bejelenteni kívánt weboldal URL-jét. Az eztán következő 's description (Az oldalon található információ nincs köszönőviszonyban a Google által kijelzett kivonattal)

  • Cloaked page (Cloaking technikát használó oldalak)
  • Deceptive redirects (Megtévesztő átirányítást használó oldalak)
  • Doorway pages (Doorway oldalak)
  • Duplicate site or pages (Duplikált webhelyek vagy weblapok)
  • Other (specify) (egyébb, a következőekben részletezett)

A Google állítása szerint jelenleg minden, a Webmaster Tools felületén át jelentett oldalt megvizsgálnak, míg az azonosítatlan bejelentésre szolgáló űrlapon át jelentett ügyek közül a hatásuk tekintetében igyekeznek súlyozni, bár ezek közül is átnézik a legtöbbet.

Mi történik az autentikált bejelentőlapon jelentett esetekkel?

A bejelentett esetet elemzik, és felhasználják a spam-észlelő algoritmusok fejlesztésénél. A Google célja az, hogy a jövőben a bejelentett oldalnál alkalmazotthoz hasonló manipulációkat automatikusan azonosítsák, és kihagyják a rangsorból az ilyen trükköket használó oldalakat.

Mért van az, hogy a spam bejelentés olykor nem jár azonnali következményekkel?

A Google nemcsak algoritmusok segítségével általánosságban tesz a webszemét ellen, hanem egyedi esetekben is eljárhat. Néha azonban ezek az intézkedések nem járnak látható eredménnyel, mely az alábbi okok miatt fordulhat elő:

  • Olykor a Google már a bejelentés előtt is névértékén kezeli a bejelentett webszemetet, például a túlzásba vitt Linkcsere észlelése esetén a bejövő linkeket csak erősen csökkentett névértéken kezelik, vagy a Rangsorolást alapjában nem befolyásoló kulcsszó-kitömést sem veszik figyelembe.
  • Nemcsak a Google adatbázisából való kizárás lehet a következménye a Spam bejelentésének, előfordulhat, hogy a webmester csak "sárga lapot" kap, például átmenetileg eltűnnek weblapjai a kereső indexéből.
  • Az idő szerepe itt sem el elhanyagolható: például az algoritmusok és ennek következtében az újraszámolt PageRank értékek aktualizálása sok időt vehet igénybe.
  • Elképzelhető, hogy a jelentett esetet a Google általánosabb szinten tervezi kezelni, ezért az egyedi esetekben külön nem lép.
  • Végül az is elképzelhető, hogy egyszerűen nem volt jogos a bejelentés, és a jelentett oldal nem web szemét, és megfelel a Google iránymutatásainak is.

Kap-e visszajelzést a felhasználó a jelentésről

Jelenleg nem, a jövőben elképzelhető erre valamilyen kommunikációs csatorna létrehozása

Forrás és további részletek: http://googlewebmastercentral.blogspot.com/2007/03/update-on-spam-reporting.html

A „Spam bejelentés” című bejegyzést 2007. 04. 16. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2014. 05. 26., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások

Ember, vagy "MI"

2007. 04. 16. 16:16 · Névtelen hozzászóló →

Kérdésem a következő lenne.

Ezeket a bejelentéseket emberek vizsgálják, vagy program?Kérdésem abból adódik, hogy pl.: a rejtett szöveg, eléggé határeset, mivel egy szöveget úgy is el lehet rejteni, hogy annak oka nem a keresők megtévesztése, hanem helytakarékosság. Az ilyen megoldásoknál biztosan szóba jön a js, amit ugye nem feltétlenül értelmez a google spider (valamint más keresők sem), így az statikusan rejtett tartalomnak látszhat, kvázi egy teljesen tisztességes, 'uram bocsá' hasznos oldal is kikerülhet az indexből...

Buster

...

2007. 04. 16. 16:28 · Névtelen hozzászóló →

Vajon milyen "szőröt" alkalmaznak erre a keresők, egyáltalán alkalmaznak-e???(Bocs, hogy kettés szedtem a hozzászólást.)

Ember, vagy "MI"

2007. 04. 17. 04:47 · OldalGazda →

Szerintem is-is. Maga a bejelentőlap létezése egyfajta elismerése annak, hogy a bejelentőlapon szereplő trükköket nem tudja teljes mértékben automatikusan kiszűrni a Google kereső, ezért emberi közreműködés szükséges az adott trükk felismeréséhez, értékeléséhez, majd a jelenség általános ismérveinek azonosításához (ez utóbbi nélkülözhetetlen a trükköt a jövőben felismerő algoritmus megírásához.)

Vannak olyan szűrők, amik az egyszerű eseteket érzékelik (pl. a html-ben a background és a font color szín ugyanaz), azonban pl. a JavaScript és a Stíluslapok használatával előállított elrejtéseket lehetetlen teljes mértékben detektálni, mert ahhoz sokszor le kellene renderelni az oldalt, ez pedig rendkívül sok erőforrást igényelne.

semmi sem változott

2007. 04. 17. 06:29 · Névtelen hozzászóló →

Ez már évek óta működik, de azért valószínüleg fenntartásokkal kezelik az ilyen bejelentéseket, különben mindenki kilőné vele a konkurenciáját...

ManiAc

Konkurencia-kilövés

2007. 04. 17. 06:58 · Névtelen hozzászóló →

"mindenki kilőné vele a konkurenciáját"

Ha tényleg megvizsgálják a bejelentett oldalt, egyértelműen kiderül, hogy van-e csalás vagy sem. Onnantól meg mindegy, hogy a konkurencia jelentette-e be. (Amúgy azt hiszem, nyilvánvaló, hogy a bejelentések túlnyomó többségét a konkurencia teszi meg, mert neki áll érdekében.)

Mostanában írták, hogy a Webmaster Tools űrlapján tett bejelentéseket egytől-egyig kivizsgálják, a nyílt űrlapon beküldötteket viszont csak esetlegesen.

Pro és kontra

2007. 04. 17. 07:42 · Névtelen hozzászóló →

Ez az egész annyira nonszensz. Előfordulhat, hogy az előbb említett módon tisztességesen "elrejtett" tartalom miatt kitiltanak egy oldalt, ellenben sok helyen látni olyat, hogy a hajtás felett van egy "üdvözöljük az oldalunkon, stb. stb. belépés-->", majd egy kis görgetéssel meglátjuk a 180 sornyi, kulcsszavakkal teletűzdelt, nem a látogatóknak készült szövegezést, mondjuk két árnyalattal sötétebb (még látható!) szöveggel, ami ugye semmiképp sem rejtett szöveg. Szerintetek melyik a tisztességtelen? A technika hogyan lesz képes ezt mérlegre tenni???Buster

nekem más a bajom

2014. 05. 26. 07:57 · Névtelen hozzászóló →

A mi problémánk az, hogy a cégünk leveleit a gmail spamként kezeli, vagy valami más baja van vele, ezért azok nem érkeznek meg a címzettekhez. Nem tudom, hogy mit lehetne ez ellen tenni, mi ugyanis konkrét ügyfeleinkkel levelezünk, nem levélszemetet küldünk szét. Örülnék, ha a gmail csapata ezt valahogy megoldaná. Weltimpex Zrt.

Találati rangsorok tökéletesítése közép-kelet-európai nyelveken

Az utóbbi időben egyre nagyobb figyelmet fordítanak a Google központjában a kelet-európai piacokra, ennek egyik jele, hogy egyre-másra jelennek meg a Google Webmaster Central blogon az itteni webmestereknek szóló üzenetek:

Tips for Eastern European webmasters - Tippek kelet-európai webmestereknek

http://googlewebmastercentral.blogspot.com/2007/03/tips-for-eastern-european-webmasters.html

A bejegyzés bevezetésében megemlítik, hogy az utóbbi időben nagyobb figyelmet fordítottak a nemzetközi webmesterekkel kapcsolatos kérdésekre, különösen a kelet-európai régión belül. Noha az egyes nyelvi piacok nagyon különbözőek, véleményük szerint abban egyeznek, hogy az online piac még igencsak fejlődőnek számít, de ennek ellenére rengeteg webmester és SEO szakértő dolgozik a különböző nyelveken, és ennek következtében bizonyos mértékű Web spam is létrejött. E spam ellen pedig mind algoritmikusan, mind manuálisan küzdeni szándékoznak. Ennek jegyében az alábbi tanácsokat adják:

  • Linkcsere programok kerülendőek, ehelyett javasolt a minőségi tartalomra, majd ezt követően a Weblog közösség és a Közösségi linkoldalak segítségével elérni, hogy minél több webmester magától hivatkozza az oldalt.
  • Ne használjanak regionális domainneveket spammelésre: ez nem kifejezetten érinti a magyar közönséget. Néhány országban lehetőség van egy régió vagy város domainneve alá regionális jelleggel aldomaiként regisztrálni oldalakat (pl. szczecin.pl).
  • Ne éljenek a cibersquatting lehetőségével (magyarán híres márkákkal egyező nevű domainek lefoglalása, pl. www.google.hu, google.cz előtörténete, google.by, stb.)
  • Gondolkodás hosszú távra: minőségi weboldalak -» minőségi internetes piac

Linkowanie - Linkelés

http://googlewebmastercentral.blogspot.com/2007/04/linkowanie.html

Mint azt a címe is mutatja, ez a bejegyzés a lengyel webmesterek számára íródott elsősorban. A webni.innen.hu hűséges olvasói olvashattak régebben is arról, hogy a Fizetett linkek megjelenítése lengyel barátainknál akkora népszerűségnek örvend, hogy saját helyi szolgáltatók is léteznek erre. Ez a bejegyzés gyakorlatilag a Fizetett linkek elleni offenzíva része.

An update on spam reporting - A Spam bejelentésről mégegyszer

http://googlewebmastercentral.blogspot.com/2007/03/update-on-spam-reporting.html

Erről a bejegyzésről bővebben a Spam bejelentés bejegyzésben lehet olvasni. Amiért itt is felsorolásra került, az az, hogy eredetileg németül jelent meg, ami újabb jelét mutatja annak, hogy a Google egyre jobban koncentrál a nem angol nyelvű találati listák webszeméttől való megtisztítására.

bejegyzés forrása: http://www.seo.hr/blog/251

A „Kelet-európai Google anti-spam offenzíva” című bejegyzést 2007. 04. 16. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2007. 10. 25., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások

találati rangsor

2007. 05. 15. 08:28 · mocivince →

Egy kérdésem lenne: Eddig egy bizonyos, számomra a legfontosabb keresőszóra a Google találati listáján az első 10 között volt a honlapom, de hirtelen visszacsúszott a 160. helyre, akkor ennek lehet-e az oka a következő:Két domain nevet foglaltam le, egyet .com egyet .hu véggel. Kezdetben csak a .hu-s volt regisztrálva a Google adatbázisába, de mikor elkezdtem az angol változatot is készíteni, regisztráltam a .com-osat is. Egy ideig a .com-os is ugyanarra a magyar nyelvű lapra mutatott. Lehet, hogy emiatt spam-nak vette?Mostanra különvált a két lap, van esély, hogy visszakerüljön az oldalam az első 10 közé?Köszönettel: Mocivince

találati rangsor

2007. 05. 16. 04:32 · OldalGazda →

erre a kérdésre érdemben nem lehet válaszolni a kérdéses domainnevek ismerete nélkül...

találati ransor

2007. 05. 16. 05:25 · mocivince →

Köszönöm a visszajelzést! A honlap : www.arthomegaleria.hu és www.arthomegallery.com Az említett kulcsszó pedig: festményekTermészetesen nem a .com-os oldalt szeretném optimalizálni, hanem a magyar nyelvűt.Annyit még hozzátennék, hogy nem vagyok profi, és főleg az Ön lapjait böngészve próbálkozom. /Ami az elmúlt 3 hétig sikeres is volt.../Már ami a rangsorbeli elhelyezkedést illeti/Egyébként pedig minden jó tanácsot előre is köszönök!

oldalak

2007. 05. 17. 06:18 · Gabber →

MInden esetre elég furcsán oldottad meg. Felraktál egy sima angol kezdőlapot a .com-ra, és minden további link a magyar oldalra mutat. Szerencsétlen google nem tudja mit gondoljon. A .com-os verziót nem is veszi külön domainek, mivel a domainre mutató linkeknél is a .hu verzió linkjeit mutatja, és ugyan azt a pr értéket.

Egy biztos, a .com-ról szedd le a .hu-ra mutató linkeket, és maximum csak egyet hagyj meg, ami a magyar nyelvmű oldalra mutat. Továbbá szerezz több linket .com oldalra, ha azt is nyomatni akarod.

Javíthat a helyzeten még az is, hogy a .com verziót nem magyarországon hostolod.

találati rangsor

2007. 05. 17. 09:46 · OldalGazda →

Aggodalomra semmi ok: jó úton jársz: csináld meg, hogy teljes legyen az angol fordítása az oldalnak, aztán az angol nyelvű katalógusokba, egyéb oldalakon a .com-os verziót nyomjad, a magyar nyelvű katalógusokban pedig a .hu-s verziót. Ha a magyar verzió egyértelműen prioritást élvez, akkor szerintem csak az angol nyelvű webhelyről mutassanak linkek a magyar webhelyre, a magyar webhelyről pedig egyáltalán ne, vagy ha szükség van rá, akkor keresők által nem értékelt formában helyezz el a magyar oldalról az angol oldalra mutató linket. (pl. onclick esetén működésbe lépő JavaScript segítségével, Flash-sel, stb.). Ja, és próbáld ki, hogy mi lesz, ha az angol oldalról a magyarra mutató link felirata (Linkre rakott kulcsszavak) számodra fontos kulcsszót tartalmaz, plusz mi lesz akkor, ha ez a link az angol site minden egyes weblapjáról hivatkozik a magyar nyitóoldalra pl.

találati rangsor

2007. 05. 17. 11:08 · mocivince →

Köszönöm a tanácsokat, valószínű, hogy egy kicsit elsiettem az angol oldal felrakását...Mindenesetre bíztató, hogy nem rontottam el teljesen. Még egy kérdésem van "Gabber" hozzászólásával kapcsolatban. Mivel az a célom, hogy teljesen külön úton járjon a két oldal, egy az angol Google számára, egy a magyar nyelvű találatoknak, akkor jelenthet-e hátrányt, hogy pl. a képek ugyanonnan töltődnek be - jelen esetben a magyar oldal egy könyvtárából. És az oldal jellegéből fakadóan rengeteg kép van. Tehát érdemes lenne-e az egészet duplázni, vagy ennyi átfedés nem jelent gondot?+1 kérdés: van-e igazság abban, hogy az angolszász országokban inkább a Yahoo-t preferálják? Mégegyszer kösz a válaszokat, manapság meglepő tapasztalat, ha vadidegen emberek segítenek önös érdek nélkül...

Re: találati rangsor

2007. 05. 17. 11:33 · OldalGazda →

A képekkel kapcsolatban egy eléggé speciális kérdést tettél fel. Arról, hogy a [Google Képkereső] hogyan rangsorolja a képeket abban az angol illetve magyar keresőkifejezésekre, ha a képek forrása ugyanaz, viszont különböző weboldalakon, különböző szövegkörnyezetben jelennek meg, szerintem nem nagyon fog senki sem tudni érdemlegeset mondani. Ha nem tervezel elmélyedni a Nagyipari kereső-optimalizálás világában, akkor még akár nem is jelenthetne akkora gondot, hogy ez a felállás, de amennyiben nem jelent különösebb anyagi terhet, én azért az egyszerű, tiszta képlet miatt az angol szájt képeit az angol szájt alól raknám be, és nem a magyar alól.Az pedig nem igaz, hogy az angolszász országokban Yahoo! keresőt preferálnák. Az viszont inkább igaz, hogy szemben Magyarországgal, nem szinte kizárólag Google-t használnak, hanem jelentékeny gyakorisággal Yahoo!-t, Live keresőt és az elvetemültebbek talán még az Ask.com keresőt is.

h2o

2007. 07. 21. 09:29 · Névtelen hozzászóló →

Figyeljetek!! Ez nem spam honlap?? programozo-allas.blogspot.comAllast kerestem a neten, es ez jott ki. eleg magasan. Nem lehet ezt bekuldeni a Google-nak??

h2o

2007. 07. 21. 15:46 · Névtelen hozzászóló →

"Nem lehet ezt bekuldeni a Google-nak??"Zavar, ha valaki pénzt keres?

h2o

2007. 07. 21. 16:07 · Névtelen hozzászóló →

Re: h2o

2007. 07. 21. 16:11 · Névtelen hozzászóló →

Határeset, bár mondjuk senki sem tiltja, hogy értéktelen szar oldalakat csinálj... A Blogger esetén egyszerűen közölheted a Google-vel a kételyeidet: csak nyomd meg a Blogger fejlécben található Flag Blog gombot, és nem kell semmi mást csináljál, már tudattad is a fenntartásaid a GOogle-vel...

:)))

2007. 07. 23. 18:28 · Névtelen hozzászóló →

ingyen_letoltes.blogter.hu/

a cikkeket nyissátok meg, >>> többet is 🙂

Re: :)))

2007. 07. 24. 04:21 · Névtelen hozzászóló →

Ezt hol találtad? ingyen_letoltes.blogter.hu/

:)))

2007. 07. 24. 09:52 · Névtelen hozzászóló →

ingyen_letoltes.blogter.hu/

A Google már szinte minden keresésre kidobja. 🙁

h2o

2007. 07. 24. 10:24 · Névtelen hozzászóló →

Olvasgattam az oldalt (programozo-allas.blogspot.com) és végülis állást ajánl a gyerek egy jó programozónak.Gondolom a reklámbevételeit akarja növelni remélhetőleg értékes tartalmak fejlesztésével.Amúgy meg olyan típusnak tűnik, aki már gondolkodás közben is kulcsszavakat használ és az agyában kulcsszó szerint keres, közben figyelmen kívül hagyva a "flashback"-ként bevillanó adsense hirdetéseket. 😀

Re: :)))

2007. 07. 25. 12:54 · OldalGazda →

Lassan azt hiszem nyithatnánk egy új bejegyzést "Érdekes oldalak" címmel...

Spam oldalak

2007. 07. 27. 11:55 · Névtelen hozzászóló →

Itt a legújabb spam site: ingyenes.blogspot.comAz egész egy átverés és csak az adsense-ről szól!

Spam oldalak /ingyenes/

2007. 07. 30. 02:07 · Névtelen hozzászóló →

Ez közel sem mfa oldal. Felül van egy pár adsense hirdetés, szinte észre sem veszi az ember. A többi link pedig a külső, ajánlott oldalakra mutat. /Olyanokra, ahonnan ráadásul már én is kaptam ingyen cuccot, pl: ferraris matrica)

Ismét

2007. 09. 30. 06:06 · Névtelen hozzászóló →

Ismét:

ingyendvd.blogter.hu

ingyenletoltes.blogter.hu

Spam oldalak

2007. 09. 30. 13:22 · Névtelen hozzászóló →

Hihetetlen, hogy a magyar ember mire nem képes, csak hogy dolgoznia ne kelljen! :-)Ezt a Made For Adsense farmot lessétek meg:

clicknread.googlepages.comclicknread.googlepages.com/cheatclicknread.googlepages.com/cheat2clicknread.googlepages.com/cheat4clicknread.googlepages.com/cheat22clicknread.googlepages.com/onlineprofit22clicknread.googlepages.com/online-profitingyenjatek.googlepages.comingyenjatek.googlepages.com/ingyenesfps222ingyenjatek.googlepages.com/ingyenesstrategiaingyenjatek.googlepages.com/ingyenesfpsingyenjatek.googlepages.com/ingyenesfps3ingyenjatek.googlepages.com/ingyenesfps22ingyenesjatekok.blogter.hu

Nulla tartalom és adsense hirdetések ezerrel, természetesen jól összelinkelve!Az ilyeneket miért nem zárja ki a google?

Spam oldalak

2007. 09. 30. 13:24 · Névtelen hozzászóló →

Bocsi az előző összecsúszott... Tehát:

Hihetetlen, hogy a magyar ember mire nem képes, csak hogy dolgoznia ne kelljen! :-)Ezt a Made For Adsense farmot lessétek meg:

clicknread.googlepages.com

clicknread.googlepages.com/cheat

clicknread.googlepages.com/cheat2

clicknread.googlepages.com/cheat4

clicknread.googlepages.com/cheat22

clicknread.googlepages.com/onlineprofit22

clicknread.googlepages.com/online-profit

ingyenjatek.googlepages.com

ingyenjatek.googlepages.com/ingyenesfps222

ingyenjatek.googlepages.com/ingyenesstrategia

ingyenjatek.googlepages.com/ingyenesfps

ingyenjatek.googlepages.com/ingyenesfps3

ingyenjatek.googlepages.com/ingyenesfps22

ingyenesjatekok.blogter.hu

Nulla tartalom és adsense hirdetések ezerrel, természetesen jól összelinkelve!Az ilyeneket miért nem zárja ki a google?

spam oldalak

2007. 09. 30. 14:38 · btamas →

Véleményem szerint ezek az oldalak összesen hoznak napi 1 dollárt. vagy annyit sem.

MFA

2007. 10. 01. 03:57 · Névtelen hozzászóló →

Engem az MFA nem annyira zavar. Mint látogató persze utálom, ha egy oldalon nem azt találom amit kerestem. De mint hirdetőnek meg nem olyan rossz, mert ez is egy látogatót hoz, olyat aki azért tévedt az MFA oldalra mert keresett valamit. Azthiszem csak az irigység miatt haragszanak rájuk.

Az egymásra linkelgető társaságok sokkal nagyobb kárt jelentenek. Azokat viszont ténylegesen is büntetni kellene.

MFA és BHS

2007. 10. 01. 04:47 · Névtelen hozzászóló →

Valahol azért mindenki jól jár ezekkel az oldalakkal - még ha nehéz is ezt bevallani. Google: hirdetést jelenít meg témareleváns oldalon, rákattintás után bevétele származik. Hirdető: kifejezetten a témára kereső-kutató látogatót kap a hirdetés útján, ergo: lehet, hogy ügyfelet. Hirdetésmegjelenítő: bevétele van belőle. A hirdetőnek meg tök mindegy, hogy MFA oldalról, vagy az index.hu-ról jön az az ügyfél, mert szerintem úgysincs nagy eltérés a kettő között abból a szempontból, hogy melyikből lesz ügyfél és melyikből nem. Mielőtt folytatnám a véleményemet, csak közlöm, hogy nekem NINCS MFA oldalam, mert mindig is értékes tartalom megjelenítésére törekedtem (más szempontból is nagyon jó ez a stratégia, nem csak google bevétel szempontjából). Szóval - valahol béna ez a feljelentgetősdi gyerekek. Engem is irritál néhány spam oldal, de ettől függetlenül nem kezdek el jómagyar szokás szerint feljelentgetni. Attól nem leszek több és jobb, nem lesz több bevételem, és a google-nek meg biztos megvan az eszközparkja, hogy ilyen "szorgalmas" emberkék nélkül is szabályozni tudja a piacát. A szorgalmas szót szért tettem macskakörmök közé, mert szerintem igazából akinek érdeke lehet itt feljelentgetni, az olyan - szintén valamilyen szinten MFA oldallal rendelkező - megjelenítő, akinek az üzletét zavarja a feljelentett oldal, és valahogy így próbálja kitiltatni a keresőkből (merthogy a kulcsszóra előrébb van a feljelentett oldal, mint az övé). Ezzel a mondatommal meg akár már a Black Hat SEO rovatba is írhattam volna, mert aki a fentebb említett módon halad előre, azt bizony ekként tisztelhetjük.

Re:MFA és BHS

2007. 10. 03. 11:30 · OldalGazda →

Szerintem ezt ne vedd feljelentgetésnek: ennek az oldalnak a témaköreihez igenis hozzátartoznak a Made for AdSense oldalak. Ráadásul az előző hozzászólásban bemutatott "hálózat" kifejezetten a kispályás kategóriába tartozik, ahol nincs is értelme a feljeletgetésnek. Egyébként meg számomra szimpatikus lenne egy olyan társadalom, ahol nemcsak az állami/erőszakszervezetek tesznek meg mindent az írott és közvetve az íratlan szabályok betartásáért és az effajra vadhajtások nyesegetéséért, hanem az egyének is. Ha nem tetszett a hozzászólónak, amit látott, hát posztolja ide nyugodtan, és ha Neked ez nem tetszik, hát Te is nyugodtan fejtsd ki a véleményed. 🙂

Splog - szemét generálása weblog segítségével

Spam blognak, vagy Splognak hívják azokat blogokat, melyeket gazdája automatizált módon tölt fel információval, ami gyakorlatilag szemét. Származhat ez RSSAbrakokból, Google Alerts e-mailokból, stb. Elterjedésük egyes vizsgálatok szerint hatalmas méretet öltött például a Blogspot oldalain, ahol akár a blogok 40-60 százalékát is az ilyen szemét teheti ki. Elterjedésük oka az, hogy rendkívül egyszerűen, költség nélkül létrehozhatóak, és feltöltésük aakár e-mail segítségével is lehetséges, ami tág teret nyit az automatizált megoldásoknak.

Harc a spam blogok ellen

http://www.kailashnadh.name/docs/spam_blog/spamblog_hypothesis.html

A fenti oldalon leírást találhatunk a szemétblogok általános jellemzőiről, az ellenük való küzdelem lehetőségeiről.

Spamblog határeset

Vannak olyan blogok, melyek első látásra spamblognak nézhetnek ki, azonban van funkciójuk: Ilyen határeset például a http://webkettes.blogspot.com/ címen üzemelő blog, mely automatikusan töltődik fel a webni.innen.hu új oldalainak és hozzászólásainak tartalmával. Első látásra ez sima tartalom-duplikálásnak tűnhet, azoban mivel az itteni tartalom folyamatosan változik, az aktualitását vesztett hozzászólások törlődnek, ezért ez az oldal az archívum szerepét tölti be.

Blogspot: több spam, mint bármi más

http://blog.outer-court.com/archive/2005-08-29-n40.html : Leírás arról, hogy véletlenszerűen felkínált blogok között mennyi volt az, amit Web spamnak lehet nyilvánítani.

OldalGazda: A Blogger automatikusan képes detektálni a spamblog gyanús eseteket. Történt például, hogy Komment spam támadás érte ezt az oldalt, és mivel az összes hozzászólás automatikusan továbbításra került a blogger által üzemeltetett http://webkettes.blogspot.com/ oldalra, ezért egyes esetekben visszaküldte a rendszer a levelet, egy idő után pedig az automatikusan továbbított bejegyzések csak Draft, tehát vázlat állapotban kerültek a rendszerbe, ami azt jelentette, hogy csak a captcha-k, tehát a furcsa képekben kijelzett karakterek begépelésével, egyenként lehetett publikálni az amúgy magától bekerült bejegyzéseket. Az egyik ilyen captcha mellett megjelenő kérdőjelre kattintva lehetett kérni az oldal megítélésének, hátrányos megkülönböztetésének megszüntetését. Minderre a kérelem elküldése utáni bő egy héttel került sor, és erről gépi válaszlevél tájékoztatott.

A „Spam blog” című bejegyzést 2005. 10. 12. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2008. 06. 13., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások

Visszaélés a rendszeben rejlő szabadsággal

A Wiki spam a Wiki alapfilozófiájával való visszaélés, természeténél fogva a Komment spam egyik alfaja. Mivel bárki szabadon szerkesztheti az oldalakat, nagyon könnyű külső linkeket létrehozni akár automatikusan is: csupán az adott Wiki által használt leíró nyelvet (markup language) kell ismerni. Elméletileg a Wiki spam-ot észlelő első látogató egyszerűen kitörölheti a nem odavaló tartalmat, ezáltal megszüntetve a spam-et, helyreállítva az oldal minőségét az oldal fenntartóinak beavatkozása nélkül. Gyakorlatilag például a Wikipédia ennél is tovább megy, és egyes nyelvi változataiban (zömében a kevesebb látogatóval, felhasználóval bíró változatoknál, mint pl. a magyar) rel="nofollow" attribútum segítségével jelöli meg az összes külső linket.

Védekezés a wikispam ellen

A Wiki spam ellen a rendszer konfigurálásával is lehet védekezni: például a lapok tartalmának módosításról küldött értesítések engedélyezésével, vagy bizonyos kifejezések letiltásával: ez utóbbi esetben a tiltott kifejezéseket tartalmazó szerkesztéseket nem engedi elmenteni a rendszer. Kisebb, kevesebb lappal rendelkező, alacsonyabb forgalmú oldalaknál ez még megfelelő, de nagyobb lapoknál lehetetlen lenne az összes szerkesztést így követni, nincs is igazán jó megoldás a kiküszöbölésére. Segíthet még, ha nem olyan elterjedt (és a spammelők által ismert) wiki rendszerrel készül az oldal, vagy nem angol nyelvű a wiki, így az automatizált spambot-ok nem találnak rá az oldalra, illetve egy nyelvi régió internetes kultúrájának alacsony szintje is biztosíték lehet a Wiki spam ellen.

A „Wiki spam” című bejegyzést 2005. 04. 05. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2007. 08. 15., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások

Webstatisztika szennyezése

A nyilvános Látogatottsági statisztika elérhető a Keresőrobotok számára is, PageRank értékkel rendelkezik, tehát az innen mutató hivatkozások is értékesek lehetnek. A legtöbb webstatisztikai rendszer kijelzi ha nem is az összes hivatkozó oldalt, de azt igen, hogy mely oldalakról érkezett a legtöbb látogató, és ezekre az oldalakra mutató linket is elhelyez a statisztikai oldalon.

A fentiek miatt éri meg sokszor "meglátogatni" az oldalt, persze nem feltétlenül kézzel, hanem automatizálva, valamilyen szkript segítségével, mindeközben a REFERRER-ben (lásd: WikiPedia:Referrer) azt állítva, hogy egy nemlétező külső linkről érkezett a "látogató". Ekkor a referrer spam-ot használó oldala feltűnhet a legtöbb látogatót hozó oldalak listájában, a saját Külső hivatkozás számát illetve PageRank értékét növelve. Az sem baj, ha esetleg még nem tudnak a keresők az adott, jelszóval nem védett statisztikáról, mivel ez egy rámutató hivatkozást is megérhet a spammelő számára.

A Látogatottsági statisztika spammelése azért káros, mert feleslegesen terheli a webszervert, teleszemeteli a statisztikát, ezzel megnehezíti az adatok kiértékelését. Ha szándékunkban állt kijelezni, és linkkel díjazni a ránk legtöbbet hivatkozó oldalakat, akkor pedig jogtalanul élvezi az ezzel járó előnyöket a referrer spam felhasználója.

Referrer spam elleni védekezés

Nem feltétlenül egyértelmű, hogy egy adott referer valós, vagy sem, de pl. gyanús lehet, ha a statisztika egyik napról a másikra egy ismeretlen oldalról érkező egy-két száz látogatót jelez ki. Soha ne értesítsük a spammereket a statisztikánk meglétéről és hollétéről, ezért soha ne kattintsunk a statisztikai oldalunkról mutató hivatkozásokra. Másoljuk inkább ki, és másoljuk be a böngésző címmezőjébe, így ellenőrizve minden egyes új efektív külső hivatkozást.

Legegyszerűbben úgy lehet védekezni a referrer spam ellen, ha nem tesszük nyilvánossá az oldal statisztikáját. Emellett még léteznek különféle script-ek, melyek feldolgozzák a szerver logfájlját, és kiszűrik a referrer spam-et.

Finomabb módszerek

Léteznek még olyan webmesterek, akik bár nem bombáznak szkriptekkel oldalakat, de úgy állítják be böngészőjüket, hogy bármilyen oldalt is látogassanak meg, az azt jelezze a meglátogatott webszervernek, hogy ők bizony egy adott oldalról (értelemszerűen a webmester aktuális szíve csücskét jelentő oldalról) érkeztek. Ha pedig valaki az általuk meglátogatott oldalak tulajdonosai közül a Tudatos webfejlesztés műfaját űzve rendszeresen figyelemmel kíséri a statisztikáit, akkor azért ha mást nem, kíváncsiságból felkeresi az oldalt, hogy eldöntse, valós vagy állinkről van-e szó.

A „Referrer spam” című bejegyzést 2005. 04. 04. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2006. 12. 09., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások

Visszaélés a hozzászólás szabadságával

A modern weboldalon lehet hozzászólásokat is elhelyezni, praktikusan mindenféle regisztráció nélkül, máskülönben gyakorlatilag senki sem szólna hozzá az oldalakhoz. A hozzászólásokban sok helyen linkeket is meg lehet adni, melyekkel más oldalakra mutató Külső hivatkozásokat lehet generálni. Ilyen oldalak példálul a fórumok, vendégkönyvek, Wikik, de leginkább a Weblogokat sújtja a jelenség, mert itt már elérik az oldalak azt a kritikus tömeget, ahol már automatizált módszereket is érdemes bevetni a spammelésre, másrészt pedig a Szabadszavas keresők általában nagyra értékelik a Weblogokat.

A fenti lehetőségekkel való visszaélést nevezik comment spam-nek (blog spam, link spam, illetve speciális változata a Wiki spam): Elő lehet állítani kézzel, egyenként vagy automatizálva, különösen az elterjedt Tartalomkezelő rendszerekkel való visszaélésre, mint például a Movable Type Weblog-motor.

Ha a komment spamnelés még kismértékű, akkor kézzel is lehet küzdeni ellene, ha már nagyobb méreteket ölt, akkor egyrészt le lehet tiltani a megfelelő HTML tagokat, ezáltal megakadályozva a külső linkek létrehozását, másrészt a Keresőrobotok számára Problémás technológiák kreatív felhasználásával is létre lehet hozni a külső hivatkozásokat. (JavaScript-be ágyazva a hivatkozást, vagy a hivatkozást átirányítással elérhetővé téve.) Továbbá a rel="nofollow" attribútum használata is megoldás lehet. Az automatikus comment spam-melést pedig plusz kérdések megválaszoltatásával vagy úgynevezett captcha (pixeles formátumban torzítva megjelenített alfanumerikus kódok) felhasználásával lehet letörni. (A http://www.kkovacs.hu/item/1121#comments oldalon egy érdekes megoldást láthatunk, mely kihasználja, hogy a comment spammerek nagyja nem ért magyarul 🙂

A komment spam-mel és az ellene való küzdelem lehetőségeivel kapcsolatos legfontosabb tudnivalókról az alábbi oldalon olvasható egy átfogó cikk a Movable Type készítőinek tollából: http://www.sixapart.com/pronet/comment_spam

Példa Comment Spam-ra

  <a href="http://globalguestpoll.com/vote.cgi?handle=PHENONLINE">phentermine</a> [url= http://globalguestpoll.com/vote.cgi?handle=PHENONLINE ]phentermine[/url] <a href="http://globalguestpoll.com/vote.cgi?handle=VIAGRABUY">viagra</a> [url= http://globalguestpoll.com/vote.cgi?handle=VIAGRABUY ]viagra[/url] <a href="http://globalguestpoll.com/vote.cgi?handle=CASINOGAME">online casino</a> [url= http://globalguestpoll.com/vote.cgi?handle=CASINOGAME ]online casino[/url] <a href="http://globalguestpoll.com/vote.cgi?handle=POKERROOM">online poker</a> [url= http://globalguestpoll.com/vote.cgi?handle=POKERROOM ]online poker[/url] <a href="http://gbooks.melodysoft.com/easyslim">adipex</a> [url= http://gbooks.melodysoft.com/easyslim ]adipex[/url] <a href="http://gbooks.melodysoft.com/beslim">phentermine</a> [url= http://gbooks.melodysoft.com/beslim ]phentermine[/url] <a href="http://www.bloglines.com/blog/beslim">phentermine</a> [url= http://www.bloglines.com/blog/beslim ]phentermine[/url] <a href="http://www.bloglines.com/blog/viabest">viagra</a> [url= http://www.bloglines.com/blog/viabest ]viagra[/url] <a href="http://www.bloglines.com/blog/greatgamble">online poker</a> [url= http://www.bloglines.com/blog/greatgamble ]online poker[/url] <a href="http://www.bloglines.com/blog/gamecasino">online casino</a> [url= http://www.bloglines.com/blog/gamecasino ]online casino[/url] <a href="http://ouroboros.uaa.alaska.edu:8000/MorphoGenesis/6">viagra</a> [url= http://ouroboros.uaa.alaska.edu:8000/MorphoGenesis/6 ]viagra[/url] <a href="http://ouroboros.uaa.alaska.edu:8000/MorphoGenesis/5">phentermine</a> [url= http://ouroboros.uaa.alaska.edu:8000/MorphoGenesis/5 ]phentermine[/url] <a href="http://ouroboros.uaa.alaska.edu:8000/MorphoGenesis/7">online casino</a> [url= http://ouroboros.uaa.alaska.edu:8000/MorphoGenesis/7 ]online casino[/url] <a href="http://ouroboros.uaa.alaska.edu:8000/MorphoGenesis/8">online poker</a>[url= http://ouroboros.uaa.alaska.edu:8000/MorphoGenesis/8 ]online poker[/url] <a href="http://pbl.cc.gatech.edu/psych7101/45">Online Poker</a> [url= http://pbl.cc.gatech.edu/psych7101/45 ]Online Poker[/url] <a href="http://pbl.cc.gatech.edu/psych7101/46">Online Casino</a> [url= http://pbl.cc.gatech.edu/psych7101/46 ]Online Casino[/url] <a href="http://pbl.cc.gatech.edu/psych7101/44">Viagra</a>[url= http://pbl.cc.gatech.edu/psych7101/44 ]Viagra[/url] <a href="http://pbl.cc.gatech.edu/psych7101/43">Phentermine</a> [url= http://pbl.cc.gatech.edu/psych7101/43 ]Phentermine[/url] <a href="http://mybody.typepad.com/phentermine">phentermine</a> [url= http://mybody.typepad.com/phentermine ]phentermine[/url] <a href="http://phenonline.blogs.eurosport.com">phentermine</a> [url= http://phenonline.blogs.eurosport.com ]phentermine[/url] <a href="http://viagra4u.blogs.eurosport.com">viagra</a> [url= http://viagra4u.blogs.eurosport.com ]viagra[/url] <a href="http://pokergames.blogs.eurosport.com">online poker</a> [url= http://pokergames.blogs.eurosport.com ]online poker[/url] <a href="http://casinogame.blogs.eurosport.com">online casino</a> [url= http://casinogame.blogs.eurosport.com ]online casino[/url] <a href="http://eteamz.active.com/seo-resources/files/seo.html">Seo</a> [url= http://eteamz.active.com/seo-resources/files/seo.html ]Seo[/url] <a href="http://eteamz.active.com/seo-resources/files/seo.html">link exchange</a> [url= http://eteamz.active.com/seo-resources/files/seo.html ]link exchange[/url] <a href="http://eteamz.active.com/seo-resources/files/seo.html">automatic link exchange</a> [url= http://eteamz.active.com/seo-resources/files/seo.html ]automatic link exchange[/url] <a href="http://eteamz.active.com/seo-resources/files/seo.html">link popularity</a> [url= http://eteamz.active.com/seo-resources/files/seo.html ]link popularity[/url] <a href="http://eteamz.active.com/seo-resources/files/seo.html">page rank</a> [url= http://eteamz.active.com/seo-resources/files/seo.html ]page rank[/url] <a href="http://eteamz.active.com/seo-resources/files/seo.html">web site promotion</a> [url= http://eteamz.active.com/seo-resources/files/seo.html ]web site promotion[/url] <a href="http://eteamz.active.com/seo-resources/files/seo.html">free link exchange</a> [url= http://eteamz.active.com/seo-resources/files/seo.html ]free link exchange[/url] <a href="http://eteamz.active.com/seo-resources/files/seo.html">search engine optimization</a> [url= http://eteamz.active.com/seo-resources/files/seo.html ]search engine optimization[/url] joolj2o3-103987863

A fenti spam-ben az a "jó", hogy gyakran szpemmelt kifejezésekkel van tele, amit a legegyszerűbb spam filterekkel blokkolni. Egyesek azonban kihasználják a Google abbéli képességét, hogy az elérési útvonalban szereplő egybeírt kifejezéseket képes részekre bontani és ekképpen értékelni, így a filter által könnyen felismerhető szavakat egy kicsit nehezebb azonosítani. Érdemes megfigyelni a komment spamot lezáró egyedi azonosító kódot, mely segítségével a kedves szpemmelő visszakeresheti, hogy melyek voltak azok az oldalak, ahol a spam meg tudott maradni, tehát ahová érdemes visszatérni...:

  <a href="http://www82.adluvio.net/suoneriapolifonicacellularegratis/"> suoneriapolifonicacellularegratis </a>  http://www1644.dannidicervello.com/viaggidelmappamondotoscana/   <a href="http://www69.attesa.net/sentenza/"> sentenza </a>   <a href="http://www1194.dannidicervello.com/natashastefanenko/"> natashastefanenko </a>  http://www2653.unanuovavolta.com/offertavologrecia/  <a href="http://www342.adluvio.net/venditaonlinehardware/"> venditaonlinehardware </a>  <a href="http://www297.nubibianche.com/viennacosefare/"> viennacosefare </a>  http://www2257.nubibianche.com/coppiacerca/  <a href="http://www28.uomodelferro.com/libretto/"> libretto </a>  <a href="http://www292.adluvio.net/attrezzaturasportivecalcio/"> attrezzaturasportivecalcio </a>  http://www1256.sanguinante.com/backpacks/   <a href="http://www2804.dannidicervello.com/annuncionautica/"> annuncionautica </a>   <a href="http://www1794.dannidicervello.com/serenagrandiit/"> serenagrandiit </a>  http://www1490.soddisfare.com/elettrodomesticorex/   <a href="http://www666.sanguinante.com/motoreminarelli/"> motoreminarelli </a>   <a href="http://www1094.dannidicervello.com/singstar/"> singstar </a>   http://www2015.maniinsu.com/notteoscar2006/  <a href="http://www511.stampabile.net/immaginiarredamentocasa/"> immaginiarredamentocasa </a>   <a href="http://www1596.sanguinante.com/barbecuegas/"> barbecuegas </a>   http://www2644.dannidicervello.com/brazilgirl/  <a href="http://www70.soddisfare.com/cuculo/"> cuculo </a>  <a href="http://www1040.soddisfare.com/ufficiosantander/"> ufficiosantander </a>  http://www2566.sanguinante.com/coverxdvd/   <a href="http://www2413.unanuovavolta.com/fringuello/"> fringuello </a>   710A707E65E7B4E094...beírtam, hogy ne találjanak rá...B30AD2F5DC009AA0DA1859

A „Komment spam” című bejegyzést 2005. 04. 04. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2006. 12. 09., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások

anna

2006. 02. 22. 03:00 · Névtelen hozzászóló →

pikhoved ^@^ pikk ^@^ pikk i ^@^ pimple on vagina ^@^ pinkie ^@^ pinky ^@^ pinky finger ^@^ pizde ^@^ plasma tv ^@^ play tv

Keresőoldalak találati listáinak szennyezése

A web spammelésének nem sok köze van a "hagyományos" email spam-hoz, még sincs rá jobb szó. Talán a webszennyezés lenne a legjobb kifejezés: a web spam (kereső spam) célja a kereső programok félrevezetése, az arra "méltatlan" oldalak találati ranglistán előkelő helyekre juttatása, elszennyezve ezzel a Találati rangsorokat A sok érdektelen, haszontalan oldal exponálásával megnehezítik a Céltudatosan kereső felhasználók életét, így a keresőoldalak és a keresők felhasználói egyaránt károsultjai a webszennyezésnek. Az előbbieknek folyamatosan kötik le erőforrásait a web spamet használó oldalak kiszűrésére tett újabb és újabb erőfeszítések, az utóbbiak pedig egyre nehezebben találnak rá az őket érdeklő, hasznos oldalakra. Egyes témában, a Weben legelterjedtebb nyelveken akkora a spammelés mértéke, hogy az már komolyan nehezíti a keresést. A web szennyezése az e-mail spammel ellentétben nem illegális tevékenység.

A web spam célja az, hogy minél több, a céloldalakra mutató Külső hivatkozást hozzon létre, illetve a céloldalakra mutató Linkre rakott kulcsszavaksegítségével az egyes Kereső-kifejezésekkel kapcsolatban jó helyezésre hozza fel a céloldalt a Találati rangsorokban.

A keresőspam módszerei, eszközei

  • Saját oldalakon automatizált megoldásokkal (értelmetlen) tartalom generálásása. Nagyszámú weblap létrehozásával és megfelelő linkelésével a PageRank értéket felturbózva a [Link spam]melés szempontjából értékes hivatkozó oldalak hozhatóak létre. Ezek az oldalak formailag sokszor blogok, melyeknek előfordulási aránya egyesek szerint megdöbbentő méreteket ölt: http://www.geektronica.com/2005-06-30-the-strange-world-of-blogspot-spam-blogs
  • Lejárt domainnevek megvásárlása és újraaktiválása azok PageRank értékének kihasználására (A használaton kívüli oldalakra sokszor továbbra is számos értékes hivatkozás mutat, a hivatkozó oldalak, katalógusok aktualizálásának hiánya miatt.)
  • visszaélés mások oldalaival: Komment spam, Wiki spam, Referrer spam formájában külső hivatkozásokat generálva.

Web spam fajtái

Link Spam: visszaélés a weblapok számával

Minden weboldal létezése révén, alanyi jogon kap egy szavazatot a weblapok általános fontosság szerinti Rangsorolása során (lásd például PageRank technológia). Ezzel a körülménnyel élnek vissza a linkspammerek, amikor olyan webhelyeket hoznak létre, melyeken rengeteg automatikusan generált weboldal található értelmetlen, haszontalan tartalommal (Lásd a Példa keresőspam-re cikket). Nagyszámú weblap megfelelő összelinkelése esetén például magas PageRank értékeket adhatnak át ezek a Linkfarmnak is nevezett weblap-komplexumok más, értelemmel bíró webhelyeknek, közvetve javítva így azok helyezéseit a Találati rangsorban.

A témában való további elmélyüléshez jó kiindulópontként szolgálhat Benczúr A. András, Csalogány Károly, Sarlós Tamás és Uher Máté angol nyelvű publikációja: SpamRank - Fully Automatic Link Spam Detection (130 kilobájtos PDF fájl)

A „Web spam” című bejegyzést 2005. 02. 27. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2006. 12. 09., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások