Számold az oldalmegtekintéseket, ne a látogatókat. Adatvédelmet előtérbe helyező webanalitika, az EU-ban biztonságosan tárolva.
NYÍLT BÉTA
Számold az oldalmegtekintéseket, ne a látogatókat. Adatvédelmet előtérbe helyező webanalitika, az EU-ban biztonságosan tárolva.

Nyílt Forráskódú Felhasználói Ügynök Kereső Táblázat

Nyílt forráskódú adathalmaz a felhasználói ügynökök lekérdezéséhez, kiszámítható viselkedéssel. JSON-alapú, emberi felülvizsgálatú, és gyakorlati analitikai célokra tervezve.
Ez az oldal angolról le lett fordítva a rendkívül motivált AI-gyakornokaink közreműködésével az Ön kényelméért. Még tanulnak, így előfordulhat, hogy néhány hiba becsúszott. A legpontosabb információkért kérjük, tekintse meg az angol verziót.
Otthon Nyílt Forráskódú Projektek Nyílt Forráskódú Felhasználói Ügynök Kereső Táblázat

Ez a repó tartalmaz egy normalizált, gondosan válogatott felhasználói ügynök-stringek adatkészletét, amely JSON fájlokként van tárolva, és úgy tervezték, hogy lekérdezési táblaként használható legyen az egyszerű felhasználói ügynök adatok meghatározásához, például a felhasználói ügynök kliens és az operációs rendszer.

A PageviewsOnline komponenseként használják, de itt általános célú felhasználásra van közzétéve.

Az adatkészletet egyszerű segédszkriptek egészítik ki, amelyek az adatok érvényesítésére szolgálnak, és lehetővé teszik azok exportálását más formátumokba vagy programozási nyelvekbe (például Java).

Projektfilozófia

Ennek a projektnek a célja nem egy tévedhetetlen vagy tökéletesen pontos felhasználói ügynök-észlelő rendszert nyújtani, hanem inkább egy pragmatikus, a legjobb erőfeszítésekre támaszkodó megoldást, amely idővel a valós használat és a közösségi hozzájárulások révén javul.

A felhasználói ügynök-észlelés alapvetően nem tökéletes. A teljes pontosság hajszolása helyett ez a projekt arra törekszik, hogy legyen:

  • Gyakorlati
  • Karbantartható
  • Átlátszó
  • Valós világbeli analitikára és osztályozásra elég jó

A pontosság idővel javul a válogatott frissítések, a valós használat és a közösségi hozzájárulások révén.

A heurisztikus értelmezés és a bonyolult reguláris kifejezések gyakran feláldozzák a kiszámíthatóságot a marginális pontosságért.

Ez a projekt előnyben részesíti:

  • Átláthatóság a varázslat fölött
  • Kiválogatott adatok a rejtett logika helyett
  • Magyarázható eredmények a spekulatív észlelés helyett

Funkciók

  • Normalizált, ember által felülvizsgált felhasználói ügynök-adatállomány
  • Egyszerű és kiszámítható lekérdezési viselkedés
  • JSON-alapú formátum, könnyen áttekinthető és verziókövethető
  • Könnyű validációs szkriptek
  • Más nyelvekhez exportáló segédeszközök (pl. Java)
  • Éles SaaS-környezetben Aktívan Használják

Normalizált Felhasználói Ügynök-Karakterláncok

A projekt elsődleges célja, hogy a User-Agent-szövegekből gyors és kiszámítható módon magas szintű, stabil információkat nyerjen ki.

Ennek érdekében minden User-Agent-sor normalizálva van a feldolgozás előtt. A normalizálás eltávolítja a bizonytalan variációkat (például verziószámokat és a nagybetű- és kisbetű-különbségeket), miközben megőrzi a felhasználói ügynök szerkezetét és szemantikai jelentését.

A felhasználói ügynök-karakterláncokat a következő lépések szerint normalizáljuk:

  • Cseréld ki az összes numerikus számjegyet (0-9) a helyettesítő karakterre, azaz x-re. Ez a verzióváltozások okozta zajt megszünteti, miközben megőrzi a tokenek szerkezetét és hosszát.
  • Változtasd meg az egész sztringet kisbetűssé. A User agent tokenek a konvenció szerint kis- és nagybetű-függetlenek, és a kisbetűsítés biztosítja a konzisztens és megbízható lekérdezéseket.

Például a következő User-Agent-sor:

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/143.0.0.0 Safari/537.36

Normalizálva:

mozilla/x.x (windows nt xx.x; winxx; xxx) applewebkit/xxx.xx (khtml, like gecko) chrome/xxx.x.x.x safari/xxx.xx

Ez a normalizációs megközelítés megkönnyíti a felhasználói ügynökök csoportosítását, összehasonlítását és karbantartását az idő múlásával, miközben elegendően pontos marad a magas szintű kliens- és operációs rendszer osztályozásához.

A verzióspecifikus és kis- és nagybetűkre vonatkozó eltérések kiküszöbölésével a lekérdezési folyamat kiszámíthatóbbá válik, és ellenállóbb a jövőbeli felhasználói ügynök-változásokkal szemben.

Adat Formátum

Minden normalizált User-Agent bejegyzés tartalmazza:

  • id - A normalizált felhasználói ügynök karakterlánca
  • client_family - Magas szintű kliens-osztályozás (pl. böngésző, bot, alkalmazás)
  • os_family - Magas szintű operációs rendszer osztályozása

A pontos mezők idővel változhatnak, ahogy az adathalmaz növekszik.

Lekérdezés Viselkedése

A felhasználói ügynök egyeztetése normalizált karakterláncokkal szemben történik.

Pontos egyezések előnyben részesülnek; a részleges vagy heurisztikus egyeztetést szándékosan kerülni kell, hogy a viselkedés kiszámítható és könnyen hibakereshető legyen.

Hozzájárulás

Nagyon szívesen vesszük a hozzájárulásokat, és ezek segítenek a projekt általános minőségének és pontosságának javításában.

A hozzájárulás leghatásosabb módja az, ha normalizált felhasználói ügynök-bejegyzéseket adsz hozzá vagy frissítesz a user_agents.json fájlban, a releváns osztályozási adatokkal együtt.

Miután elkészültek a módosítások, kérjük, küldj be egy pull requestet, amely a szükséges adatokat és/vagy kódbeli frissítéseket tartalmazza.

Még a részleges vagy hiányos információ is hasznos és értékes - minden hozzájárulás segít javítani a lefedettséget és a hosszú távú megbízhatóságot.

Kezdés (Gyors Útmutató)

A projekt magja a JSON adatokból álló adatkészlet, amely a data/ könyvtárban található.

Az adatok karbantartása és újrafelhasználása érdekében a repó egy kis, egyszerű Node.js-szkriptgyűjteményt tartalmaz, amely alapvető validációt és exportálási feladatokat lát el.

Gyakran elérhető parancsok:

  • npm run test - Érvényesíti a JSON-adatokat, és ellenőrzi a szerkezeti vagy konzisztencia hibákat.
  • Létrehozza, rendezi és exportálja a normalizált adatokat más programozási nyelvek formátumokba a könnyebb integráció érdekében.

Ezek az eszközök szándékosan minimálisak: az adatpontosságra és a hordozhatóságra koncentrálnak, nem pedig a bonyolult feldolgozásra.

User-Agent Sztringek Nem Megbízhatóak

A User-Agent-sztringekből származó pontos információk alapvetően megbízhatatlanok több okból is:

  • Nincs olyan formális szabvány vagy specifikáció, amely meghatározná a User-Agent-sorok felépítését vagy tartalmát
  • Számos felhasználói ügynök szándékosan hamisít vagy utánoz más felhasználói ügynököket a kompatibilitás és a régi rendszerek miatt

Ennek következtében rendkívül nehéz teljesen pontosan és következetesen meghatározni a felhasználói ügynök adatait.

Ez a könyvtár ezért tekinthető a legjobb erőfeszítéssel készült megoldásnak, és nem garantált vagy hivatalos igazság forrása.

A folyamatos használat és a közösségi hozzájárulások révén a pontosság idővel javulhat.

Verziókezelés & Stabilitás

Az adatkészlet idővel változhat, ahogy a felhasználói ügynökök fejlődnek.

A besorolások nem számítanak breaking changes-nek, még a kisebb verziók között sem.

A fogyasztóknak az eredményeket legjobb erőfeszítésre alapuló utalásoként kell kezelniük, nem szerződéses garanciákként.

Licenc

Ez a projekt és az adatai az Apache License 2.0 (Apache-2.0) alatt érhetők el.

Kereskedelmi felhasználás, módosítás és terjesztés megengedett.

A hozzájárulásokat szívesen fogadjuk és értékeljük.

Védjegy

PageviewsOnline, Two-Dot-Oh, és minden kapcsolódó logó, szolgáltatásnév vagy arculat a Two-Dot-Oh védjegyei.

Ez a projekt nyílt forráskódú; azonban a PageviewsOnline név vagy ehhez kapcsolódó bármilyen márkajelzés használata termékhez, szolgáltatáshoz vagy kínálathoz kapcsolódóan előzetes írásos hozzájárulás nélkül nem megengedett.

Forkok és derivált műveknek más nevet és arculatot kell használniuk, és nem szabad arra utalniuk, hogy a PageviewsOnline vagy a Two-Dot-Oh jóváhagyta őket vagy kapcsolatban áll velük.