Back to Question Center
0

Semalt: Websajts Uncapsible Famużi

1 answers:

Sabiex tinbara d-data li trid manwalment, jeħtieġ li jkollok ħiliet ta 'programmazzjoni eċċellenti. Alternattivament, tista 'tuża firxa ta' għodod ta 'estrazzjoni tad-dejta tal-web li għandhom l-għan li jaqraw, jistrutturaw u jinbara data f'format speċifiku. Madankollu, xi websajts ma jistgħux jitwasslu, li jfisser li jew jużaw metodi ta 'kontra t-tqaxxir jew ibiddlu l-markup tagħhom regolarment. Per eżempju, LinkedIn, Alibaba u Facebook jeħtieġu dettalji tal-login, joffru biex jidħlu CAPTCHA, u jimblukkaw l-indirizzi IP biex jiżguraw il-protezzjoni u l-privatezza tal-utenti tagħhom.

1. Facebook:

Facebook huwa wieħed mill-aktar websajts tan-netwerking soċjali l-aktar famużi li għandu aktar minn 20 miljun utent attiv fid-dinja kollha. Hemm numru kbir ta 'applikazzjonijiet u programmi ta' data dwar il-brix li jimmiraw li jestrattaw informazzjoni individwali minn Facebook. Sfortunatament, ħafna mill-għodda ma jagħtux dejta preċiża u li tinqara. Facebook għamilha diffiċli għal spammers u hackers biex jiġbru informazzjoni dwar l-utenti tiegħu. Jista 'jinkiseb biss bl-għajnuna ta' parser HTML bħal Python, iżda l-biċċa l-kbira tal-webmasters u freelancers lanqas biss jafu l-baŜi ta 'Python. Aktar reċentement, inqabeq Facebook biex tiġi estiża informazzjoni vitali minn dan il-websajt ta 'netwerking soċjali. Bil-barraxa Facebook, tista 'biss tiġbor ismijiet u indirizzi tal-email tal-utenti ta' Facebook. Imma jekk trid tiġbor dejta fil-fond, ma tistax tuża din l-għodda jew xi barra oħra simili.

2. LinkedIn:

LinkedIn huwa sit ieħor ta 'netwerking soċjali li huwa impossibbli li jinbarax. Madankollu, tista 'estratt parzjalment data minn ftit paġni tal-web, iżda ħafna mill-informazzjoni mhijiex aċċessibbli. Tista 'biss taqbad informazzjoni minn profil pubbliku ta' LinkedIn bl-użu ta 'Importazzjoni. Io jew Kimono Labs. Il-kummerċjanti ma jistgħux jieħdu vantaġġ mis-servizzi tal-brix minħabba l-miżuri sodi ta 'sigurtà ta' LinkedIn. Madankollu, bdew jużaw Extractor taċ-Ċomb, li jgħin biex jinbarax profili pubbliċi. Din l-għodda tista 'tinbara links tal-profil, ismijiet, u indirizzi tal-email biss. Imma jekk tixtieq tikseb ID Skype, Yahoo Messenger ID, indirizz komplut, u Twitter ID ta 'utent, LinkedIn mhux ser tavżak tagħmel dan.

3. Alibaba:

Alibaba huwa konglomerat teknoloġiku li jipprovdi servizzi minn negozju għal konsumatur online. Sfortunatament, m'hemm l-ebda mod biex tinbara data minn dan il-websajt. B'differenza mill-Amazon u l-eBay, Alibaba għamilha diffiċli għall-utenti tagħha li jneħħu informazzjoni dwar il-prodotti, l-immaġini, id-deskrizzjonijiet u l-prezzijiet tagħha. Fl-2015, numru ta 'għodda li jistgħu jinbaraw id-dejta minn Alibaba b'faċilità ġew introdotti għall-pubbliku. Ħafna mill-għodod jitħallsu u ma joħorġux l-aspettattivi tal-istartup. Alibaba topera firxa estensiva ta 'negozji mad-dinja kollha u torbot ix-xerrejja mal-fornituri. Sadanittant, jiżgura l-privatezza tagħhom u ma jħalli ħadd jinbarax id-data. Minn Ottubru tal-2017, Alibaba għandha aktar minn 500 miljun utent attiv ta 'kull xahar tul il-pjattaforma tagħha. Alibaba saħansitra qabeż l-atturi ewlenin tas-sħab bħal Amazon, Google u Microsoft fit-tkabbir tad-dħul fil-sħab. Huwa implimenta l-aħjar strateġiji biex jiżgura l-privatezza tal-fornituri tiegħu u jimblokka l-indirizzi IP suspettużi f'sekondi Source .

December 22, 2017