Kontrollera annonser automatiskt med beautifulsoup4
Hej!
Jag försöker mig på webscraping, mest för det är kul. Så jag tänkte att jag skulle bygga ett skript som kollar sweclockers var 5 minut efter annonser på datorer.
Mitt problem just nu är att jag inte lyckas förstå vad det är jag ska skicka till sweclockers.
Från Firefox developer tools så ser jag att när jag gör en POST genom att trycka "sök i marknaden", så skickas följande:
-------------------------------------------------------------------------------
POST /marknad/sok HTTP/1.1
Host: www.sweclockers.com
User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:61.0) Gecko/20100101 Firefox/61.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-US,en;q=0.5
Accept-Encoding: gzip, deflate, br
Referer: https://www.sweclockers.com/marknad
Content-Type: application/x-www-form-urlencoded
Content-Length: 104
Cookie: __couid=4f456a3d-7254-49eb-9697-396bdd44d3c3; __codnp=
DNT: 1
Connection: keep-alive
Upgrade-Insecure-Requests: 1
query
catid=1
locid=0
action=doSearch
typeid[]=1
typeid[]=2
typeid[]=3
typeid[]=4
csrf
-------------------------------------------------------------------------------
Det är sedan en 302 som skickas så man får begära den nya sidan med en GET.
Så jag provade att skicka detta genom postman men får då endast tillbaka ursprungssidan utan sorterat resultat. Detta nedan är headern jag får, vilket inte har något redirect.
-------------------------------------------------------------------------------
Accept-Ranges →bytes
Age →0
Cache-Control →max-age=300, no-store, must-revalidate
Connection →keep-alive
Content-Encoding →gzip
Content-Length →17406
Content-Type →text/html; charset=UTF-8
Date →Thu, 19 Jul 2018 20:42:35 GMT
Expires →Thu, 19 Jul 2018 22:47:35 +0200
Pragma →Cache
Server →Apache
Vary →Accept-Encoding,X-Session
Via →1.1 varnish-v4
X-Cache →MISS
X-Srv →1
X-Varnish →200074202
-------------------------------------------------------------------------------
Varför då?
Har någon av er gjort detta eller kan ge mig ett tips?